-
LEGO图像定位模型,一个由字节跳动和复旦大学研发的多模态理解AI模型
LEGO能够处理和理解多种类型的输入,支持图像、音频和视频输入,并对这些信息进行分析和理解。模型还具备精准定位的能力。例如在图像中标识出物体的具体位置,在视频中指出特定事件发生的时间点,在音频中识别出特定声音的来源。当然它会不会像谷歌Gemini那样测试前“先开卷考试”就不知道了。。。 项目及演示:https://lzw-lzw.github.io/LEGO.github.io/ 论文:https…- 903
- 0
-
用AI工具KREA实时绘制生成完整好玩的LEGO乐高图片
使用一些实时AI生成工具,体会到其带来的便利,KREA这款工具能帮助用户迅速完成图像任务,节省不少时间和精力。 KREA是一款内置 AI人工智能的设计工具,可以实时生成更精细的图像,通过机器学习算法从大量数据中学习,并提供准确的预测和决策支持。用户只需要在画布上随意的起草稿,它便能实时地根据草稿造型进行联想,同时生成与提示词相应的图像,它的强大之处是可以实时根据用户在修改过程中进行逐张生成,不管是…- 1k
- 0
❯
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
联系客服
公众号
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!