-
Groma格罗马:用于奠定多模态大型语言模型的本地化视觉标记化
Groma,一种多模态大语言模型(MLLM),具有扎实的细粒度视觉感知能力。除了整体图像理解之外,Groma 还擅长区域级任务,例如区域字幕和视觉基础。 项目页面:https://groma-mllm.github.io/ AIGC专区: https://heehel.com/category/aigc 更多消息: https://heehel.com/category/ai-news 此类功能建…- 368
- 0
❯
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
联系客服
公众号
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!