华中科技大学与金山软件发布开源AI模型Monkey，号称在识别图像反馈功能超越GPT-4V

+AI动态 AIGC 网站公告
23年12月15日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

华中科技大学与金山软件发布开源AI模型Monkey，号称在识别图像反馈功能超越GPT-4V Monkey 带来了一种高效的训练方法，可以有效地将输入分辨率容量提高到 896 x 1344 像素，而无需从一开始就进行预训练。为了弥合简单文本标签和高输入分辨率之间的差距，研究团队提出了一种多级描述生成方法，该方法自动提供丰富的信息，可以指导模型学习场景和对象之间的上下文关联。通过这两种设计的协同作用，该模型在多个基准测试中取得了优异的结果。通过将该AI模型与各种 LMM（包括 GPT4V）进行比较，Monkey模型通过关注文本信息并捕获图像中的精细细节，在图像字幕方面表现出了良好的性能；其改进的输入分辨率还可以在具有密集文本的文档图像中实现出色的性能。

华中科技大学与金山软件发布开源AI模型Monkey，号称在识别图像反馈功能超越GPT-4V

用户能快速且易于使用。只需从桌面或手机上传图像，或直接捕获图像即可。截至2023年11月14日前，该团队观察到对于一些随机图片Monkey可以取得比GPT-4V更准确的结果。

Monkey项目链接：
https://github.com/Yuliang-Liu/Monkey

AI模型 AI识别 GPT-4V Monkey 华中科技大学捕获图像金山软件

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

ComfyUI新的好用插件！workspace-manager可以让工作流程集中在ComfyUI界面上
23年12月8日
TOP2

Motif模型：利用LLM反馈的强化学习，助力AI代理迅速适应新环境
23年11月13日
TOP3

天下武功，唯快不破！最快的AI生图工具StreamDiffusion开源啦，每秒生成过百张AI图
23年12月23日
【王-寳寳】最新最仔细IC-Light官方案例说明：ComfyUI+ICLight如何实现动态光源？
5月17日
【指鹿AI】在ComfyUI上用AnimateDiff：新手必看！AI动画基础工作流全面+详细+喂饭级讲解教程！看必会教学系列！
2月26日
【审美提升】瑞典概念设计艺术家 Simon Fetscher 西蒙·费切尔，看看你认得几个游戏
4月3日
腾讯在GDC 2024展示GiiNEX AI游戏引擎现已投入《元梦之星》中开发使用，展示强大AIGC能力
3月22日
FlowMind：使用 LLMs 自动生成工作流程
4月23日
Midjourney子项目，二次元AI绘画专属：Niji·journey，超详细保姆级教程~~
3月7日
ToonCrafter本地部署安装教程：一键使用“ToonCrafter卡通工匠”为任何图像制作动画！
6月6日
喜好儿AI周报Weekly（第7期）Midjourney再更新，nijiV6不远 | Pikaso | PASD | AVSE | Danswer | SCEdit | ComfyUI社区 | MotionCtrl | PixVerse | Eko
23年12月31日
【惡棍Borges】7分钟完全掌握IP-Adapter：AI绘图stable diffusion ControlNet完全指南
4月6日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
扫码加入交流群
公众号客服

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部