干货分享:最近爆火的MiniCPM-V 2.6模型可以在ComfyUI中使用了,麻雀虽小,但能力爆表,超越GPT-4o mini、GPT-4V【月下Hugo】

喜好儿小斥候消息,MiniCPM-V 2.6模型是面壁智能最新发布的多模态人工智能模型,被称为“小钢炮”,是MiniCPM-V系列中性能最佳的版本。该模型基于SigLip-400M和Qwen2-7B构建,拥有8亿参数(B参数),但在单图、多图和视频理解方面取得了相当于20亿参数以下模型的卓越成绩。

MiniCPM-V 2.6在端侧AI多模态能力上实现了重大突破,首次将实时视频理解、多图联合理解等复杂功能集成到端侧模型中,使其更接近真实世界的多模态信息处理需求。此外,它还具备强大的OCR能力,可以处理各种纵横比和高达180万像素的图像,为OCRBench树立了新标准,优于GPT-4o、GPT-4V和Gemini 1.5 Pro等专有型号。

更多好玩且实用AIGC技术和ComfyUI干货:https://t.zsxq.com/18j0ORxHc

月下Hugo的干货分享杂货铺:
https://heehel.com/collection/topic-hugo-ganhuo

星球号:32767063

(月下Hugo本期资料和往期学习资料下载链接👇)

整理AI学习资料库:https://pan.quark.cn/s/05ad7c581caa

ComfyUI_MiniCPM-V-2_6-int4节点官方仓库地址:https://github.com/IuvenisSapiens/ComfyUI_MiniCPM-V-2_6-int4

MiniCPM-V-2_6模型Huggingface主页:https://huggingface.co/openbmb/MiniCPM-V-2_6/tree/main

MiniCPM-V-2_6-int4模型Huggingface主页:https://huggingface.co/openbmb/MiniCPM-V-2_6-int4

喜欢我的作品或催更的话,记得要一键三连呀,你们的支持就是我创作的动力,up主求求了QAQ

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索