全部标签

输出

【AI论文与新生技术】LLaVA-3D：理解图像视频信息输出回答问题

想象一下，你有一个AI助手，它可以看图片，还能理解图片里的东西在哪里，离你多远。这就是LLaVA-3D做的事情，不过它是用在电脑里的。它可以让电脑通过看图片来理解3D空间，就像你用眼睛看世界一样。这可以让电脑做很多事情，比如回答关于图片的问题，或者告诉你图片里的某个东西在哪里。这对于制造能和我们一样看世界的机器人，或者制作更真实的视频游戏，都非常有用。大型多模态模型 (LMM) 的最新进展极大地…
AIGC
- 336
- 0
HeeHel10月3日
【AI论文与新生技术】InternLM-XComposer-2.5：支持长上下文输入和输出的多功能大视觉语言模型

我们介绍了 InternLM-XComposer-2.5（IXC-2.5），这是一种多功能的大视觉语言模型，支持长上下文输入和输出。IXC-2.5在各种文本图像理解和合成应用中表现出色，仅需 7B LLM 后端即可实现 GPT-4V 级别的能力。使用 24K 交错图像-文本上下文进行训练，它可以通过 RoPE 外推无缝扩展到 96K 长上下文。这种长上下文功能使 IXC-2.5能够在需要大量输入和…
+AI动态
- 746
- 0
HeeHel7月4日
如何用对Midjourney命令你也可以输出设定形象造型一致的漫画角色

来源：网易UEDC 相关文章：让Dalle3完美保持角色一致性的终极指南 – 真就一模一样啊-喜好儿aigc (heehel.com) 教程专区： https://heehel.com/category/ai-tutorial Midjourney专区： https://heehel.com/topic/midjourney-topic 前言之前的文章已经教会了大家如何成为15分钟快速制作一幅小…
+AI教程
- 785
- 0
HeeHel3月1日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部