【AI论文与新生技术】自回归模型击败扩散：用于可扩展图像生成的 Llama

+AI动态 AI+图片生成 AIGC
来源：喜好儿
6月11日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

我们介绍了 LlamaGen，这是一个新的图像生成模型系列，它将大型语言模型的原始“下一个标记预测”范式应用于视觉生成领域。对于视觉信号上没有归纳偏差的普通自回归模型（例如 Llama）是否可以在适当缩放的情况下实现最先进的图像生成性能，这是一个肯定的答案。

【AI论文与新生技术】自回归模型击败扩散：用于可扩展图像生成的 Llama

我们重新检查图像标记器的设计空间、图像生成模型的可扩展性属性及其训练数据质量。

这一探索的成果包括：

图像标记器，在 ImageNet 基准上下采样率为 16，重建质量为 0.94 rFID，码本使用率为 97%。
一系列从111M到3.1B参数的类条件图像生成模型，在ImageNet 256x256基准上实现2.18 FID，优于LDM、DiT等流行的扩散模型。
具有 775M 参数的文本条件图像生成模型，来自 LAION-COCO 和高美学质量图像的两阶段训练，展示了视觉质量和文本对齐的竞争性能。
我们验证了LLM服务框架在优化图像生成模型的推理速度方面的有效性，并实现了326% - 414%的加速。

项目链接：https://github.com/FoundationVision/LlamaGen

论文链接：https://huggingface.co/papers/2406.06525

AIGC专区：
https://heehel.com/category/aigc

LlamaGen模型通过适当扩展，无需对视觉信号进行特定的归纳偏差，就能实现最先进的图像生成性能。

【AI论文与新生技术】自回归模型击败扩散：用于可扩展图像生成的 Llama

研究团队重新审视了图像分词器的设计、图像生成模型的可扩展性以及训练数据质量。他们开发了一种图像分词器，能够在ImageNet基准测试中以16倍的下采样比例达到0.94的rFID重建质量，并高效利用码本。此外，他们还创建了一系列从111M到3.1B参数不等的条件图像生成模型，这些模型在256×256的ImageNet基准测试中实现了2.18的FID，超越了流行的扩散模型如LDM和DiT。

LlamaGen还包括一个基于文本条件的图像生成模型，该模型在经过两阶段训练后，能够在视觉上和文本对齐方面展现出竞争力。此外，研究者们还验证了大型语言模型服务框架（如vLLM）在优化图像生成模型推理速度方面的有效性，实现了326% - 414%的加速。

【AI论文与新生技术】自回归模型击败扩散：用于可扩展图像生成的 Llama

AI论文 Llama 击败可扩展图像生成扩散新生技术自回归模型

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

AI提示词（第71辑）炸裂的美食，快到碗里来
3月29日
TOP2

亚马逊推出人工智能购物助手Rufus移动应用程序APP，帮助客户解答购物问题
2月2日
TOP3

好莱坞CAA 推出新服务“虚拟媒体存储系统”：助力好莱坞明星抵御AI冒充者，保护自己的数字肖像权
5月20日
【泡沫同学啊】推荐10款极具实用性的Lora模型，让你免费畅享AI绘画辅助，轻松获取顶级Lora素材资源！
2月20日
【AI兔扒哥】AI图片画面不好控制，GLIGEN GUI使用教程，分区控制更方便
2月27日
奥特曼反驳马斯克指控：OpenAI否认放弃开源原则背离使命和初心，称已获马斯克同意？
3月7日
【图文教程】5分钟教你怎么创建自定义节点！（ComfyUI自定义节点初学者指南教学）
1月12日
【汗青HQ】音乐视频创作者汗青HQ探索技术与艺术的交汇地带
23年11月23日
AI提示词（第63辑）魔幻？科幻？克苏鲁？赛博朋克？，没有为什么就是喜欢这套图不一样的中国风
2月28日
“人形电视机”幕后制作过程揭秘！先用 ViggleAI 再用 Animatediff 再这样这样就可以了
6月4日
（下）2024年midjourney/MJ目前在设计中真实应用到底如何？一年亲身使用大揭秘！【香克斯卡密】
3月1日
网友分享的换衣ComfyUI工作流程，图案和文字都能被保留
1月5日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
扫码加入交流群
公众号客服

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部