Meta发布Llama 3.2新型AI模型，与OpenAI 4o mini决一高下

AI+文本/音频生成 AIGC
来源：喜好儿网
9月26日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini

Meta公司最近发布了一款名为Llama 3.2的新型AI模型，标志着在人工智能领域迈出了重要一步。Llama 3.2以其开源和可定制的特性，为开发者提供了强大的工具，以实现边缘人工智能和视觉技术的革新。

(Meta Llama 3.2新型AI模型官方详细介绍👇）

Meta Llama 3.2新型AI模型官方详细介绍：
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/

工具箱：https://heehel.com/category/ai-soft

喜好儿网百科全书：
https://heehel.com/document

Llama 3.2模型系列包括多种规模的模型，从1B纯文本到90B多模态，以满足不同应用场景的需求。这些模型不仅功能强大，而且适用范围广泛，无论是在移动设备还是边缘设备上，都能发挥出色的性能。

Llama 3.2的90B视觉模型是Meta目前最先进的模型，适合企业级应用，擅长处理常识、长文本生成、多语言翻译以及高级推理等任务。它还具备图像推理功能，能够完成复杂的图像理解和视觉推理工作。此外，11B视觉模型同样适合需要视觉推理的企业应用，并且在文本摘要、情感分析、代码生成等方面表现出色。

Meta发布Llama 3.2新型AI模型，与OpenAI 4o mini决一高下

对于那些对延迟和计算资源有限制的应用，3B和1B文本输入模型是理想的选择。3B模型擅长文本摘要、分类和语言翻译，而1B模型则适合边缘设备和移动应用程序的检索和摘要任务。

特别值得一提的是，Llama 3.2的1B和3B模型支持128K标记的上下文长度，这在摘要、指令跟踪和重写任务等边缘设备用例中处于领先地位。这些模型从一开始就支持高通和联发科硬件，并针对Arm处理器进行了优化。

Llama 3.2的11B和90B视觉模型在图像理解任务上的表现甚至超过了一些闭源模型，如Claude 3 Haiku。与其他开源多模态模型不同，Llama 3.2的预训练模型和对齐模型都可以使用torchtune进行微调，并使用torchchat进行本地部署，为开发者提供了极大的灵活性。

Meta还计划分享首批Llama Stack官方发行版，这将进一步简化开发人员在不同环境下使用Llama模型的方式，无论是单节点、内部部署、云还是设备。此外，Meta与AWS、Databricks、Dell Technologies、Fireworks、Infosys和Together AI等合作伙伴的紧密合作，将为他们的下游企业客户构建Llama Stack发行版。