Anthropic Claude 3家族功能官网演示：一个合集告诉你Claude 3的全新升级

Anthropic宣布推出 Claude 3 模型系列，它为广泛的认知任务树立了新的行业基准。该系列包括三种最先进的型号（按功能升序排列）：Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续型号都提供越来越强大的性能，允许用户为其特定应用选择智能、速度和成本的最佳平衡。Opus 和 Sonnet 现已可在 claude.ai 中使用，而 Claude API 现已在 159 个国家/地区普遍可用。俳句即将推出。

Claude官网链接：https://www.anthropic.com/claude

官方介绍：https://www.anthropic.com/news/claude-3-family

Opus 是Anthropic最智能的模型，在人工智能系统的大多数常见评估基准上都优于同行，包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它在复杂任务上表现出接近人类水平的理解力和流畅性，引领通用智能的前沿。

Claude 3 Sonnet则是一个强大的语音模型，支持多语言学习，识别错误的单词和文字，根据上下文句意自动理解你想表达的意思。

Claude 3 系列型号在发布时最初将提供 200K 上下文窗口。然而，所有三种模型都能够接受超过 100 万个代币的输入，他们可能会将其提供给需要增强处理能力的精选客户。

工具箱：
https://heehel.com/ai-tools#ai-3d

AIGC专区：
https://heehel.com/category/aigc

为了有效地处理长上下文提示，模型需要强大的回忆能力。 “大海捞针”（NIAH）评估衡量模型从大量数据中准确回忆信息的能力。Anthropic通过在每个提示中使用 30 个随机针/问题对之一并在不同的众包文档库上进行测试，增强了该基准的稳健性。 Claude 3 Opus 不仅实现了近乎完美的召回率，超过 99% 的准确率，而且在某些情况下，它甚至通过识别“针”这句话似乎是人类人为插入到原文中来识别评估本身的局限性。

虽然与之前的模型相比，Claude 3 模型系列在生物知识、网络相关知识和自主性的关键指标方面取得了进步，但根据我们的负责任的扩展政策，它仍处于 AI 安全级别 2 (ASL-2)。Anthropic的红队评估（根据他们的白宫承诺和 2023 年美国行政命令进行）得出的结论是，这些模型目前带来灾难性风险的可能性可以忽略不计。他们将继续仔细监控未来的模型，以评估它们是否接近 ASL-3 阈值。 Claude 3 模型卡中提供了更多安全详细信息。

Claude 3 模型更擅长遵循复杂的多步骤指令。他们特别擅长遵守品牌声音和响应准则，并开发用户可以信赖的面向客户的体验。此外，Claude 3 模型更擅长以 JSON 等格式生成流行的结构化输出，从而更轻松地指导 Claude 进行自然语言分类和情感分析等用例。