Anthropic Claude 3家族功能官网演示:一个合集告诉你Claude 3的全新升级

Anthropic宣布推出 Claude 3 模型系列,它为广泛的认知任务树立了新的行业基准。该系列包括三种最先进的型号(按功能升序排列):Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续型号都提供越来越强大的性能,允许用户为其特定应用选择智能、速度和成本的最佳平衡。Opus 和 Sonnet 现已可在 claude.ai 中使用,而 Claude API 现已在 159 个国家/地区普遍可用。俳句即将推出。

Claude官网链接:https://www.anthropic.com/claude

官方介绍:https://www.anthropic.com/news/claude-3-family

Opus 是Anthropic最智能的模型,在人工智能系统的大多数常见评估基准上都优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它在复杂任务上表现出接近人类水平的理解力和流畅性,引领通用智能的前沿。

Claude 3 Sonnet则是一个强大的语音模型,支持多语言学习,识别错误的单词和文字,根据上下文句意自动理解你想表达的意思。

Claude 3 系列型号在发布时最初将提供 200K 上下文窗口。然而,所有三种模型都能够接受超过 100 万个代币的输入,他们可能会将其提供给需要增强处理能力的精选客户。

工具箱:
https://heehel.com/ai-tools#ai-3d

AIGC专区:
https://heehel.com/category/aigc

为了有效地处理长上下文提示,模型需要强大的回忆能力。 “大海捞针”(NIAH)评估衡量模型从大量数据中准确回忆信息的能力。Anthropic通过在每个提示中使用 30 个随机针/问题对之一并在不同的众包文档库上进行测试,增强了该基准的稳健性。 Claude 3 Opus 不仅实现了近乎完美的召回率,超过 99% 的准确率,而且在某些情况下,它甚至通过识别“针”这句话似乎是人类人为插入到原文中来识别评估本身的局限性。

虽然与之前的模型相比,Claude 3 模型系列在生物知识、网络相关知识和自主性的关键指标方面取得了进步,但根据我们的负责任的扩展政策,它仍处于 AI 安全级别 2 (ASL-2)。Anthropic的红队评估(根据他们的白宫承诺和 2023 年美国行政命令进行)得出的结论是,这些模型目前带来灾难性风险的可能性可以忽略不计。他们将继续仔细监控未来的模型,以评估它们是否接近 ASL-3 阈值。 Claude 3 模型卡中提供了更多安全详细信息。

Claude 3 模型更擅长遵循复杂的多步骤指令。他们特别擅长遵守品牌声音和响应准则,并开发用户可以信赖的面向客户的体验。此外,Claude 3 模型更擅长以 JSON 等格式生成流行的结构化输出,从而更轻松地指导 Claude 进行自然语言分类和情感分析等用例。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索