OpenAI ChatGPT o1终于问世了,OpenAI o1号称迄今为止最强大、最一致的一系列模型

OpenAI o1-预览版简介

用于解决难题的一系列新推理模型。 9.12 起发售

OpenAI开发了一系列新的人工智能模型,旨在在做出反应之前花更多时间思考。他们可以通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题。

今天,OpenAI在 ChatGPT 和他们的 API 中发布了本系列的第一个。这是预览版,OpenAI期望定期更新和改进。除了此版本之外,我们还包括

目前正在开发中的下一次更新的评估。

OpenAI o1(这个应该就是Strawberry) 是一系列新型推理模型,旨在解决复杂问题。与之前的模型相比,o1 系列在回应之前会花更多时间进行思考,从而能够更有效地推理并处理科学、编码和数学等领域的难题。

(OpenAI  o1官方介绍链接👇)

工具箱:https://heehel.com/category/ai-soft

OpenAI o1功能与特点

  1. ** 增强的推理能力 **:o1 模型经过训练,能够更深入地思考问题,学习优化其思维过程,尝试不同的策略并识别错误。
  2. ** 优越的表现 **:在物理、化学和生物学等复杂基准任务中,o1 的表现与博士生相当。在国际数学奥林匹克资格考试中,
  3. o1 的得分达到 83%,而之前的模型仅为 13%。在编码能力方面,它在 Codeforces 竞赛中达到了 89 个百分位。
  4. ** 安全性 **:新模型采用了改进的安全培训方法,能够更好地遵循安全和对齐准则,针对用户尝试绕过安全规则的情况进行测试,表现显著优于之前的模型。

OpenAI o1应用领域

OpenAI o1 特别适用于需要解决复杂问题的领域,例如:

  1. ** 科学研究 **:例如医疗保健研究人员可以用其注释细胞测序数据。
  2. ** 物理学 **:可以帮助生成量子光学所需的复杂数学公式。
  3. ** 软件开发 **:开发人员可以使用 o1 模型来构建和执行多步骤工作流程,尤其是在需要生成和调试复杂代码的情况下。

怎么运行的

OpenAI训练这些模型在做出反应之前花更多时间思考问题,就像人类一样。通过培训,他们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。

在OpenAI的测试中,下一个模型更新在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。OpenAI还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而推理模型的得分为 83%。他们的编码能力在竞赛中得到评估,并在 Codeforces 竞赛中达到了第 89 个百分点。您可以在OpenAI的技术研究文章中阅读更多相关内容。

作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。

但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将该系列命名为 OpenAI o1。

OpenAI ChatGPT o1终于问世了,OpenAI o1号称迄今为止最强大、最一致的一系列模型

安全

作为开发这些新模型的一部分,OpenAI提出了一种新的安全培训方法,利用他们的推理能力,使他们遵守安全和对齐准则。通过能够在上下文中推理OpenAI的安全规则,它可以更有效地应用它们。

OpenAI衡量安全性的一种方法是测试OpenAI的模型在用户试图绕过安全规则(称为“越狱”)时继续遵循其安全规则的情况。在OpenAI最难的越狱测试之一中,GPT-4o 得分为 22(评分范围为 0-100),而OpenAI的 o1-preview 模型得分为 84。您可以在系统卡和OpenAI的研究文章中阅读有关此内容的更多信息。

为了匹配这些模型的新功能,OpenAI加强了安全工作、内部治理和联邦政府合作。这包括使用OpenAI的准备框架、一流的红队和董事会级审查流程(包括OpenAI的安全与安保委员会)进行严格的测试和评估。

为了推进OpenAI对人工智能安全的承诺,OpenAI最近与美国和英国人工智能安全研究所正式签署了协议。OpenAI已经开始实施这些协议,包括允许这些机构尽早使用该模型的研究版本。这是OpenAI合作伙伴关系中重要的第一步,有助于在公开发布之前和之后建立未来模型的研究、评估和测试流程。

这是给谁的

如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。

o1 系列擅长准确生成和调试复杂代码。为了为开发人员提供更高效的解决方案,我们还发布了OpenAI o1-mini ,这是一种更快、更便宜的推理模型,在编码方面特别有效。作为较小的模型,o1-mini 比 o1-preview 便宜 80%,这使其成为需要推理但不需要广泛的世界知识的应用程序的强大且经济高效的模型。

OpenAI o1

从今天开始,ChatGPT Plus 和 Team用户将能够访问 ChatGPT 中的 o1 模型。 o1-preview 和 o1-mini 都可以在模型选择器中手动选择,在发布时,o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条。OpenAI正在努力提高这些速率,并使 ChatGPT 能够针对给定的提示自动选择正确的模型。

ChatGPT Enterprise 和 Edu 用户将从下周开始访问这两种模型。

符合API 使用第 5 层(在新窗口中打开)资格的开发人员今天可以开始使用 API 中的两种模型进行原型设计,速率限制为 20 RPM。经过额外测试后,OpenAI正在努力提高这些限制。这些模型的 API 目前不包括函数调用、流式传输、对系统消息的支持和其他功能。要开始使用,请查看API 文档(在新窗口中打开) 。

OpenAI还计划为所有ChatGPT免费用户提供 o1-mini 访问权限。

接下来是什么

这是 ChatGPT 和 API 中这些推理模型的早期预览。除了模型更新之外,OpenAI希望添加浏览、文件和图像上传等功能,让它们对大家更有用。

除了新的 OpenAI o1 系列之外,OpenAI还计划继续开发和发布 GPT 系列中的模型。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索