在 GitHub Copilot 中探索 OpenAI o1 ChatGPT聊天机器人大语言模型

OpenAI 发布了 OpenAI o1,这是一系列配备先进推理能力来解决难题的全新 AI 模型。和您一样,我们很高兴能够测试新的 o1 模型,并测试了 o1-preview 与 GitHub Copilot 的集成。虽然我们正在使用这种新模型探索许多用例,例如调试大型系统、重构遗留代码和编写测试套件,但我们的初步测试在代码分析和优化方面显示出了有希望的结果。这是因为 o1-preview 能够在响应之前思考挑战,这使得 Copilot 能够将复杂的任务分解为结构化的步骤。

(OpenAI o1官方介绍链接👇)

在本博客中,我们将描述两个场景,展示 Copilot 中新模型的功能以及它如何为您的日常工作。请继续阅读,了解新模型推出时会发生什么、我们测试什么以及我们如何在 GitHub 上进行人工智能驱动的软件开发。

通过OpenAI o1进行高级推理优化复杂算法

在我们的第一个测试中,我们想要了解 o1-preview 如何帮助编写或完善复杂的算法,这项任务需要深入的逻辑推理才能找到更高效或创新的解决方案。开发人员需要了解约束、优化边缘情况并迭代改进算法,同时又不失总体目标。这正是 OpenAI o1-preview 的优势所在。考虑到这一点,我们开发了一种新的代码优化工作流程,该工作流程受益于模型的推理功能。

在此演示中,新的内置优化聊天命令提供了开箱即用的丰富编辑器上下文,例如导入、测试和性能配置文件。我们测试了 OpenAI o1-preview 分析和迭代代码的能力,以便一次性提出更彻底、更高效的优化。

该视频展示了如何优化 Copilot Chat标记器库中使用的字节对编码器的性能(是的,这意味着我们使用 AI 来优化关键的 AI 开发构建块)。

这是 VS Code 团队面临的一个真正问题,因为 Copilot 在组装提示时需要重复标记大量数据。

结果凸显了 o1-preview 的推理能力如何能够更深入地理解代码的约束和边缘情况,从而有助于产生更高效、更高质量的结果。与此同时,GPT-4o 坚持明显的优化,需要开发人员的帮助来引导 Copilot 转向更复杂的方法。

除了处理复杂的代码任务之外,o1-preview 的数学能力也很出色,因为它可以毫不费力地从原始终端输出计算基准结果,然后简洁地总结它们。

在 GitHub 上的下一个演示中,o1-preview 能够在几分钟内识别并开发性能错误的解决方案。我们的一位软件工程师花了几个小时才提出相同的解决方案。当时,我们想在 GitHub.com 的文件视图中添加一个文件夹树,但元素的数量导致我们的焦点管理代码停滞并导致浏览器崩溃。该视频并排显示了使用 GPT-4o 和 o1-preview 尝试解决问题的区别:

由于此代码管理 1,000 个元素,因此很难隔离问题。最终我们进行了一项更改,将该函数的运行时间从超过 1,000 毫秒提高到大约 16 毫秒。如果我们有带有 o1-preview 的 Copilot,我们就可以快速识别问题并更快地修复它。

通过这次实验,我们发现了一个微妙但强大的区别,那就是 o1-preview 的响应是多么深思熟虑和有目的性,使开发人员可以轻松查明问题并快速实施解决方案。使用 GPT-4o,类似的提示可能会产生一堆代码,而不是包含逐行细分的建议的解决方案。

为在 GitHub 上构建的开发人员带来 OpenAI o1-preview 的强大功能

我们不仅很高兴尝试将 o1-preview 集成到 GitHub Copilot 中,而且迫不及待地想看看您能用它构建什么。这就是我们将 o1 系列引入GitHub 模型的原因。今天晚些时候,您将在我们的市场中找到 o1-preview 和 o1-mini,这是一种更小、更快且便宜 80% 的型号,但由于它仍处于预览阶段,您需要注册 Azure AI才能早期访问。

作为 Microsoft 与 OpenAI 合作的一部分,GitHub 能够不断探索如何利用最新的 AI 突破来提高开发人员的工作效率,最重要的是,提高开发人员的幸福感。尽管这些演示展示了 o1-preview 针对两个特定优化问题的增强功能,但我们仍处于实验的早期阶段,很高兴看到它还能做什么。

我们目前正在 Copilot 中探索更多用例(在 IDE、 Copilot Workspace和 GitHub 上),以利用 OpenAI o1-preview 强大的推理功能进一步加速开发人员工作流程。我们今天展示的进步仅仅触及了开发人员使用 GitHub Copilot 中的 o1-preview 构建的表面。随着 o1 和 GPT 系列的预期发展,这仅仅是一个开始。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索