Devin 是 SWE-Bench 编码基准上最先进的新人工智能工程师,已成功通过领先人工智能公司的实际工程面试,甚至在 Upwork 上完成了实际工作。Devin 是一个自主代理,通过使用自己的 shell、代码编辑器和 Web 浏览器来解决工程任务。
Cognition AI官网:https://www.cognition-labs.com/
在 SWE-Bench 基准测试(要求人工智能解决现实世界开源项目中发现的 GitHub 问题)上进行评估时,Devin 在没有协助的情况下正确解决了 13.86% 的问题,远远超过了之前最先进的模型性能1.96% 的人未获得协助,4.80% 的人接受协助。
这个视频讲述了 Cognition AI 公司的首位人工智能软件工程师 Devin 的故事。视频中提到了关于软件工程未来的讨论和 AI 技术对软件工程行业的影响。评论区中也出现了观众们对人工智能对软件工程行业的看法和预测,包括 AI 可能取代软件工程师的想法以及对未来工作市场的影响。视频还展示了人工智能在软件开发领域的进步和潜力,以及人类工程师可能面临的挑战和机遇。通过这个视频,观众可以了解到人工智能在软件工程领域的发展趋势,帮助他们更好地了解未来工作市场的变化和趋势,从而更好地规划自己的职业发展方向。