Mistral 发布 Codestral,它的第一个代码生成人工智能模型,精通 80 多种编程语言

Mistral 发布 Codestral,它的第一个代码生成人工智能模型,精通 80 多种编程语言

Mistral 是一家由微软支持、估值 60 亿美元的法国人工智能初创公司,它发布了第一个用于编码的生成式人工智能模型,名为 Codestral。

与其他代码生成模型一样,Codestral 旨在帮助开发人员编写代码并与代码交互。 Mistral 在博客文章中解释说,它接受了 80 多种编程语言的培训,包括 Python、Java、C++ 和 JavaScript。 Codestral 可以完成编码功能、编写测试和“填写”部分代码,以及用英语回答有关代码库的问题。

Mistral官网链接:https://mistral.ai/

官方介绍:https://mistral.ai/news/codestral/

更多消息:
https://heehel.com/category/ai-news

米斯特拉尔将该模型描述为“开放”,但这还有待商榷。该初创公司的许可证禁止将 Codestral 及其输出用于任何商业活动。虽然有“开发”的条款,但即便如此,也有一些警告:该许可证还明确禁止“员工在公司业务活动中进行任何内部使用”。

原因可能是 Codestral 接受了部分有关版权内容的培训。米斯特拉尔在博文中没有证实或否认这一点,但这并不奇怪。有证据表明该初创公司之前的训练数据集包含受版权保护的数据。

Mistral 发布 Codestral,它的第一个代码生成人工智能模型,精通 80 多种编程语言

无论如何,Codestral 可能不值得这么麻烦。该模型有 220 亿个参数,需要强大的 PC 才能运行。 (参数本质上定义了人工智能模型解决问题的技能,例如分析和生成文本。)虽然它根据一些基准测试击败了竞争对手(据我们所知,这些基准测试是不可靠的),但它很难说是井喷。

虽然对于大多数开发人员来说不切实际,并且在性能改进方面是增量的,但 Codestral 肯定会引发关于依赖代码生成模型作为编程助手是否明智的争论。

开发人员肯定会在至少某些编码任务中使用生成式人工智能工具。在 2023 年 6 月的 Stack Overflow 民意调查中,44% 的开发者表示他们现在在开发过程中使用人工智能工具,而 26% 的开发者计划很快使用。然而这些工具有明显的缺陷。

GitClear 对过去几年提交给项目存储库的超过 1.5 亿行代码进行分析发现,生成式 AI 开发工具导致更多错误代码被推送到代码库。在其他地方,安全研究人员警告说,此类工具可能会放大软件项目中现有的错误和安全问题;根据普渡大学的一项研究,OpenAI 的 ChatGPT 对编程问题给出的答案中有一半以上是错误的。

这并不能阻止 Mistral 等公司尝试将其模型货币化(并获得关注度)。今天早上,Mistral 在其 Le Chat 对话式人工智能平台及其付费 API 上推出了 Codestral 的托管版本。 Mistral 表示,它还致力于将 Codestral 构建到 LlamaIndex、LangChain、Continue.dev 和 Tabnine 等应用程序框架和开发环境中。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索