Mistral 发布 Codestral，它的第一个代码生成人工智能模型，精通 80 多种编程语言

Mistral 是一家由微软支持、估值 60 亿美元的法国人工智能初创公司，它发布了第一个用于编码的生成式人工智能模型，名为 Codestral。

与其他代码生成模型一样，Codestral 旨在帮助开发人员编写代码并与代码交互。 Mistral 在博客文章中解释说，它接受了 80 多种编程语言的培训，包括 Python、Java、C++ 和 JavaScript。 Codestral 可以完成编码功能、编写测试和“填写”部分代码，以及用英语回答有关代码库的问题。

Mistral官网链接：https://mistral.ai/

官方介绍：https://mistral.ai/news/codestral/

更多消息：
https://heehel.com/category/ai-news

米斯特拉尔将该模型描述为“开放”，但这还有待商榷。该初创公司的许可证禁止将 Codestral 及其输出用于任何商业活动。虽然有“开发”的条款，但即便如此，也有一些警告：该许可证还明确禁止“员工在公司业务活动中进行任何内部使用”。

原因可能是 Codestral 接受了部分有关版权内容的培训。米斯特拉尔在博文中没有证实或否认这一点，但这并不奇怪。有证据表明该初创公司之前的训练数据集包含受版权保护的数据。

Mistral 发布 Codestral，它的第一个代码生成人工智能模型，精通 80 多种编程语言

无论如何，Codestral 可能不值得这么麻烦。该模型有 220 亿个参数，需要强大的 PC 才能运行。（参数本质上定义了人工智能模型解决问题的技能，例如分析和生成文本。）虽然它根据一些基准测试击败了竞争对手（据我们所知，这些基准测试是不可靠的），但它很难说是井喷。

虽然对于大多数开发人员来说不切实际，并且在性能改进方面是增量的，但 Codestral 肯定会引发关于依赖代码生成模型作为编程助手是否明智的争论。

开发人员肯定会在至少某些编码任务中使用生成式人工智能工具。在 2023 年 6 月的 Stack Overflow 民意调查中，44% 的开发者表示他们现在在开发过程中使用人工智能工具，而 26% 的开发者计划很快使用。然而这些工具有明显的缺陷。

GitClear 对过去几年提交给项目存储库的超过 1.5 亿行代码进行分析发现，生成式 AI 开发工具导致更多错误代码被推送到代码库。在其他地方，安全研究人员警告说，此类工具可能会放大软件项目中现有的错误和安全问题；根据普渡大学的一项研究，OpenAI 的 ChatGPT 对编程问题给出的答案中有一半以上是错误的。

这并不能阻止 Mistral 等公司尝试将其模型货币化（并获得关注度）。今天早上，Mistral 在其 Le Chat 对话式人工智能平台及其付费 API 上推出了 Codestral 的托管版本。 Mistral 表示，它还致力于将 Codestral 构建到 LlamaIndex、LangChain、Continue.dev 和 Tabnine 等应用程序框架和开发环境中。