Reka Core、Flash 和 Edge：对文本、图像、视频和音频输入进行处理和推理-喜好儿网

Reka Core、Flash 和 Edge，这是 Reka 从头开始训练的一系列强大的多模态语言模型。 Reka 模型能够对文本、图像、视频和音频输入进行处理和推理。该技术报告讨论了其中一些模型的训练细节，并提供了综合评估结果。

Reka分析处理视频功能演示:

Reka在线体验：http://chat.reka.ai

Reka详细介绍：http://showcase.reka.ai

更多消息：
https://heehel.com/category/ai-news

研究人员证明 Reka Edge 和 Reka Flash 不仅是最先进的，而且还优于许多更大的模型，为各自的计算类别提供了巨大的价值。与此同时，他们最强大、最大的模型 Reka Core 在自动评估和盲人评估方面都接近最佳前沿模型。在图像问答基准（例如 MMMU、VQAv2）上，Core 的表现与 GPT4-V 相当。

同时，在多模态聊天中，Core 在第三方盲人评估设置下排名第二，优于 Claude 3 Opus 等其他模型。在文本基准测试中，Core 不仅在一组完善的基准测试（例如 MMLU、GSM8K）上与其他前沿模型相比具有竞争力，而且在人类评估方面也优于 GPT4-0613。在视频问答（感知测试）方面，Core 优于 Gemini Ultra。

Reka Core、Flash 和 Edge：对文本、图像、视频和音频输入进行处理和推理

相关推荐

【央视网】绝了！AI视角下的神州大地每一帧都是屏保

热门专题

快讯

热门文章

喜好儿——再不认真就输了！

致力于发现ai人工智能应用的新世界，长期更新目前热门AI教程与动态！期待在这个工业变革时代中，希望你我都能发出一点光。

切换注册登录

切换登录注册