Reka Core、Flash 和 Edge,这是 Reka 从头开始训练的一系列强大的多模态语言模型。 Reka 模型能够对文本、图像、视频和音频输入进行处理和推理。该技术报告讨论了其中一些模型的训练细节,并提供了综合评估结果。
Reka分析处理视频功能演示:
Reka在线体验:http://chat.reka.ai
Reka详细介绍:http://showcase.reka.ai
更多消息:
https://heehel.com/category/ai-news
研究人员证明 Reka Edge 和 Reka Flash 不仅是最先进的,而且还优于许多更大的模型,为各自的计算类别提供了巨大的价值。与此同时,他们最强大、最大的模型 Reka Core 在自动评估和盲人评估方面都接近最佳前沿模型。在图像问答基准(例如 MMMU、VQAv2)上,Core 的表现与 GPT4-V 相当。
同时,在多模态聊天中,Core 在第三方盲人评估设置下排名第二,优于 Claude 3 Opus 等其他模型。在文本基准测试中,Core 不仅在一组完善的基准测试(例如 MMLU、GSM8K)上与其他前沿模型相比具有竞争力,而且在人类评估方面也优于 GPT4-0613。在视频问答(感知测试)方面,Core 优于 Gemini Ultra。