网友锐评——谷歌这个老东西想用新发的双子星 Gemini Ultra 的虚空数据来耍我们？

HeeHel喜好儿官方小编

https://heehel.com/aigc/google-bard-gemini.html

网友Igor Pogany在查看谷歌新发布的双子星模型数据时，发现谷歌露出了小鸡脚，他发现，"Gemini Ultra的90.0%在MMLU上的分数是他们最引以为豪的基准。相较之下，GPT-4只获得了86.4%的分数，甚至低于人类测试结果的89.8%。然而，问题出在比较模型时使用了不同的提示技术。简单来说，谷歌在对比自家和GPT的数据时，双子星的测试方法比GPT的更加有利，谷歌使用了对GPT更加不利的测试方法。

Gemini采用了思想链（CoT）提示，总计32条，以确保取得最佳结果。与此相反，Google选择使用5次提示方法对GPT-4进行评估。尽管多重提示是一种可靠的技术，但远远不及CoT提示的有效性。

Igor Pogany还说，扭曲统计数据，以欺骗普通消费者购买产品，是一种不道德的策略。对Gemini Ultra而言，这并不是一个良好的兆头。这引发了对产品真实性和比较公平性的质疑。"这下谷歌怕是要被骂惨咯。

网友锐评——谷歌这个老东西想用新发的双子星 Gemini Ultra 的虚空数据来耍我们？

https://heehel.com/ai-news/ziplora.html

aigc ai技术 AI模型 CoT Gemini Ultra GPT-4 gpt4 MMLU 思想链数据对比不公平模型数据测试方法谷歌双子星Gemini

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

AI漫画教程【进阶深入】Dashtoon漫画中框架的使用技巧-第6讲
3月7日
TOP2

【刘悦的技术博客】GPT-SoVITS整合包0319更新：长文本复读漏读问题,定制抽卡,变声器
3月20日
TOP3

TextureDreamer：将纹理从几个图像传输到任意 3D 模型，3D 贴图轻松搞定
5月25日
AnimateDiff入门到没门第五集：8G就能跑！最简单视频转绘手把手教学【阿米粒包子】
2月26日
【是真的想教你AiGC】价值2W的Stable Diffusion全套AI动画系统课教程！保姆级AI绘画不闪超稳定动画教程系列
3月2日
Comfyui系列视频第17期：所有controlnet预处理器讲解之姿态与面部/线条涂鸦/颜色风格转绘/法向与深度预处理器详细解读！【QinNarT小钱】
23年12月19日
【免费下载】AI工具Chat2DB：AI赋能的数据分析探索与决策支持自然语言查询平台
4月30日
腾讯再现“拿来主义”发布创新项目AniPortrait：让照片能唱歌说话，技术领先阿里EMO开源
3月28日
【AI论文与新生技术】DiMR新型图像生成模型：通过多分辨率扩散模型减轻图像生成中的失真
6月15日
【咕咕不咕不咕不咕】怎么用ChatGPT+WPSAI，三分钟做完PPT，新手初学者详细步骤演示教程
4月1日
【Nenly同学】AI视频时代的“开源先驱”Sora来之前：你可以先掌握这些——Stable Diffusion配合AnimateDiff动画插件全方位教学
3月2日
【巨妮Junie】为什么国际AI电影节被誉为“含金量最高的AI奥斯卡”？
5月9日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部