//再不认真就输了!
//致力于发现AIGC动态与教程。

谷歌公布一个可以让 AI 进行自我判断输出内容正确性的模型训练框架 ASPIRE

谷歌开发了一款名为 ASPIRE 的训练框架,旨在增强人工智能(AI)模型的选择性预测能力。这款框架为模型引入了 “可信度” 机制,即模型会输出一系列答案,并为每个答案赋予一个正确概率评分。通过这种方式,ASPIRE 训练框架可以提高大语言模型的输出准确率,并使较小的模型经过微调后能够进行准确且有自信的预测。

ASPIRE详情介绍链接:https://blog.research.google/2024/01/introducing-aspire-for-selective.html
谷歌搜索官网:https://research.google/
更多消息:https://heehel.com/category/ai-news
AI工具专区:https://heehel.com/category/ai-soft

ASPIRE 训练框架主要分为三个阶段:

  1. 首先是“特定任务调整”阶段,该阶段对已经接受过基础训练的大型语言模型进行深入训练,重点加强模型的预测能力。研究人员通过引入一系列可调参数,在特定任务的训练数据集上微调预训练语言模型,从而提高模型的预测性能,使其能够更好地解决特定问题。
  2. 第二阶段是 “答案采样”,在特定微调后,模型可以利用先前学习到的可调参数,为每个训练问题生成不同的答案,并创建用于自我评估学习的数据集,生成一系列可信度较高的答案。研究人员使用集束搜索(Beam Search)方法和 Rouge-L 算法来评估答案的质量,并将生成的答案及评分重新输入给模型,开启第三阶段。
  3. 第三阶段是 “自我评估学习”,研究人员为模型添加一组可调参数,专门用于提升模型的自我评估能力。该阶段的目标是让模型学会自己判断输出的答案准确性,从而在生成答案时附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果,结果显示经过 ASPIRE 调整的小模型表现远超更大的模型。这项实验结果也表明,经过适当调整,即使是较小的语言模型,在某些场景下也能超越大语言模型。

总的来说,ASPIRE 训练框架可以显著提升大语言模型的输出准确率,并使较小的模型经过微调后能够进行准确且有自信的预测。这一框架为 AI 模型引入了可信度机制,使其能够自我判断输出内容的正确性,从而在高风险决策类场合应用更加可靠。

https://heehel.com/ai-tutorial/scenario-tools.html

https://heehel.com/ai-news/poe-50.html

版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《谷歌公布一个可以让 AI 进行自我判断输出内容正确性的模型训练框架 ASPIRE》
文章链接:https://heehel.com/ai-news/google-aspire.html
本站资源仅供个人学习交流,未经许可不得用于商业用途,自行承担法律责任。
如有疑问,请联系微信:heehelcom

评论 抢沙发

喜好儿——再不认真就输了!

致力于发现ai人工智能应用的新世界, 长期更新目前热门AI教程与动态!期待在这个工业变革时代中,希望你我都能发出一点光。

登录

找回密码

注册