谷歌公布一个可以让 AI 进行自我判断输出内容正确性的模型训练框架 ASPIRE

+AI动态网站公告
1月24日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

谷歌开发了一款名为 ASPIRE 的训练框架，旨在增强人工智能（AI）模型的选择性预测能力。这款框架为模型引入了 “可信度” 机制，即模型会输出一系列答案，并为每个答案赋予一个正确概率评分。通过这种方式，ASPIRE 训练框架可以提高大语言模型的输出准确率，并使较小的模型经过微调后能够进行准确且有自信的预测。

ASPIRE详情介绍链接：https://blog.research.google/2024/01/introducing-aspire-for-selective.html
谷歌搜索官网：https://research.google/
更多消息：https://heehel.com/category/ai-news
AI工具专区：https://heehel.com/category/ai-soft

ASPIRE 训练框架主要分为三个阶段：

首先是“特定任务调整”阶段，该阶段对已经接受过基础训练的大型语言模型进行深入训练，重点加强模型的预测能力。研究人员通过引入一系列可调参数，在特定任务的训练数据集上微调预训练语言模型，从而提高模型的预测性能，使其能够更好地解决特定问题。
第二阶段是 “答案采样”，在特定微调后，模型可以利用先前学习到的可调参数，为每个训练问题生成不同的答案，并创建用于自我评估学习的数据集，生成一系列可信度较高的答案。研究人员使用集束搜索（Beam Search）方法和 Rouge-L 算法来评估答案的质量，并将生成的答案及评分重新输入给模型，开启第三阶段。
第三阶段是 “自我评估学习”，研究人员为模型添加一组可调参数，专门用于提升模型的自我评估能力。该阶段的目标是让模型学会自己判断输出的答案准确性，从而在生成答案时附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果，结果显示经过 ASPIRE 调整的小模型表现远超更大的模型。这项实验结果也表明，经过适当调整，即使是较小的语言模型，在某些场景下也能超越大语言模型。

总的来说，ASPIRE 训练框架可以显著提升大语言模型的输出准确率，并使较小的模型经过微调后能够进行准确且有自信的预测。这一框架为 AI 模型引入了可信度机制，使其能够自我判断输出内容的正确性，从而在高风险决策类场合应用更加可靠。

https://heehel.com/ai-tutorial/scenario-tools.html

https://heehel.com/ai-news/poe-50.html

AI模型 ASPIRE Google 准确率可信度机制大语言模型正确概率评分训练框架谷歌选择性预测能力

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

【生数科技】「Vidu」登场！生数科技联合清华大学公开中国首个长时长、高一致性、高动态性SoRA级视频大模型
4月27日
TOP2

【豚村长】经典电影剪辑镜头衔接转场教科书式经典案例解说
3月28日
TOP3

Perplexity浏览器携手SoundHound AI，为汽车带来全新升级的在线智能语音助手
5月10日
【粉丝作品】首支由AI生成的手机Hi phone发布
1月24日
喜好儿AI周报Weekly（第12期）清华大学脑机接口移植成功 | 文心一言数字分身 | LogoDiffusionV3 | 谷歌文生图 | niji-journeyV6 | ElevenLabsGPTs | Wonder Studio摄像机追踪
2月4日
黑神话悟空-猪八戒Flux-lora模型夸克网盘下载
8月28日
网友教你怎么用ai、irl在自己手臂上画花然后变成绚丽的AI视频动画
4月30日
【硅谷101】连线硅谷大佬——从Sora深度展开，全面解读AI视频大模型发展史
3月15日
【小黑AI绘画】stable diffusion如何提取huggingface模型下载链接
23年12月27日
【AI论文与新生技术】Meta 发布 Meta 3D Gen 文本生成3D模型
7月3日
Xinsir新作ControlNet++：用于图像生成和编辑的一体化的ControlNet
7月9日
作业辅导用清言，父慈子笑没烦恼｜清言AI视频通话【智谱清言】
9月1日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部