我的账户
娄烦信息社

自媒体资讯干货

亲爱的游客,欢迎!

已有账号,请

立即登录

如尚未注册?

加入我们
  • 客服电话
    点击联系客服

    在线时间:8:00-16:00

    客服电话

    400-000-0000

    电子邮件

    xjubao@163.com
  • APP下载

    娄烦信息社APP

    随时随地掌握行业动态

  • 官方微信

    扫描二维码

    关注娄烦信息社公众号

娄烦信息社 网站首页 资讯列表 资讯内容

谷歌推出ASPIRE框架 让大模型具备自我判断意识

2024-02-07 发布于 娄烦信息社
最近推出了一项名为ASPIRE的自适应评估框架,旨在帮助大型语言模型在面对置信度较低的样本时做出正确的判断。这个框架的核心技术思路是基于自我评估的选择性预测,通过任务定向微调、答案采样和自我评估学习三大模块来实现。

白沟河加工网 白沟河网放加工 白沟河网接加工 白沟河网放加工 上海画册印刷

具体来说,任务定向微调能够通过使用目标任务的训练数据对模型进行微调,提高其在特定任务上的性能。答案采样则可以生成多个候选答案,并评估其概率分布,以帮助模型判断答案的可靠性。自我评估学习则通过学习自我评估能力,让模型能够更好地区分正确和错误答案,从而提高选择性预测性能。

实验数据显示,ASPIRE在不同数据集上均表现出了良好的性能。例如,在CoQA数据集上,ASPIRE框架将答案的准确性提升了,并且能够减少错误答案的生成;在TriviaQA数据集上,通过设置选择性分数阈值,ASPIRE能够更准确地判断出哪些问题的答案不可靠,从而避免生成错误答案;在Natural Questions数据集上,ASPIRE成功降低了错误答案的比例,提高了答案的质量。这些实验证明了ASPIRE框架的高效性和可行性,为大型语言模型的应用提供了重要的支持和保障。

ASPIRE框架的推出填补了大型语言模型在置信度校准方面的空白,为其在实际应用中的稳定性和准确性提供了有力保障。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。
1

鲜花
1

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

相关阅读

  • 娄烦信息社
    1970-01-01
  • 娄烦信息社
    1970-01-01
  • 娄烦信息社
    1970-01-01
  • 娄烦信息社
    1970-01-01
  • 娄烦信息社
    1970-01-01
  • 娄烦信息社
    1970-01-01
娄烦信息社

扫一扫二维码关注我们Get最新资讯

相关分类
热点推荐
关注我们
娄烦信息社与您同行

客服电话:400-000-0000

客服邮箱:xjubao@163.com

周一至周五 9:00-18:00

娄烦信息社 版权所有

Powered by 娄烦信息社 X1.0@ 2015-2020