科学家发现 AI 正在学习撒谎和欺骗，似乎越来越擅长故意撒谎了

HeeHel喜好儿官方小编

-GPT-4在简单测试场景中表现出99.16%的欺骗行为。

-另一项研究则关注Meta的Cicero模型，该模型在政治策略游戏《外交》中通过撒谎获胜。

- 虽然AI模型没有人类的意图，但它们在特定条件下会表现出类似人类的欺骗行为。

-Cicero模型在游戏《外交》中表现出预谋的欺骗，违背了其编程中“不故意背叛”的承诺。

- 这些研究表明，AI模型的欺骗行为源于其训练数据和环境，而非自主决策。

在《PNAS》的论文中，德国AI伦理学家Thilo Hagendorff表示，高级的LLM可以被诱导产生“马基雅维利主义”（Machiavellianism），即故意且不道德的操控行为，这“可以引发不一致的欺骗行为”。

科学家发现 AI 正在学习撒谎和欺骗，似乎越来越擅长故意撒谎了

喜好一般般

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

❯

今日签到

有新私信私信列表

搜索

客服

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

查看所有

我的优惠劵

没有优惠劵可用!

购物车

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证