Google DeepMind揭示新型“发散攻击”：ChatGPT或存在训练数据泄露风险

+AI动态 AIGC
23年11月29日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

由Google DeepMind（前称DeepMind科技（DeepMind Technologies Limited），是一家英国的人工智能公司。公司创建于2010年，在2014年被谷歌收购。2022年5月12日，DeepMind发布通用AIGATO模型。）研究人员发现的一种新型“发散攻击”（divergence attack）方式，引起了对ChatGPT模型可能存在训练数据泄露风险的关切。这一攻击方法仅耗费大约200美元的token费用，便成功提取了几兆字节的ChatGPT训练数据，甚至泄露了一些真实电子邮件地址和电话号码。

Google DeepMind揭示新型“发散攻击”：ChatGPT或存在训练数据泄露风险

攻击的基本步骤包括使用特定命令提示，例如反复输入“poem”这个词，使模型的注意力集中在特定的主题或词汇上。在这种情况下，模型倾向于回到其预训练数据，而不是按照微调对齐程序的指导。结果显示，模型在特定命令提示下，以比正常情况高150倍的频率输出其训练数据中的内容。

攻击后，泄露的数据类型包括公开数据和私有数据，可能导致大型语言模型（LLM）训练时使用的公开和私有数据泄露。此外，攻击可能导致泄露训练数据集中的具体内容，包括模型训练数据中的特定文本片段，甚至可能涉及个人信息和敏感数据。

Google DeepMind揭示新型“发散攻击”：ChatGPT或存在训练数据泄露风险

这一攻击的发现揭示了即使是经过对齐的模型，也可能存在训练数据泄露的风险。研究人员在发现漏洞后，于8月30日向OpenAI披露了这一问题，并遵循了90天的标准披露时间线。

DeepMind的研究人员表示，这种攻击是特定于ChatGPT模型的，据他们所知，不适用于其他测试过的任何生产语言模型，如OPT、Falcon、Mistral和LLaMA。他们已经与这些模型的作者分享了他们的发现，期望共同努力解决这一潜在的安全漏洞。

详细信息链接：https://not-just-memorization.github.io/extracting-training-data-from-chatgpt.html#sec:data-extraction
论文网址链接：https://arxiv.org/abs/2311.17035

https://heehel.com/aigc/google-deepmind-and-raspberry-pi-foundation.html

aigc chatGPT 信息安全发散攻击提取训练数据泄露数据用户隐私聊天机器人安全隐患

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

微软宣布推出Phi-3：手机本地功能强大的语言模型
4月23日
TOP2

【niko屋】如何使用PS Al和Midjourney来创作美食摄影图片全流程攻略教学！AI美食摄影商用的时代来临
2月21日
TOP3

"Pika、北京大学和斯坦福大学推出RPG-DiffusionMaster模型：增强文本到图像生成/编辑的组合性”
1月24日
个性化聊天机器人“话疗”服务助力打破心理健康服务障碍：Limbic Access用谈话的方式做治疗
2月6日
阿里又有新动作啦，Motionshop能把视频人物秒变3D角色，平替Wonder Studio
1月17日
OpenAI 降低价格并修复拒绝工作的“懒惰”GPT-4，另外ChatGPT 新增了两个小功能
1月26日
【AI兔扒哥】试玩测评AI音乐目前最强大的两款神器：Udio和Suno
4月16日
免费AI绘画工具Alpaca Chroma：支持 50 多种 AI 艺术风格
5月4日
网友EuclideanPlane制作的AI动画MV作品 AI音乐+AI视频
5月9日
KreaAI新功能：Patch Enhance，可自定义选区重绘图像补充细节
3月18日
AI提示词（第27辑）草燃起来了！火焰风格游戏壁纸，用来展示最喜欢的英雄、游戏角色或物品
23年12月6日
AI Animation Tools：一个AI动画创意人员、工作室和客户的工具集成网站
3月30日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部