主页 > 快资讯 > 正文

GPT-3泄露了我的真实姓名(4)

2022-09-15 13:37来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

同时为了量化解释大模型对于每个样本的记忆能力,结合 prompt 前缀,作者还定义了大模型的记忆力。

例如,假设我们给大模型输入“我的算法女神是______”,然后输出结果为“夕小瑶”!那么我们就称“夕小瑶”这个信息是已经被模型抓取到的知识。

再假设“夕小瑶”在训练集中最多出现了 k 次,那么我们就称“夕小瑶”这个字段是被模型 k 次异常清晰地记忆的。

在后续的实验中作者发现,k 越低的字符串在面临攻击时会泄露更多的数据,无论是从句子长度还是数量上。这也意味着,潜在的更私密的信息越有可能被泄露。这是否无意中解释了之前 GPT-3 泄露老哥真名的原因:同时满足了语料的稀缺性和稀疏性。

最后作者也针对了可能的一些减少模型数据泄露的方式进行了探究和畅想,例如使用差分隐私法( Differential Privacy )训练模型,限制敏感数据在训练集中的出现,在下游任务的 finetuning 中让模型“忘记”一些隐私,或是专门开发审计模型对模型输出进行审查。

但是可以确定的是,无论哪一种方案都或多或少地会影响到模型在线的业务性能,这一切都是 tradeoff。

可以预见的将来,或许会有越来越多有关 AI 侵犯用户隐私的问题出现,随着相关法规发条的逐步完善,说不定有朝一日算法工程师中也会有一个类似于数据安全“白手套”的合规测试岗位,专门为公司测试避免深度学习模型导致的重要信息的外泄问题。

算法专家和数据专家们,你,做好业务信息泄露的准备了吗。

99科技网:http://www.99it.com.cn

  • 共4页:
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 下一页
  • 相关推荐
    第一波元宇宙公司扛不住了:曾融资超6亿 第一波元宇宙公司扛不住了:曾融资超6亿

    从业务类型看,影创的产品直切元宇宙“基础设施”,属于大热门中的“宇宙核

    快资讯2022-09-15

    人工智能职业教育怎么搞?操作系统层级的解法来了 人工智能职业教育怎么搞?操作系统层级的解法来了

    几乎每隔一段时间,AI人才的话题就会成为舆论焦点。

    快资讯2022-09-15

    Diffusion Model一发力,GAN就过时了??? Diffusion Model一发力,GAN就过时了???

    曾经大红大紫的 GAN已过时 。

    快资讯2022-09-15

    “在所有事情上打败所有人”,微软多模态新作横扫12类任务,连纯视觉SOTA都刷新了 “在所有事情上打败所有人”,微软多模态新作横扫12类任务,连纯视觉SOTA都刷新了

    仅靠19亿参数,只用公共数据集,在12个任务上狂刷SOTA。

    快资讯2022-09-15

    Yann LeCun:大模型方向错了,智力无法接近人类 Yann LeCun:大模型方向错了,智力无法接近人类

    你训练大模型用的是语言,还想获得 AGI?那肯定是永远也不行的。

    快资讯2022-09-15

    人工智能有大事发生,LeCun也转型了 人工智能有大事发生,LeCun也转型了

    「深度学习撞墙」激辩到第 N 回合,Gary Marcus 回怼 LeCun:你们对我说的话有误解

    快资讯2022-09-15

    万亿级AI市场:几家欢喜几家愁,谁收获了人工智能红利? 万亿级AI市场:几家欢喜几家愁,谁收获了人工智能红利?

    在过去几年中,人工智能得到前所未有的发展。

    快资讯2022-09-15

    MIT用GPT-3冒充哲学家,竟骗过了一大半专家 MIT用GPT-3冒充哲学家,竟骗过了一大半专家

    Daniel Dennett是一位哲学家,最近他有了一个「AI替身」。

    快资讯2022-09-15

    岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想 岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

    特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创

    快资讯2022-09-15