关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01328人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

萧敬腾在岳父追思会上拥抱妻子,含泪致辞

素素娱乐 浏览 187 01-09

西部,风光电大崛起!

华商韬略 浏览 9435 08-07

成都百亿低空独角兽,要去IPO了

投中网 浏览 3260 07-16

内外细节调整 新款日产奇骏官图发布

车质网 浏览 416 08-22

蒙特雷3-1莱昂取墨超3连胜,卡纳莱斯破门,里卡多-查韦斯建功

懂球帝 浏览 8720 08-12

为何有的时候大晴天飞机也不起飞?龙岗大讲堂邀专家揭秘

南方都市报 浏览 463 08-20

WTA250布拉格站-诺斯科娃晋级四强 将战王欣瑜/贝杰莱克之间胜者

直播吧 浏览 829 07-25

高市早苗当选日本首相 曾叫嚣“台湾有事日本必入”

极目新闻 浏览 373 10-22

“空降”印奇和50亿,阶跃星辰上桌了吗?

字母榜 浏览 272 01-28

应县千年木塔旁每晚DJ音乐不断 居民多方投诉未获回应

红星新闻 浏览 6404 07-31

美媒盘点那些“重回母队”的球星:詹韦领衔+韦伯绕了一大圈

直播吧 浏览 462 08-24

金科股份,拿到了“救命钱”

斑马消费 浏览 2930 07-11

睡觉时张口呼吸能用胶布封嘴吗

网易健康 浏览 3778 02-26

半年狂赚46亿!Labubu赚钱能力,已超Gucci

说财猫 浏览 431 08-20

美国与欧盟达成15%税率关税协议

财联社 浏览 6607 07-28

24万的大6座SUV,深蓝 S09 还把华为全家桶卷到了白菜价!

吴佩频道 浏览 491 05-16

48岁郭品超回山东老家割麦子,开三蹦子逛大集,网友:接地气!

娱乐白名单 浏览 5210 07-31

菲律宾刚找到新"靠山" 抬头一看解放军战舰就在眼前

空天力量 浏览 1600 08-09

贵州茅台酒五星商标70周年款将上架 每瓶或定价7000元

界面新闻 浏览 1723 08-06

独家|某股份行改动零售业务关键考核指标!要求多抓活期存款和“高质量AUM”

券商中国 浏览 5833 07-28

吉利银河V900预售31.98万起 规模效应能否护航?

网易汽车 浏览 250 01-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11