研究:用诗歌就能让AI说违禁内容,成功率达62%
2026-01-08 11:20:51 [探索] 来源:长春市某某策划售后客服中心
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容四川某某设备制造厂便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功四川某某设备制造厂实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:热点)
推荐文章
-
一组消防试验,揭秘浪漫围炉煮茶背后“杀机”2026-01-06 14:05:07 来源:“中国消防”微信公众号
...[详细]
-
致命鹅膏(白罗伞) 灰花纹鹅膏(麻母鸡) 黄盖鹅膏(黄罗伞) 条盖盔孢伞 毒沟褶菌(小白菌、蝴蝶菌) 亚稀褶红菇(火炭菌) 松茸 又到了一年一度云南野生菌大量采摘上市的季节。看到鲜美
...[详细]
-
为贯彻落实国家金融监督管理总局发布的《关于银行业保险业做好金融“五篇大文章”的指导意见》,加快构建多层次、广覆盖、多样化、可持续的“五篇大文章”服务体系,5月20日,中国人民健康保险股份有限公司以下简
...[详细]
-
5个现象告诉你,身体缺乏蛋白质|吃出健康来2024-05-18 17:52:07 来源:“健康中国”微信公众号
...[详细]
-
乌克兰总统泽连斯基2日任命时任乌国防部情报总局局长布达诺夫为乌总统办公室主任,并宣布对乌国防部多个关键岗位的人事安排进行调整。乌媒体和分析人士认为这将对俄乌冲突走向、和平谈判及乌国内选举产生多重影
...[详细]
-
5月17-18日,以“园来如此美好”为主题的大华·星曜实景示范区暨社群启动仪式正式亮相。作为大华集团首部“星曜系”作品,大华·星曜在过去的5个月内三次开盘均热销,更是荣获24年上海市一季度300万-5
...[详细]
-
即日起至6月30日,浦东嘉里城集结场内社群及多家运动品牌,共同开启第二季“奇妙律动·运动玩嘉2024”,打造家门口的运动社交场,传递健康生活方式,唤醒运动社交热情。浦东嘉里城第二季“奇妙律动·运动玩嘉
...[详细]
-
京藏协作提升西藏口腔疾病的诊治水平2024-05-19 09:46:25 来源:中国新闻网 作者:刘阳禾
...[详细]
-
人民日报健康客户端记者 王思予)1月4日,“车厘子价格已大跌”“车厘子含褪黑素”两大话题接连登上热搜。随着大批车厘子上市,其所谓“富含褪黑素能助眠”的话题也引发大家好奇与讨论。央视新闻图中国农业大学食
...[详细]
-
2岁宝宝得梅毒,传统喂养陋习当休矣2024-05-20 09:51:24 来源:羊城晚报 作者:李岩
...[详细]
热点阅读

中场大师、德国球星克罗斯宣布欧洲杯后退役
脊柱为何是第二生命线?
