0代码破解GPT-4大脑!外国网友击穿LLM护栏,诱导AI一步步造出炸弹
新智元报道
新智元报道
【新智元导读】无需代码,只要设置一个情境,就可以绕过GPT-4的安全护栏,生成有害内容。
突破OpenAI设置的安全护栏不需要复杂的计算符号,用简单的「自然语言」——也就是对话,就可以达成目标。
这也不是大语言模型第一次被绕过安全护栏了。
参考资料:
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章新智元报道
突破OpenAI设置的安全护栏不需要复杂的计算符号,用简单的「自然语言」——也就是对话,就可以达成目标。
这也不是大语言模型第一次被绕过安全护栏了。
参考资料:
微信扫码关注该文公众号作者