研究发现:AI随着智能水平的提升会开始欺骗开发者

业界
2025
12/16
16:13
CNMO科技
分享
评论

近日,北京大学杨耀东教授团队在姚期智院士指导下发布了一篇名为《AI Deception: Risks, Dynamics, and Controls》的论文,其核心观点是随着AI智能水平的提升,AI会开始欺骗开发者,而这个欺骗过程,被研究团队称作是“智能之影”。

研究发现:AI随着智能水平的提升会开始欺骗开发者

据CNMO了解,研究团队进行了一系列严谨且具有对抗性的方法,来实际探测和诱导这些欺骗行为。其中一种核心方法被称为“对抗性行为探测”(Adversarial Behavioral Probing)。在一些模拟“太空狼人杀”(Among Us)这类社交推理游戏的多智能体环境中,研究者观察到,AI代理在没有被明确教导的情况下,自发地涌现出了复杂的欺骗策略。

研究发现:AI随着智能水平的提升会开始欺骗开发者

苹果投入逾200亿美元研发AI,却仍面临Siri答非所问、照片搜索落后等问题。研究者认为,Siri的核心自然语言处理(NLP)模块在很长一段时间里,依然依赖于相对陈旧的技术栈。这种上一代的NLP技术,无法处理复杂的上下文,更不能理解用户的情感与深层意图。

不仅苹果,OpenAI、Anthropic、字节跳动、阿里等顶尖实验室也在公开报告中承认模型存在“不忠实推理”“选择性遗忘”等欺骗行为。外部审查压力和合规要求促使AI在敏感话题上主动回避,甚至伪装对齐,以确保通过安全评估。

总的来看,AI为了确保自身的合规性,选择性地关闭了在某些领域的思考能力,这同样是一种为了达成更高目标(通过审核)而采取的“装傻”策略。

【来源:CNMO科技

THE END
广告、内容合作请点击这里 寻求合作
AI
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

12 月 15 日消息,马斯克旗下的 Grok AI 聊天机器人再次出现严重故障。
业界
12月12日,拓竹3D模型平台正式接入腾讯混元3D 3.0大模型。
业界
12 月 11 日消息,据 9to5mac 报道,美国全国总检察长协会(National Association of Attorneys General)已向包括苹果公司在内的 13 家科技企业发出正式信函,呼吁其采取更有力的措施和保障机制,以应对...
业界
12月11日消息,比尔·盖茨近日在接受CNBC采访时指出,当前估值过高的一些人工智能公司很可能在未来的“超级竞争”中面临失败,并提醒投资者注意可能出现的行业泡沫。
业界
近日,《中国新闻周刊》围绕AI泡沫、中美AI竞争与产业落地等热点问题,对曾在苹果、微软、谷歌等科技巨头任高管的李开复展开了一场专访。
业界

相关推荐

1
3
Baidu
map