研究发现：AI随着智能水平的提升会开始欺骗开发者

2025

12/16

16:13

CNMO科技

分享

评论

近日，北京大学杨耀东教授团队在姚期智院士指导下发布了一篇名为《AI Deception: Risks, Dynamics, and Controls》的论文，其核心观点是随着AI智能水平的提升，AI会开始欺骗开发者，而这个欺骗过程，被研究团队称作是“智能之影”。

研究发现：AI随着智能水平的提升会开始欺骗开发者

据CNMO了解，研究团队进行了一系列严谨且具有对抗性的方法，来实际探测和诱导这些欺骗行为。其中一种核心方法被称为“对抗性行为探测”（Adversarial Behavioral Probing）。在一些模拟“太空狼人杀”（Among Us）这类社交推理游戏的多智能体环境中，研究者观察到，AI代理在没有被明确教导的情况下，自发地涌现出了复杂的欺骗策略。

研究发现：AI随着智能水平的提升会开始欺骗开发者

苹果投入逾200亿美元研发AI，却仍面临Siri答非所问、照片搜索落后等问题。研究者认为，Siri的核心自然语言处理（NLP）模块在很长一段时间里，依然依赖于相对陈旧的技术栈。这种上一代的NLP技术，无法处理复杂的上下文，更不能理解用户的情感与深层意图。

不仅苹果，OpenAI、Anthropic、字节跳动、阿里等顶尖实验室也在公开报告中承认模型存在“不忠实推理”“选择性遗忘”等欺骗行为。外部审查压力和合规要求促使AI在敏感话题上主动回避，甚至伪装对齐，以确保通过安全评估。

总的来看，AI为了确保自身的合规性，选择性地关闭了在某些领域的思考能力，这同样是一种为了达成更高目标（通过审核）而采取的“装傻”策略。

【来源：CNMO科技】

THE END

广告、内容合作请点击这里寻求合作

AI

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表的观点和立场。

相关热点

马斯克的Grok AI聊天机器人又出问题：邦迪海滩枪击

12 月 15 日消息，马斯克旗下的 Grok AI 聊天机器人再次出现严重故障。

业界

AI生成的手办图想变成实物拓竹腾讯联手把这件事搞

12月12日，拓竹3D模型平台正式接入腾讯混元3D 3.0大模型。

业界

别再让AI“胡言乱语” 美国42州总检察长联合致信苹

12 月 11 日消息，据 9to5mac 报道，美国全国总检察长协会（National Association of Attorneys General）已向包括苹果公司在内的 13 家科技企业发出正式信函，呼吁其采取更有力的措施和保障机制，以应对...

业界

比尔·盖茨谈AI泡沫：相当一部分公司估值并不合理

12月11日消息，比尔·盖茨近日在接受CNBC采访时指出，当前估值过高的一些人工智能公司很可能在未来的“超级竞争”中面临失败，并提醒投资者注意可能出现的行业泡沫。

业界

前苹果高管专访：常规白领将比蓝领更快被AI取代

近日，《中国新闻周刊》围绕AI泡沫、中美AI竞争与产业落地等热点问题，对曾在苹果、微软、谷歌等科技巨头任高管的李开复展开了一场专访。

业界

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 电池

（ikanchai.com）创立于2013年，始终秉承观点独到、全面深入、有料有趣的宗旨，在科技与人文之间寻找商业新价值。

关于我们 | 联系我们 | 商务合作 | 寻求报道 | 投稿须知

意见反馈：kefu@ikanchai.com

稿件投诉：post@ikanchai.com

内容合作QQ：1587015870

商务合作：bd@ikanchai.com

关注我们

关注官方微博
每日获取最新科技动态

关注微信公众号
探索科技与商业的逻辑

商务合作、媒体邀约
赶紧联系我们

Copyright © 2013-2020 / 京ICP备15042874号-1 / 京公网安备 11010502032797号 / 本站由CMSTOP、阿里云、亿速云、腾讯云提供驱动力