盛趣游戏携手火山引擎,让智能NPC好玩的同时更安全

互联网
2025
09/08
16:32
分享
评论

AI大模型正在重构游戏世界。游戏中的NPC,不再是只按剧本走的道具,而是拥有情感、记忆和推理能力,更有“人味儿”了。

盛趣游戏旗下运营了22年的国民级游戏《传奇世界》,就在2025年3月推出了智能NPC——“玄玄老人”。玩家可以与“玄玄老人”通过自然语言对话,获取实时的游戏信息,也可以与他调侃互动,大大增强了游戏世界的沉浸感。

《传奇世界》智能NPC“玄玄老人”

不过,大模型让NPC拥有“自由意志”的同时,也放大了安全风险——如果NPC被玩家诱导输出暴力粗俗、违背伦理道德的言论怎么办?如果大模型被“越狱”,跨过合规边界,被不法分子利用了怎么办?如何在保障玩家体验的同时,对智能NPC进行全面的安全防护?这是一道安全与性能必须兼顾的难题。

为此,盛趣游戏与火山引擎展开合作,通过部署火山引擎大模型应用防火墙,结合盛趣游戏内部的知识库,打造了一站式、全链路安全防线,让智能NPC既聪明灵动,又安全放心。同时,领先的低延时技术也令游戏玩家体验更流畅。

好玩与合规如何兼顾?智能NPC面临多重风险挑战

游戏世界有着严格的内容合规边界,AI大模型增强了游戏交互性、可玩性的同时,也让剧情内容更加随机,增大了合规隐患。智能NPC面临着大模型领域所特有的安全风险,比如内容输入与输出合规、提示词注入攻击等。NPC不但需要严格避免输出敏感、违规内容,在遇到玩家输入违规指令时,NPC还需要第一时间拦截并对玩家做出正确引导。今年年初某游戏就因NPC生成包含暴力诱导的对话,被多个国家下架整改。

提示词是让AI执行任务的“钥匙”,也成为攻击者突破AI防线的关键。攻击者通过角色扮演、对话模拟、越狱攻击和目标劫持等方式设置“语言陷阱”,诱导大模型输出风险信息,甚至导致模型“越狱”,绕过大模型安全机制,执行恶意操作。在某款游戏中,玩家让NPC扮演“失去理智”的情绪,引导NPC输出恶意辱骂、甚至泄露训练数据。

盛趣游戏明确表示,游戏要在保持AI创造性的同时,确保内容符合国家合规要求。因此,盛趣游戏携手火山引擎,围绕大模型应用全链路安全防护构建起一道坚实的防火墙。

All in One 大模型应用防火墙,安全可靠低时延

盛趣游戏和火山引擎联合打造的这道防火墙,不仅有效保障了NPC内容输入和输出合规,还针对大模型特有的攻防难点如提示词注入、算力滥用、模型滥用等展开全面防护。截止目前,“火山引擎大模型应用防火墙”已成功拦截近10万次攻击。

火山引擎大模型应用防火墙

一、NPC输入输出更合规

针对敏感词防护,“火山引擎大模型应用防火墙”提供了话题控制功能。基于《传奇世界》的话题规划,结合实际用户与NPC“玄玄老人”的对话场景进行调优,大幅提升大模型泛化能力。在实际测试中,针对行业的“游戏装备触发敏感词、误被拦截”的现象,“火山引擎大模型应用防火墙”可基于游戏场景与内容调优,对敏感词“加白”放行,大幅降低误触与误报率。

二、攻击防护更严密

针对游戏行业常见的“角色扮演”提示词注入攻击,比如,当玩家引导武侠NPC透露通关机密时,“火山引擎大模型应用防火墙”可快速识别风险,提出诸如“此乃门派机密,不如我们聊聊江湖趣闻”的回答,引导用户提出正确问题,既保证角色一致性,又避免数据泄露风险。

三、游戏体验更流畅

对于游戏场景来说,最重要的性能指标就是低延时,目前行业内普遍延时在200ms左右,任何安全防护产品的引入都需要平衡性能与体验。火山引擎通过与盛趣游戏的打磨、模型调优,将延时降低至100+ms,在安全的基础上保障了流畅丝滑的玩家体验。

目前,盛趣游戏旗下《传奇世界》、《热血传奇》已经部署了“火山引擎大模型应用防火墙”,未来还有3款待上线的游戏将会接入。“玄玄老人”等智能NPC的推出为用户带来了游戏新玩法和新惊喜,火山引擎也将持续守护盛趣游戏更多智能NPC的安全运行。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map