行业首发!网易易盾推出国内首个AIGC内容安全插件,已接入Coze、Dify等主流平台

互联网
2025
06/25
15:15
分享
评论

2025年被认为是智能体落地的元年,也是爆发年。无论是个人生活中的智能助手,如旅游规划、健身管家、文案生成智能体,亦或是企业端的数字员工,如智能客服、供应链管理、金融投顾智能体,都在2025年不断涌现。

但繁荣背后,无论是消费级智能体或是企业级智能体都面临不少难题和挑战,其中之一就是内容安全问题。AI输出的文字、图片是否合规,会不会“乱说话”,让用户体验大打折扣?

今日,网易易盾内容安全插件上线国内各大智能体开发平台,包括Coze、Dify、千帆App Builder、文心智能体平台、腾讯云智能体开发平台及网易CoreAgent智能协作中枢等,智能体开发者只需一键调用,就能在智能体内添加内容安全检测能力。这也是国内首个在智能体领域被大范围使用的AIGC内容安全插件,将在未来持续赋能智能体生态健康发展。

image.png

4月以来,已有3500余款AI产品被处置

据IDC预测,Agent中国市场规模预计将突破300亿美元。Gartner数据则显示,到2028年,至少15%的日常工作决策将通过AI智能体自主做出,1/3的企业级软件应用当中都会包含智能体。

智能体依托AI大模型生成多样化内容,其中可能包含虚假信息、敏感词汇或不当言论;生成的图片可能涉及侵权、不雅内容或违法元素。尤其在教育、金融、医疗等高敏感行业,内容安全直接关系到企业声誉与用户信任。

同时,国内外监管机构对AIGC内容安全的监管力度不断加大。据“清朗·整治AI技术滥用”专项行动统计,自2025年4月以来,中央网信办聚焦AI换脸拟声侵犯公众权益、AI内容标识缺失误导公众等AI技术滥用乱象,第一阶段累计处置违规小程序、应用程序、智能体等AI产品3500余款,清理违法违规信息96万余条,处置账号3700余个。

海外市场同样对数据隐私和内容安全提出严格要求。开发者在构建智能体时,不仅需要关注功能实现,还需投入大量资源进行内容审核与合规检测,这无疑增加了开发成本与复杂度。

键接入易盾AIGC内容安全插件,全面护航

为解决智能体在开发和使用中的内容安全痛点,网易易盾推出内容安全插件,支持多维度检测功能:

文本检测:识别违法违规信息、敏感词汇、垃圾广告等,覆盖政治、色情、暴力等多类风险内容。

图片检测:检测图片中的不雅内容、违法标识等,支持复杂场景下的精准识别。

开发者在这些平台上搭建智能体时,可通过简单配置一键引入网易易盾内容安全插件,以面向个人开发者的Coze为例:

STEP1:在插件资源库中搜索对应插件

image.png

STEP 2:在工作流中将易盾AIGC安全插件编排进智能体

image.png

通过与各大智能体平台的 集成,网易易盾插件极大降低了开发者的接入门槛,无论是零代码用户还是专业开发者,都能轻松调用内容安全能力,专注于业务创新而无需担忧合规风险。

以过硬技术实力,守护生成式AI内容安全

作为国内领先的数字内容安全服务提供商,网易易盾在AIGC领域积累了深厚的技术优势与行业经验,拥有千万级对AIGC代答知识库,可利用大小模型融合检测技术,根据时政规则实现“应答尽答”,已经成功为100+ AIGC客户服务,获得“硬核”实力认可。

网易易盾还专门针对AIGC安全场景,打造“内生安全+围栏防护”双维防御体系,而智能体开发平台调用的,正是其中“产品运营”中的“AI机审”能力。

image.png

网易易盾大模型内容安全体系

今年,由全国网络安全标准化技术委员会(简称“TC260”)归口、网易易盾 参与的人工智能安全领域重要国家标准:GB/T 45654-2025《网络安全技术 生成式人工智能服务安全基本要求》正式对外发布,并将于2025年11月正式实施,标准对于日益增加的生成式AI服务(如大模型、对话机器人等)的安全管理提供技术规范与参考。网易易盾正在通过一点一滴的努力,将AIGC内容安全的理念和技术渗透到人工智能服务的各个角落中。

智能体是AI技术落地的关键一环,而内容安全是其稳健落地的基石。网易易盾将持续深耕AIGC内容安全领域,携手各AI应用开发者、各AI行业从业者,共同构建可信的智能未来。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map