行业首发！网易易盾推出国内首个AIGC内容安全插件，已接入Coze、Dify等主流平台

2025

06/25

15:15

2025年被认为是智能体落地的元年，也是爆发年。无论是个人生活中的智能助手，如旅游规划、健身管家、文案生成智能体，亦或是企业端的数字员工，如智能客服、供应链管理、金融投顾智能体，都在2025年不断涌现。

但繁荣背后，无论是消费级智能体或是企业级智能体都面临不少难题和挑战，其中之一就是内容安全问题。AI输出的文字、图片是否合规，会不会“乱说话”，让用户体验大打折扣？

今日，网易易盾内容安全插件上线国内各大智能体开发平台，包括Coze、Dify、千帆App Builder、文心智能体平台、腾讯云智能体开发平台及网易CoreAgent智能协作中枢等，智能体开发者只需一键调用，就能在智能体内添加内容安全检测能力。这也是国内首个在智能体领域被大范围使用的AIGC内容安全插件，将在未来持续赋能智能体生态健康发展。

4月以来，已有3500余款AI产品被处置

据IDC预测，Agent中国市场规模预计将突破300亿美元。Gartner数据则显示，到2028年，至少15%的日常工作决策将通过AI智能体自主做出，1/3的企业级软件应用当中都会包含智能体。

智能体依托AI大模型生成多样化内容，其中可能包含虚假信息、敏感词汇或不当言论；生成的图片可能涉及侵权、不雅内容或违法元素。尤其在教育、金融、医疗等高敏感行业，内容安全直接关系到企业声誉与用户信任。

同时，国内外监管机构对AIGC内容安全的监管力度不断加大。据“清朗·整治AI技术滥用”专项行动统计，自2025年4月以来，中央网信办聚焦AI换脸拟声侵犯公众权益、AI内容标识缺失误导公众等AI技术滥用乱象，第一阶段累计处置违规小程序、应用程序、智能体等AI产品3500余款，清理违法违规信息96万余条，处置账号3700余个。

海外市场同样对数据隐私和内容安全提出严格要求。开发者在构建智能体时，不仅需要关注功能实现，还需投入大量资源进行内容审核与合规检测，这无疑增加了开发成本与复杂度。

一键接入易盾AIGC内容安全插件，全面护航

为解决智能体在开发和使用中的内容安全痛点，网易易盾推出内容安全插件，支持多维度检测功能：

文本检测：识别违法违规信息、敏感词汇、垃圾广告等，覆盖政治、色情、暴力等多类风险内容。

图片检测：检测图片中的不雅内容、违法标识等，支持复杂场景下的精准识别。

开发者在这些平台上搭建智能体时，可通过简单配置一键引入网易易盾内容安全插件，以面向个人开发者的Coze为例：

STEP1：在插件资源库中搜索对应插件

STEP 2：在工作流中将易盾AIGC安全插件编排进智能体

通过与各大智能体平台的集成，网易易盾插件极大降低了开发者的接入门槛，无论是零代码用户还是专业开发者，都能轻松调用内容安全能力，专注于业务创新而无需担忧合规风险。

以过硬技术实力，守护生成式AI内容安全

作为国内领先的数字内容安全服务提供商，网易易盾在AIGC领域积累了深厚的技术优势与行业经验，拥有千万级对AIGC代答知识库，可利用大小模型融合检测技术，根据时政规则实现“应答尽答”，已经成功为100+ AIGC客户服务，获得“硬核”实力认可。

网易易盾还专门针对AIGC安全场景，打造“内生安全+围栏防护”双维防御体系，而智能体开发平台调用的，正是其中“产品运营”中的“AI机审”能力。

网易易盾大模型内容安全体系

今年，由全国网络安全标准化技术委员会（简称“TC260”）归口、网易易盾参与的人工智能安全领域重要国家标准：GB/T 45654-2025《网络安全技术生成式人工智能服务安全基本要求》正式对外发布，并将于2025年11月正式实施，标准对于日益增加的生成式AI服务（如大模型、对话机器人等）的安全管理提供技术规范与参考。网易易盾正在通过一点一滴的努力，将AIGC内容安全的理念和技术渗透到人工智能服务的各个角落中。

智能体是AI技术落地的关键一环，而内容安全是其稳健落地的基石。网易易盾将持续深耕AIGC内容安全领域，携手各AI应用开发者、各AI行业从业者，共同构建可信的智能未来。

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表的观点和立场。

行业首发！网易易盾推出国内首个AIGC内容安全插件，已接入Coze、Dify等主流平台

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 电池

关注我们