腾讯云Agent Runtime沙箱助力MiniMax打造生产级Agent RL底座

互联网
2026
03/18
18:04
分享
评论

近日,国际领先的AI大模型厂商MiniMax与腾讯云正式达成 合作,双方围绕Agent RL强化学习训练的核心场景,基于腾讯云Agent Runtime沙箱产品展开全链路技术与业务协同。

图片1.png

MiniMax深耕通用人工智能领域,近期发布的Agent RL框架Forge,旨在突破大模型在复杂任务中的逻辑推理、代码执行与自主决策能力,而其大规模训练对底层基础设施的弹性、并发、安全提出极高要求。

图片2.png

此次与腾讯云的 合作,让Forge框架实现了强化学习场景中大规模交互环境的毫秒级拉起、百万级吞吐、十万级并发、瞬时销毁,大幅提升了训练吞吐量和稳定性。

图片3.png

图:Agent RL(智能体强化学习)端到端闭环技术架构

腾讯云Agent Runtime沙箱自发布以来,已 适配多个国际领先大模型,在智能编程、数据处理、自动化评测、浏览器交互等多元化业务场景实现规模化落地。此次与MiniMax的合作,针对Agent RL大规模数据合成、训练、评估的核心需求,实现了毫秒级沙箱启动、百万级实例并发、全场景环境模拟与安全隔离的技术突破,既是腾讯云Agent沙箱产品能力在头部客户核心场景的重磅验证,更标志着其完成了从技术打磨到规模化商业落地的关键跨越。

随着AI智能体从会话式向执行式加速演进,大模型厂商在Agent RL等核心场景落地中,普遍面临四大行业痛点:一是Prompt注入、越权执行带来的安全合规风险,缺少可控的安全执行边界;二是传统K8s架构为微服务设计,与Agent会话亲和、即用即销毁的资源模型错配,引发资源浪费、调度效率低等问题;三是容器/VM冷启动延迟高,无法支撑RL训练万级并发、交互式Agent百毫秒级启动的性能需求;四是行业协议标准不统一,存量业务迁移改造成本高,海量镜像分发易引发TB级带宽瓶颈。

针对上述行业痛点,腾讯云Agent Runtime沙箱打造了全场景适配的定制化解决方案,实现了性能、安全、成本的三重突破。

在性能层面,通过多级轻量架构与设备池化设计,规避传统K8s调度瓶颈,实现58秒内启动3万个4C+8G规格沙箱实例,单镜像场景下每分钟可创建60万沙箱、QPS超1万,SWE RL场景下压测吞吐达16w QPM,P99延迟稳定在1秒内且成功率达4个9;通过镜像按需加载、就近缓存、块级去重三大优化,解决海量镜像分发带宽难题,将镜像实际读取占比从全量降至约10%,大幅降低存储与传输成本;更通过资源池化与快照恢复技术,实现80ms级沙箱交付,较原有方案冷启动耗时降低96%。

图片4.png

图片5.png

在安全层面,基于腾讯云自研Cube沙箱技术构建虚拟化级隔离,通过独立内核、会话/网络/存储三层隔离机制,彻底消除容器逃逸、敏感凭证泄露的高危风险,为Agent自主试错构建坚实安全边界。

图片6.png

图:腾讯云自研三层安全隔离机制

在适配层面,原生兼容E2B协议,支持SDK/MCP/CLI/云API多方式接入,MiniMax仅需修改环境变量即可完成存量Agent业务迁移,实现零改造成本规模化落地。

图片7.png

此次合作中,双方共同验证了3A infra已经成为Agent时代基础设施发展的核心方向。该标准已在元宝、混元、微信读书等多个头部客户场景完成落地验证,为行业选型提供全方位参考。

Agent First以智能体为生产主体,重构基础设施设计范式,扭转传统架构以人为服务目标的设计原则,原生适配Agent会话亲和、短时高频调用的特性,同时通过开箱即用的工具链让开发者聚焦业务逻辑,大幅降低开发门槛;

Agent native打通技术与业务落地壁垒,不重构企业现有生产体系,原生适配Agent Serving无状态执行、Agent RL长时任务等全场景业务特性,更支持数十万自定义镜像免重构接入,实现与企业IT体系、业务流程的 融合;

Agent ready筑牢规模化落地核心底座,凭借ms级交付、数十万级实例秒级并发的极致性能,突破Agent规模化训练与服务的性能天花板,更构建从环境隔离到行为审计的全链路安全防线,结合智能资源调度实现成本优化,在元宝AI编程场景中,迁移后资源核时消耗降低95.8%,实现“高性能、高安全、低成本”的规模化落地。

作为腾讯云为AI智能体量身打造的新一代任务执行环境,腾讯云Agent Runtime沙箱具备四大核心优势:一是全链路安全防护,构建环境隔离、权限管控、行为审计的完整安全防线;二是Agent原生资源架构,支持沙箱暂停/恢复/快照能力,实现资源高效调度;三是极致弹性性能,支撑数十万实例秒级并发、毫秒级启动,应对脉冲式业务需求;四是全生态兼容,多方式接入且原生兼容主流行业协议,可与腾讯云HAI、混元大模型、高性能存储、全球算力资源池等全栈产品 联动,提供从算力、模型到执行环境的端到端解决方案。同时,该沙箱还支持代码、浏览器、移动端、电脑端等全场景交互环境模拟,提供精准轨迹记录、断点快照回放、全链路可观测的实验支持能力,完美匹配Agent RL训练的核心需求。

双方共同表示,未来将持续深化技术协同与场景拓展,不断打磨Agent原生基础设施能力,助力大模型厂商降低技术门槛与使用成本,推动AI智能体在千行百业的规模化落地,加速通用人工智能(AGI)时代的到来。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map