今天,在 FORCE 原动力大会上,火山引擎正式发布豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型,豆包·实时语音模型在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型。截至2025年5月底,豆包大模型日均 tokens 使用量超过16.4万亿,较去年5月刚发布时增长137倍。
字节跳动 CEO 梁汝波表示,做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。
字节跳动 CEO 梁汝波
在价格方面,豆包大模型1.6采用统一定价模式,首创按“输入长度”区间定价,在企业使用最多的输入区间0-32K 范围内,豆包大模型1.6的价格为输入0.8元/百万 tokens、输出8元/百万 tokens,综合成本比豆包1.5· 思考模型、DeepSeek R1降低63%。Seedance 1.0 pro 模型每千 tokens 0.015元,相当于每生成一条5秒的1080P 视频只需3.67元,行业最低。
目前,能自主思考、规划、完成任务的 Agent 正在逐步进入企业生产场景,这不仅需要模型做到强推理、多模态、低成本,也需要升级 AI 云原生全栈服务。大会上,字节跳动技术副总裁洪定坤、火山引擎总裁谭待发布了12款面向 Agent 开发和应用的工具产品。
针对 Agent 开发,升级 AI IDE“TRAE”,发布火山引擎 MCP 服务、Prompt 优化工具“PromptPilot”、开源的 veRL 强化学习框架、AI 知识管理产品;大数据服务上,发布多模态数据湖、AI 数字专家“Data Agent”;AI 基础设施上,针对 Agent 开发、模型训练和推理,发布 AgentKit、TrainingKit、Servingkit;安全是一切 Agent 运行的基础,为此火山引擎发布 AICC 私密计算、大模型应用防火墙。
谭待表示,AI 时代,开发范式、大数据、计算、安全都在发生重大变化,由此构成的“AI 云原生”全新技术栈,是企业构建好 Agent、创新发展的关键。
火山引擎总裁 谭待
豆包大模型1.6正式发布 更强模型 更高性价比
全新发布的豆包大模型1.6系列由三个模型组成,为企业提供多样化选择。
doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持 思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭 思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少 tokens 消耗。
doubao-seed-1.6-thinking:豆包大模型1.6系列在 思考方面的强化版本;在代码、数学、逻辑推理等基础能力上进一步提升;支持256K 上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的极速版本,支持 思考、多模态理解、256K 上下文;延迟极低,TOPT 仅需10ms;视觉理解能力比肩友商旗舰模型。
豆包大模型1.6具有更强的模型效果,在众多权威测评集上,得分均属于国际第一梯队。在推理能力、多模态理解能力、GUI 操作能力上具备领先优势。
推理能力
豆包大模型1.6在推理速度、准确度与稳定性上显著提升,可支撑更复杂的业务场景落地。
例如,有媒体针对今年的高考全国新一卷数学单科做了测评,豆包的成绩是144分,全国第一。而在高考前,在针对海淀区模拟全卷的测评中,相比去年的模型,豆包大模型1.6理科成绩显著提升了154分,文科提升了90分。
豆包大模型1.6具有边想边搜、DeepResearch 研究能力,能独立思考、规划、使用搜索等各种研究工具。例如豆包 APP 和 PC 端正在小流量测试的 DeepResearch 功能,可以把过去需要多名专业人士花费数天写成的调研报告,缩短到5-30分钟内完成,还能自动提炼信息,总结成网页,方便查阅。
为方便企业使用“边想边搜”和 DeepResearch 功能,火山引擎打造了大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch 等应用,帮助企业快速搭建 AI 应用原型,灵活编排自己的专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub 方舟开源站点下载使用。
多模态理解
多模态理解的核心是“让模型像人一样理解世界”。豆包大模型1.6全系列均原生支持多模态思考能力,让模型可以理解和处理真实世界的问题。该能力支持了豆包 APP 最新的实时视频通话功能,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。
GUI操作能力
豆包大模型1.6凭借领先的视觉 思考能力、精准的视觉定位能力,能够让智能体与浏览器及其他软件进行交互和操作,高效执行各类任务。
更高性价比
豆包大模型1.6采用统一定价模式,无论是否开启 思考模式,无论是文本还是视觉,tokens 价格均一致,按照输入上下文长度区间定价。
在绝大部分企业使用的输入区间0-32K 范围内,价格是输入0.8元/百万 tokens,输出8元/百万 tokens
在输入区间32K-128K 的范围内,价格是输入1.2元/百万 tokens,输出16元/百万 tokens
在输入区间128K-256K 的范围内,价格是输入2.4元/百万 tokens,输出24元/百万 tokens
从综合成本来看,绝大部分请求输入都在32K 以内,输入输出占比在3:1,豆包大模型1.6的综合成本(2.6元)比豆包大模型1.5· 思考模型、DeepSeek R1的综合成本(7元)下降63%,相当于只需原来三分之一的价格,就能使用能力更强、原生多模态的新模型。
此次火山引擎还增设特惠区,对于输入32K、输出200 tokens 以内的请求,豆包大模型1.6的价格将进一步降低到输入0.8元/百万 tokens、输出2元/百万 tokens。相当于绝大部分非思考模型的需求,也可以安心使用更好效果的新模型。
豆包·视频生成模型 Seedance 1.0 pro正式发布
全新发布的豆包·视频生成模型 Seedance 1.0 pro 具备三大特性:无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感,在电商、影视、游戏等行业应用前景广阔。
根据第三方权威榜单 Artificial Analysis 最新结果,Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一。
Seedance 1.0 pro 的价格是每千 tokens 1分5厘,相当于每生成一条5秒的1080P 视频只需3.67元。假如有1万元预算,通过 Seedance 1.0 Pro 可制作2,700多条5秒的1080P 视频,通过 Seedance 1.0 lite 可以制作9,700多条视频。
两款豆包语音大模型上新
语音正在成为 AI 应用和 Agent 的核心交互方式,小米 、OPPO、美图、儿歌多多等企业已使用豆包语音大模型提升产品创新体验。
今天,豆包·实时语音模型全量上线火山方舟,对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,语气、用语、思考方式等拟人感大幅提升,能随时打断与主动搭话。
此外,火山引擎还发布了豆包·语音播客模型。只需输入一句话、网页链接、长文本或文档,语音播客模型即可快速搜索学习,生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品,效果自然,具有互相附和、插话、犹豫等播客节奏;自带的 搜索功能可生成跟进热点话题的播客内容。
AI云原生全栈服务发布 让Agent从Demo走进企业生产系统
AI 时代,开发范式将发生重大变化,调用中心正在从程序员转移到大模型,这就需要更好的模型和模型工具平台。在基础设施层,计算(以 GPU 为核心的计算和网络系统)、大数据(多模态)、安全(防御恶意AI)也正在发生巨变。为此,火山引擎发布AI云原生全栈服务,帮助企业加速 Agent 落地。
Agent开发 用好AI+做好AI
火山引擎智能算法负责人吴迪表示,要构建高生产力的 Agent,既要用好 AI,整合高质量的应用;又要做好 AI,关注底层技术本身的优化和创新。
为帮助企业高效构建 Agent,此次火山引擎发布和升级了五款产品:
AI IDE产品TRAE升级:为开发者提供代码补全、局部代码生成功能,支持代码重构、批量修改、知识问答等复杂任务,下一个版本还将整合不同 Agent 和工具,协调任务流程,实现自动串联操作,逐步从 AI 辅助编程向支持 AI 开发全流程进阶。今年1月上线至今,TRAE 月活用户已经超过了100万。
发布火山引擎MCP服务:链接 Agent 开发体系、大模型工具生态、云服务。与 TRAE、 火山方舟、 扣子打通,一键选择200+丰富 MCP 服务;开发者可以通过 MCP,控制火山引擎的云服务组件,便捷地完成计算、网络、存储等环境部署,更快地把一个创意,变成一个成熟的产品。
发布PromptPilot:可以帮助开发者把模糊的诉求变为具象化的目标,在互动中引导用户明确需求、理想回答和评估标准;自动撰写和优化提示词;产生 badcase 能自动优化提示词,实现精准调控;具备多轮对话、视觉理解、复杂工具调用的优化能力,以及自主判断是否开启模型精调等。
发布AI知识管理产品:支持文本、图像、音频、视频等多模态内容对话式交互,融合本地与互联网知识,提供内容理解和问答服务;首创可交互的推理“做个计划”功能,实现人机协作制定、修改计划。目前已在火山引擎全量邀测。
发布开源的veRL强化学习框架:可轻松扩展多种强化学习算法,无缝集成现有 LLM 基础设施与模块化 API,助力开发者快速搭建 RL 模型开发管线,提升对话规划、智能编程、复杂策略优化等场景的开发效率与资源利用率。 除了提供开源框架,此次还上线了 veRL 平台,用充沛的算力支持强化学习需求。
数据 从支持BI到支持AI
AI 时代,数据基础设施的价值已从 “支持 BI” 迈向 “支持 AI”。火山引擎发布多模态数据湖解决方案、Data Agent,助力企业构建智能化、可感知、可行动的数据体系,实现数据的“主动思考”,让数据真正成为企业的智慧大脑”。
多模态数据湖:新一代 AI Native 的数据基建,帮助企业在多模态数据处理、检索和分析场景上,更快、更好地识别和利用多模态数据资产,成为驱动企业 AI 模型训练与决策的核心设施。
Data Agent:新一代企业级 AI 数字专家,具备数据主动分析、智能洞察、策略生成能力;可将日常取数速度从小时级到分钟级,数据获取成本降低80%;复杂分析效率从周级到小时级,洞察及时性提升90%; 分析报告及营销方案的产出时间和人力成本都能大幅节省。
AI基础设施 更强、更易用、更开放的AI Infra
火山引擎 AI infra 提供性能和功能更强大、使用更简易的 Agent 套件、推理套件、训练套件,帮助企业全链路加速 Agent 构建。
AgentKit:为企业级 Agent 打造的全栈开发和服务工具链,集成豆包大模型1.6与 Computer Use 等工具;基于火山引擎 veFaaS 预置模板,用户只需选择模型和配置参数即可快速部署,可实现分钟级10万核扩容;构建完整工具生态体系,支持多终端 Tool Use、覆盖数十类三方 MCP Server。
云原生训练套件TrainingKit:实现高达60%+的 MFU(算力利用率);面向后训练环节,通过 veRL 框架、 Sandbox 百万核秒并发能力,有效提升后训练效率,为 AI 训练全流程筑牢技术底座。
云原生推理套件ServingKit:从模型部署、在线推理、服务运维三个阶段进行加速和提效,支持开源推理框架,并针对主流模型进行算子优化,性能相比社区最新版本可以提升2-3倍;已在互联网、物流、 等各行业应用,提升模型训推效率,降低成本。
安全 一切Agent运行的基础
针对企业数据和用户隐私保护,如何防止恶意攻击等安全挑战,火山引擎发布两款 AI 安全产品,目前已在联想、中国银联、长安 等众多企业落地。
AICC密态计算:通过用户个人密钥加密、CPU/GPU 硬件可信环境计算、数据流转落盘全密文的方式,在不损失推理效果的前提下,让企业像使用私部模型一样安全合规的使用云端模型。
大模型应用防火墙:通过精调的小参数模型、分层漏斗策略、流式送检机制,保障精准拦截攻击变种,同时不会增加推理延迟,为企业智能体应用构建安全可信的大模型推理空间。