8月21日,2024火山引擎 AI 创新巡展在上海举办,带来豆包大模型的一系列产品升级。豆包语音模型和视觉模型再升级,对话式 AI 实时交互解决方案进一步强化 AI 交互体验。此外,火山引擎携手多点 DMALL 成立了零售大模型生态联盟,同时介绍了 大模型生态联盟最新进展,宣布 AI 创造者大赛开赛。来自沐瞳、浙江大学等单位的嘉宾就与火山引擎合作、落地大模型的实践进行了分享。
火山引擎总裁 谭待
火山引擎总裁谭待表示,豆包大模型获得众多行业客户青睐,模型能力也在持续提升。最新版豆包大语言模型的综合能力相比三个月前首次发布时提升了20.3%,豆包·文生图模型、豆包·语音识别模型等模型也有大幅升级,对话式 AI 实时交互解决方案整合了豆包大模型和实时音视频(RTC)技术,为用户提供更顺畅、自然的交互体验。
01.
豆包大模型使用量爆发
综合能力提升20.3%
“大的使用量,才能打磨好模型,好的模型又会吸引更多人使用”。据谭待介绍,自5月15日正式对外发布以来,豆包大模型的日均 tokens 使用量已经超过5,000亿,平均企业客户使用量增长了22倍。期待越来越多的 AI 原生企业、越来越多的 AI 转型企业在豆包大模型上快速发展。
基于内外客户广泛、真实的业务需求,豆包大模型在关键能力上不断迭代优化。公开及内部测评集显示,最新版豆包大语言模型相比发布初期综合能力提升了20.3%。其中,角色扮演能力提升了38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。语言理解能力提升了33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生产力场景中得到应用。此外,模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。
会上还公布了多个豆包垂类模型的最新升级。其中,豆包·文生图模型对长文本有更精准的图文匹配能力,多主体、多位置、手部结构等复杂场景的生图能力更强,更善于理解中国特色元素,创造更具美感的中国风图片。豆包·语音识别模型基于大语言模型丰富的知识和推理能力,通过上下文感知,提升语音识别准确性,在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%;支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。豆包·语音合成模型升级了流式语音合成能力,能够实时响应、精准断句,支持“边想边说”。
此外,火山引擎发布对话式 AI 实时交互解决方案,该方案整合了豆包大模型和实时音视频(RTC)技术,提供端到端的大模型实时对话方案。企业可以轻松地在自己 AI 应用中嵌入该实时语音功能,用户不仅能用语音与 AI 进行交谈,还能像平时说话一样,在对话过程中适时打断或插话,经过升级后的 AI 声音具备较好表现力和感情色彩,对话更自然、更真实、更流畅,让大模型交互体验更强。
除了模型效果,针对企业生产环境对 AI 高并发需求出发,豆包通用模型pro 提供了国内最高标准的 800k 初始 TPM(每分钟处理 tokens 数量),保障了企业不仅用得便宜,还用得放心。例如,在客户高并发的对话场景要求下,火山引擎帮助客户完成多轮提示词优化,并且提供高并发保障,帮助客户应对高峰场景。
02.
零售大模型生态联盟成立
大模型生态联盟持续壮大
大模型应用落地不仅需要技术成熟度,还要有适配的商业组织和商业生态。为此,火山引擎携手多点 DMALL 成立零售大模型生态联盟,通过融合豆包大模型与 AI 能力,让零售企业能够以极低的试错成本将大模型技术应用到业务场景中,推动零售行业的智能化升级,提升行业的整体效能和创新能力,以适应不断变化的市场需求和消费者行为,加速零售行业的创新步伐。
谭待表示,火山引擎致力于与行业伙伴共同建立一个零售大模型生态联盟,探索更多场景的 AI 重构,将大模型应用推广到零售产业链各环节中,加速零售业的运营和周转效率,全面提升消费者的购物体验。
零售大模型生态联盟正式发布
物美集团、抖音电商、抖音生活服务、百胜、麦当劳、中国飞鹤、海底捞、居然之家、南7-11、重庆百货、百果园、波司登、天虹、三得利、绝味、名创优品、NielsenIQ、电通共18家零售联盟首批成员单位出席了当天的联盟启动仪式。
多点 DMALL 创始人、物美集团创始人 张文中博士
多点 DMALL 创始人、物美集团创始人张文中博士指出,零售大模型生态联盟对于零售企业来说是抱团取暖,共享联盟内的技术成果和最佳实践,降低企业成本,是当下零售企业拥抱 AI 的最好选择。“我们必须全面拥抱 AI,不仅是为了更好的未来,而且是为了生存”,张文中博士说。
火山引擎 行业总经理 杨立伟
除零售大模型生态联盟外, 大模型生态联盟也迎来了领克 、吉利银河、几何 、上汽荣威、上汽名爵、雄狮科技、大圣科技等多位新成员。火山引擎 行业总经理杨立伟介绍,当前,火山引擎正与联盟成员就新一代 AI 行业定义、行业评测标准发布以及跨终端行业交流和共创等方向进行密切协作。
火山引擎 AI 创造者大赛启动
此外,火山引擎还宣布首次举办 AI 智能体商业赛事“火山引擎 AI 创造者大赛”,本次大赛由火山引擎携手领克 与英特尔联合主办、吉利研究院协办,鼓励开发者及技术爱好者利用豆包大模型和扣子专业版,针对领克 的真实业务场景,开发出具有实际应用价值的智能体解决方案。
吉利 集团营销数字中心负责人 沈稳杰
吉利 集团营销数字中心负责人沈稳杰介绍,在豆包大模型帮助下,领克 实现了智慧邀约坐席、AI 对练&内训、AI 销售助手、智慧经营报表以及 AI 用车说明书等多项基于模型能力的功能,以大模型为销售顾问提供诸如实时数据分析、客户行为预测、客户对练和评价总结以及个性化销售策略建议等服务,通过模拟销售场景中客户对话,帮助销售顾问提升问题应对能力,全面提升了销售能力。
03.
全栈AI服务升级
大模型落地再提速
为了帮助企业将大模型能力与业务场景需求进行适配,火山引擎公布一系列产品升级,帮助企业更便捷地落地大模型。
火山引擎智能算法负责人、火山方舟负责人 吴迪
火山引擎智能算法负责人、火山方舟负责人吴迪介绍,一站式大模型服务平台火山方舟最新推出全周期安全可信方案,支持身份认证、数据保密、环境隔离等,构建大模型安全“堡垒”。联网、内容插件能力再升级,提升搜索能力、可获取更多优质内容,RAG 知识库插件进一步强化,更强知识库文档解析与检索能力,支持丰富场景,令企业应用更为灵活自如。
智能体将是企业未来应用的关键载体,大模型时代,只有让不同类型的企业快速、灵活的构建企业级智能体,模型才能真实在业务中落地。扣子专业版让企业实现一句话“捏个 Bot”的对话型智能体,也能实现通过低代码编排构建复杂的专家型 Bot。同时,扣子专业版还为企业用户提供专业级 SLA、接入更多模型、以及更高配额。扣子专业版发布1个月时间,共计新增1万多用户开通服务,日均调用量达到50万次。
沐瞳智能服务负责人 张文文
沐瞳智能服务负责人张文文提到,沐瞳与火山引擎携手探索 AI+智能应用服务化方向,将豆包大模型能力应用于旗下游戏的 AI 实时判罚场景,基于游戏内聊天文本对辱骂/攻击性发言进行识别。在此过程中,豆包大模型表现出效果好、成本省、收益正、服务优等明显优势。沐瞳将会继续与火山引擎合作,以大模型能力优化游戏开发、提升游戏品质,为玩家创造更多激动人心的体验。
火山引擎副总裁 张鑫
火山引擎副总裁张鑫介绍了企业专属 AI 应用创新平台 HiAgent 的最新能力。HiAgent 支持通过混合部署方案让知识库留在本地,企业可以根据业务需求选择调用云上或本地的模型,还能通过其内置的大模型防火墙和数据防泄密机制确保数据安全;HiAgent 还为客户提供了企业专属的定制扩展能力,支持将开发出来的 Agent 与原有的业务系统进行灵活集成。
浙江大学求是特聘教授、信息技术中心主任 陈文智
浙江大学求是特聘教授、信息技术中心主任陈文智表示,在自研 OpenBuddy 模型,以及豆包大模型等极具性价比的商业模型及智能体的共同赋能下,浙大创建了“浙大先生”智能体应用开发平台,并搭建了 AI 科学家、慧学外语、AI 百事通、数字教师等多个大模型校园应用场景。后续浙大将继续携手火山引擎,共同打造每个人的 AI 专属智能体,为校园带来交互模式、知识复用、数据连接以及决策创新等更多方面变革。
火山引擎云基础产品负责人 罗浩
大模型从探索走向应用,云基础设施的支撑不可或缺。火山引擎云基础产品负责人罗浩表示,火山引擎 AI 全栈云依托与字节跳动的海量资源共池,从诞生起所有 IaaS、PaaS 层资源,以及推荐算法、数智平台等中台体系产品,都生长于同一朵云上。数据中心、软硬件基础架构的统一,避免了“算力孤岛”和“数据孤岛”问题,结合火山引擎自研服务器、自研 DPU 卡、调度算法等技术能力,火山引擎 AI 全栈云在性能、稳定性和成本上具备了更大的优势。在模型推理场景中,可针对不同体量模型,提供类型丰富、灵活供应的海量 GPU 推理资源;支持超低延时调用豆包大模型,访问质量稳定可控。
通过强化豆包大模型“更强模型、更低价格、更易落地”的优势、成立行业联盟、推动生态共建,火山引擎将持续帮助企业加速落地 AI 能力,驱动商业模式变革,为行业的未来发展注入新的动力。下一站,2024火山引擎 AI 创新巡展将来到天津,带来更多 AI 创新升级,携手企业客户推进 AI 转型。