为应对企业数据处理从单一模态向多模态需求的转变,火山引擎多模态数据湖方案持续升级。
8月13日,在 FORCE Link AI 创新巡展·青岛站,火山引擎宣布旗下产品AI 数据湖服务 LAS 上线“算子广场”,该功能进一步增强了企业对文本、图像及音视频的处理能力,加速企业知识资产的自动化流通与增值。
今年6月,火山引擎发布了AI数据湖服务LAS,作为大模型时代的数据底座,LAS适配多模态数据,提供湖存储、湖管理、湖计算三大核心能力,助力企业释放数据资产的全部价值。火山引擎数据产品解决方案负责人萧然表示:"企业数据就像冰山,水面上能用的结构化数据只是小部分,水面下90%以上的非结构化数据长期‘沉睡’,每年消耗IT成本却无法产生价值。”
算子广场的推出,大幅降低了多模态数据处理的开发门槛。通过将复杂的AI算法封装成预置算子,企业无需从零开发,即可快速构建数据处理流程。
“算子广场”将文档解析、OCR 识别、视频合成等用于处理数据的复杂 AI 能力进行封装,提供了丰富的算子库:其中包含100余种即插即用的标准化算子;集成主流开源算子库,同时提供完整的开发框架,支持用户封装自定义算子,全面覆盖文本、图像、音视频等多模态数据处理场景。
用户通过可视化拖拽,即可快速编排模块化工作流,无需编写复杂代码。这一开发方式使得多模态数据的开发难度大幅降低,减轻了企业对专业数据科学家和算法工程师的依赖。借助语义分块、OCR识别、AI工作流编排等核心能力,企业能够轻松将分散数据转化为知识资产,真正实现从技术门槛到业务价值的跨越。
以社交平台智能化内容审核为例,传统人工审核面临海量内容导致的效率瓶颈、人力成本高昂,以及内容遗漏带来的合规风险。
火山引擎为该企业提供了多模态数据湖方案,在算子广场能力的支撑下构建了自动化审核体系:
1.视频逐帧解析: 自动抽取关键帧,分离画面、音频及字幕文本;
2.多模态特征提取: 利用OCR、语音识别、图像分析等算子提取文本、语音和视觉特征;
3.融合判定决策: 结合多模态模型联合分析特征,精准识别风险内容。
实际应用效果显示,该方案将内容审核覆盖率提升至99.5%,对非结构化音视频数据识别的准确性与时效性都显著提升,大幅减少了人工复审工作量。算子广场的可视化编排功能还可适应审核策略的灵活调整提供,帮助平台快速应对新出现的违规内容类型。
算子广场的推出,进一步完善了火山引擎多模态数据湖解决方案的能力版图。针对AI应用开发面临的多模态数据整合难、技术门槛高、资源调度复杂等挑战,火山引擎多模态数据湖解决方案支持全类型数据统一处理,并 集成主流大模型快速部署场景化应用,通过基于任务类型的动态资源调度技术,保障高并发性能。
该方案切实降低了AI应用开发门槛,提升数据处理效率与智能化水平,支撑企业在内容安全、知识管理等场景实现效能突破。随着数据处理能力向智能化、自动化持续演进,多模态数据湖正成为企业释放数据价值的关键路径。