吉利、阶跃星辰开源两款大模型：一个参数最大、一个最懂中国话！

业界

2025

02/18

11:32

快科技

2月18日消息，阶跃星辰、吉利集团联合宣布，双方合作的阶跃两款Step系列多模态大模型，正式向全球开发者开源，即日起可在跃问APP内体验。

其中，阶跃Step-Video-T2V是目前全球范围内参数量最大、性能最好的开源视频生成模型，阶跃Step-Audio则是行业内首款产品级的开源语音交互大模型，堪称最懂中国话。

阶跃星辰(StepFun)是吉利集团的科技生态战略合作伙伴，公司成立于2023年4月，总部位于上海，由微软前全球副总裁姜大昕担任CEO，致力于实现AGI（通用人工智能），2024年下半年其多模态API的调用量增长超45倍。

阶跃Step-Video-T2V的参数量达到300亿，可以直接生成204帧、540p分辨率的高质量视频。

在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入、镜头语言等方面，它都具备强大的生成能力，而且语义理解和指令遵循能力突出。

网页端体验链接：https://yuewen.cn/videos

同时，阶跃星辰还发布并开源了针对文生视频质量评测的新基准数据集Step-Video-T2V-Eval，包含128条源于真实用户的中文评测问题，可评估生成视频在运动、风景、动物、组合概念、超现实、人物、3D动画、电影摄影等11个内容类别上质量。

评测结果显示，阶跃Step-Video-T2V的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面的表现，均显著超过市面上既有的效果最佳的开源视频模型。

阶跃Step-Audio能够根据不同的场景需求，生成情绪、方言、语种、歌声和个性化风格的表达，能够和用户自然地高质量对话。

模型生成的语音具有超自然、高情商等特征，同时也能实现高质量的音色复刻并进行角色扮演，满足影视娱乐、社交、游戏等行业场景下应用需求。

在LlaMA Question、Web Questions等五大主流公开测试集中，阶跃Step-Audio的行均超过了行业内同类型开源模型，位列第一。

尤其是在HSK-6（汉语水平考试六级）评测中的表现尤为突出，堪称最懂中国话的开源语音交互大模型。

阶跃星辰还自建并开源了多维度评估体系StepEval-Audio-360基准测试，从角色扮演、逻辑推理、生成控制、文字游戏、创作能力、指令控制等9项基础能力的维度，对开源语音模型进行评测。

人工横评结果显示，阶跃Step-Audio的模型能力十分均衡，且在各个维度上均超过了此前市面上效果最佳的开源语音模型。

值得一提的是，Hugging Face联合创始人、CEO Clement Delangue也对阶跃星辰的大模型称赞不已，认为他将是下一个DeepSeek。

【来源：快科技】

THE END

广告、内容合作请点击这里寻求合作

吉利

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表的观点和立场。

相关热点

与DeepSeek 融合后，吉利将于3月初发布AI智

2 月 10 日消息，继吉利星睿大模型与 DeepSeek 完成融合之后，吉利集团 CEO 淦家阅在 2 月 9 日的 2025 年度经营工作大会上宣布，将于今年 3 月初对外发布重磅 AI 智能化战略。

业界

吉利：不建议日常用车经常将电量消耗至0%，减少

11 月 20 日消息，吉利银河新能源昨日发布吉利银河 E5 答网友问第十六期，就日常用车的电池建议、不同设备端充电功率显示差异等问题进行了解答。

业界

吉利牛仔“轻越野”SUV车型将搭载星纪魅族Flyme Aut

11 月 13 日消息，吉利昨日下午公布了旗下首款“轻越野”SUV 车型 —— 吉利牛仔部分规格信息：新车将提供四种户外场景车色，搭载 12 纳米工艺、8 核 CPU 的 E02 座舱芯片。

业界

吉利全新雷神超级电混定档10月30日发布：实测极限续

10月25日消息，吉利宣布，全新一代雷神超级电混技术，将于10月30日发布。

业界

2025款吉利熊猫卡丁、骑士车型亮相：配备主副驾安全

10 月 21 日消息，吉利今日发布了 2025 款吉利熊猫卡丁、骑士两款车型的官图，新车在内饰、续航、主被动安全等方面预计带来提升，将于 11 月正式上市。

业界

吉利、阶跃星辰开源两款大模型：一个参数最大、一个最懂中国话！

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 电池

关注我们

吉利 、阶跃星辰开源两款大模型：一个参数最大、一个最懂中国话！

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 电池

关注我们

吉利、阶跃星辰开源两款大模型：一个参数最大、一个最懂中国话！