迎头挑战还是换赛道?英媒:DeepSeek让所有同行陷入抉择

业界
2025
03/25
15:32
凤凰网科技
分享
评论

DeepSeek与同行

DeepSeek与同行

3月25日,金融时报发文,随着竞争对手DeepSeek的技术在国内广泛应用,中国的AI初创企业正在全面调整其商业模式,以保持竞争力。

据两位知情人士透露,曾被视为中国最杰出的大语言模型初创企业智谱,在专注于拓展企业销售业务的同时,将希望寄托于首次公开募股(IPO),以维持其高资金投入的增长模式。

在中国其他领先的生成式人工智能初创企业中,由李开复创办的零一万物已停止大语言模型的“预训练”,转而专注于利用DeepSeek的模型销售定制化人工智能商业解决方案;百川智能选择专注于医疗保健市场;月之暗面则大幅削减其Kimi聊天机器人的营销预算,将重点放在模型训练上。

接近这些公司的人士表示,这些转变显示出DeepSeek是如何极大地改变了中国新兴人工智能产业的格局。这些公司均拒绝置评或未回应置评请求。

自1月底推出具有突破性的R1模型以来,这家总部位于杭州的初创企业迅速被视为中国的人工智能领军者,其技术从医院到地方政府迅速得到广泛应用。

这使得中国一些顶尖的人工智能初创企业不得不重新评估其现有战略,试图复制DeepSeek的成功。在过去两年的人工智能热潮中,这些初创企业曾获得国内投资者的大力支持。

人工智能研究中心Hugging Face的工程师王铁震表示:“中国的大语言模型市场正在迅速向少数几家领先企业集中。DeepSeek促使许多公司将资源重新导向应用领域,而非基础模型开发。”

总部位于北京的零一万物已在李开复所称的“DeepSeek 时代”调整了业务方向。该公司曾推出了一系列名为“Yi”的开源模型,由于竞争对手训练的模型越来越大、功能越来越强,成本不断上升,零一万物在2024年底停止了预训练。据知情人士透露,在与阿里巴巴达成的一项交易中,其基础模型团队被转移至这家互联网巨头。

上周,零一万物宣布将向希望部署DeepSeek模型的企业销售定制化人工智能解决方案。零一万物将其在所谓“混合专家模型”方面的专业知识作为竞争优势进行推广,DeepSeek也采用了这种方法来训练模型。

DeepSeek决定专注于研究,而不是通过向企业销售应用程序来实现收入最大化,这为零一万物这样的中介机构留下了市场空间。互联网巨头百度最近几周也转向提供同样的服务。

月之暗面去年因其广受欢迎的人工智能聊天机器人Kimi而备受关注,但随着频繁的服务中断以及竞争对手推出有竞争力的产品,Kimi的人气受到了影响。

据两位知情人士透露,最近几周,这家初创企业削减了Kimi的营销支出,转而更加专注于模型训练,以复制DeepSeek的突破性成功并提升聊天机器人的性能。

但随着Kimi被其他应用超越,月之暗面在没有稳定收入的情况下投入资金进行模型训练,前景充满不确定性。该初创企业试图通过邀请用户向聊天机器人背后的人工智能角色“Kimi”赠送虚拟礼物来盈利。

据知情人士透露,去年,月之暗面通过两轮融资筹集了超过13亿美元,其中包括来自中国科技巨头阿里巴巴的计算资源以及风险投资公司的现金。

这些人士称,2024年初,阿里巴巴曾将月之暗面视为潜在的收购目标,并在8亿美元的投资中获得了未来任何出售时的优先购买权。近几个月来,在创始人马云指示首席执行官吴泳铭专注于内部人工智能业务后,阿里巴巴收紧了对初创企业的投资。这些人士补充称,这一转变使得阿里巴巴未来收购Kimi的可能性降低。

总部位于北京的初创企业百川智能此前曾致力于面向消费者的人工智能聊天机器人,并向教育、金融和医疗保健企业推销企业业务,如今已将医疗保健业务作为重点。

据两位知情人士透露,今年2月,百川智能解散了专注于向银行和投资基金销售定制化金融人工智能应用的销售团队,并终止了该业务线。

当时,公司管理层向员工宣布,将专注于为医院开发技术,包括协助诊断的人工智能医生。

相比之下,由清华大学知名计算机科学家唐杰创办的智谱仍在推进多条业务线。它推出了几款面向消费者的应用程序,以及一项向地方政府和企业销售个性化人工智能应用的企业业务。

随着企业销售业务的拓展,这家初创企业一直在大量消耗资金。据三位了解相关数据的投资者透露,2024年,智谱实现销售额3亿元人民币,亏损20亿元人民币。

在DeepSeek展示了以较低预算打造尖端模型的途径后,不断膨胀的成本引发了一些投资者的担忧。与DeepSeek约160人的小团队相比,智谱雇佣了约800人,按员工数量计算是最大的大语言模型初创企业。

据两位了解情况的人士称,智谱此前曾告诉投资者,目标是在今年年底前上市。但他们补充称,如果推进IPO,DeepSeek的发展可能会对其产生影响。

金融时报表示,DeepSeek已然撼动了中国的人工智能竞争格局,导致一些竞争对手不得不决定是直接挑战该公司,还是采用其开源模型,专注于较小的潜在市场。

【来源:凤凰网科技

THE END
广告、内容合作请点击这里 寻求合作
DeepSeek
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

3月20日消息,昨日晚间,大模型训练、开发平台Predibase发布了首个端到端强化微调平台(RFT)。
业界
3月17日消息,@小米技术官微今日发文称,小米大模型团队在音频推理领域取得突破性进展。
业界
3 月 11 日午间消息,继此前宣布支持 DeepSeek 后,亚马逊云科技今日再次宣布在 Amazon Bedrock 上线完全托管的满血版 DeepSeek-R1,首次将该模型作为完全托管服务推出,进一步扩展了客户在 Amazon Bedroc...
业界
3 月 10 日消息,据证券日报昨日晚间报道,格力董明珠透露:“格力电器已成功将自有的多模型框架与 DeepSeek R1 满血版大模型 融合。”
业界
北京时间3月10日,据《华尔街日报》报道,富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型,性能上落后于DeepSeek的部分大模型。
业界

相关推荐

1
3
Baidu
map