富士康开发出台湾首个推理大模型 性能落后于DeepSeek

业界
2025
03/10
15:08
凤凰网科技
分享
评论

富士康

富士康

北京时间3月10日,据《华尔街日报》报道,富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型,性能上落后于DeepSeek的部分大模型。

鸿海周一表示,已自主研发了具备推理能力的人工智能(AI)大语言模型FoxBrain,并在四周内完成训练。FoxBrain最初为公司内部使用而设计,具备数据分析、数学运算、推理以及代码生成的能力。

鸿海称,英伟达通过其台湾超级计算机和技术咨询为鸿海提供了支持,使得大模型训练得以成功完成。该公司表示,计划将该模型开源,以便与行业合作伙伴开展合作,并希望FoxBrain推动制造和供应链管理方面的进步。

鸿海研究院AI研究所所长栗永徽表示,该模型在解决问题时“优先考虑优化训练策略,而不是单纯依赖算力”。鸿海表示,栗永徽的团队使用了120个英伟达H100图形处理单元(GPU),在大约四周时间内完成了FoxBrain的训练。

鸿海已公布了FoxBrain的一些参数,表示它是基于Meta公开可用的大语言模型Llama 3.1的架构构建而成,是台湾地区首个具备先进推理能力的大语言模型,专为台湾地区使用的繁体中文而设计和优化。鸿海称,FoxBrain的性能略逊于DeepSeek的部分模型,但已接近世界一流水平。该公司表示,更多相关信息将在今年3月中旬的英伟达年度技术大会上公布。

富士康是鸿海的产品代工子公司,因组装苹果公司的iPhone而被外界熟知。鸿海在核心电子制造业务方面正面临产业转型以及盈利能力下降所带来的挑战,已开始向AI、电动 等领域拓展业务。

【来源:凤凰网科技

THE END
广告、内容合作请点击这里 寻求合作
富士康 DeepSeek
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map