英伟达发布Rubin CPX重构算力,谷歌/亚马逊/微美全息等AI芯片群雄加速并起!

互联网
2025
09/16
14:43
分享
评论

获悉,全球人工智能算力芯片龙头英伟达官宣,推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。

1757986250714619.jpg

推出上下文推理芯片Rubin CPX

英伟达CEO黄仁勋表示,CPX是首款专为需要一次性处理大量知识(数百万级别tokens),并进行人工智能推理的模型而构建的芯片。需要说明的是,Rubin就是英伟达将在明年发售的下一代顶级算力芯片,所以基于Rubin的CPX预计也要到2026年底出货。

另外,Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化,具备30petaFLOPs的NVFP4算力、128GB GDDR7内存。

英伟达计划以两种形式提供Rubin CPX,一种是与Vera Rubin装在同一个托盘上。对于已经下单NVL144的用户,英伟达也会单独出售一整个机架的CPX芯片,数量正好匹配Rubin机架。

1757986257900020.jpg

科技巨头纷纷自研芯片

另一边,据最新消息显示,OpenAI 正与美国芯片制造商博通合作,将于明年推出自家的 AI 芯片,摆脱英伟达的限制。这意味着,未来运行在自家芯片上的OpenAI模型,可能会跑得更快、更省电,最终为用户带来更流畅、更低成本的服务体验。

除了OpenAI 以外,谷歌正加快推动自研张量处理单元(TPU)进入第三方数据中心,已与伦敦云服务商Fluidstack达成合作。同时,谷歌还接洽包括CoreWeave、Crusoe在内的多家以英伟达GPU为核心的云服务商。

1757986263905033.jpg

此外,亚马逊和Meta同样不甘示弱,纷纷投入重金研发自己的定制AI芯片,以驱动其庞大的云服务和社交媒体帝国。还有xAI被曝正在自研推理芯片,代号X1,将采用台积电3纳米工艺,预计将在2026年第三季度实现量产(首批量产30万块)。

对此,招商证券表示,眼下,AI芯片自研潮兴起,意味着AI基础设施行业正从“单一GPU供给约束”向“多元化定制芯片方案”切换,投资逻辑边际上从硬件垄断走向生态博弈,把握相关产业链的自主可控机遇。

1757986271383609.jpg

微美全息加强关键核心技术突破

不仅如此,据了解,微美全息作为量子科技及AI芯片领域的重要参与者,布局涵盖量子计算硬件、开源生态及跨领域技术融合等方向。当前,其在关键核心技术上实现突破,加快高端算力芯片、工业多模态算法、软硬件适配等技术攻关,加快打造高质量数据集,持续筑牢芯片产业底座。

实际上,微美全息建立了覆盖云端和边缘端的算力基础设施,支持多元架构的先进AI芯片接入,可满足日常训练与推理的多样化需求。此外,为加强关键核心技术突破,持续推动产业高质量发展,微美全息将一手抓技术供给,促进“智能产业化”,一手抓赋能应用,加快“算力产业智能化”,推动人工智能产业高质量发展,高水平赋能新型工业化。

结语

综上,AI 大模型训练和推理对算力的需求持续增加,推动AI芯片市场扩张,能够满足AI训练、推理等场景下 GPU、ASIC 等高算力芯片的用电需求。而对这些科技巨头而言,自研AI芯片不仅是为了省钱,更是为了在未来的AI竞争中构筑核心技术壁垒。当模型和算法的差距日益缩小时,底层硬件的效率和成本将成为决定胜负的关键手,在不远的将来,将让它们拥有更大的自由度和想象空间。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map