谷歌新算法声称能“6倍压缩KV缓存” 美股存储板块承压走弱

业界
2026
03/26
10:20
财联社
分享
评论

3月25日讯  周三美股开盘后,在大盘情绪尚可的背景下,存储板块却反向走弱。截至发稿,美光科技跌3.57%、闪迪跌4.12%,西部数据和希捷科技也一同下跌。

image

(美光科技日线图,来源:TradingView)

对于今日的市场异动,有多处信源均将矛头指向了谷歌。AI巨头早些时候推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。

image

(来源:谷歌研究)

根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。

TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果。

image

此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。研究人员也表示,这项技术的应用不局限于AI模型,还包括支撑大规模搜索引擎的向量检索能力。

谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。

不难看出,虽然该技术的应用前景目前仍需要打一个问号,但市场已经开始交易内存需求前景转变的预期。

对于最新变化,富国银行TMT分析师Andrew Rocha解读称:“随着上下文窗口不断扩大,KV缓存中的数据存储规模呈爆炸式增长,从而推高对内存容量的需求。而TurboQuant正是在直接压缩这一成本曲线。如果该技术能够得到广泛采用,这对内存成本曲线而言将是利好。”

Rocha同时表示,这项技术可能影响未来对内存容量规格的需求判断。

他写道:“如果实现这些AI应用所需的内存规格被显著降低,那么市场很快就会重新评估究竟还需要多少内存容量。”

不过Rocha也指出,目前仍不清楚该技术是否仅适用于谷歌自身体系,或能否推广至其他AI实验室。此外,实验室环境下的测试结果是否能够顺利转化为真实生产环境中的应用表现,也存在不确定性。

值得一提的是,作为搅动存储板块的事主,谷歌也没捞着什么好处。公司股价在周三一度跌破290美元,据2月初创下的349美元历史高点已经回撤近17%,距离20%的关键心理位置也只有咫尺之遥。

image

(谷歌-A日线图,来源:TradingView)

【来源:财联社

THE END
广告、内容合作请点击这里 寻求合作
谷歌
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

北京时间3月20日,据《商业内幕》报道,谷歌已告知员工,公司确信与美国国防部的合作符合公司的AI原则,并且会“更加侧重于”与各国政府开展国家安全合作。
业界
3月13日讯 Alphabet正对其地图产品进行十多年来的最大一次升级,公司在谷歌地图(Google Maps)中推了名为“Ask Maps”的新功能,用户可以像与聊天机器人对话一样与应用互动。
业界
3月10日,谷歌DeepMind推出Gemini Embedding 2,这是该公司首个原生多模态嵌入模型,将文本、图像、视频、音频及文档统一映射至单一嵌入空间,标志着AI嵌入技术迈入全模态融合的新阶段。
业界
北京时间3月11日,据《纽约时报》报道,当地时间周一,美国参议院的一名高层管理人员批准助手们在公务中使用三款AI聊天机器人。
业界
北京时间3月10日,据《连线》杂志报道,30多名OpenAI、谷歌员工在周一提交了一份法庭之友意见书,以支持Anthropic与美国政府的法律斗争,其中包括谷歌旗下DeepMind首席科学家杰夫·迪恩(Jeff Dean)。
业界

相关推荐

1
3
Baidu
map