
谷歌的 TurboQuant...
以及它对$闪迪(SNDK.US)、$美光科技(MU.US)、SK 海力士和其他公司的影响:
它的作用:
-> KV 缓存内存占用减少 6 倍
-> 在 H100 GPU 上实现 8 倍加速
它是一种压缩算法。
那么...它会打压内存需求吗?
-> 可能不会。
不过,这对$Arm(ARM.US) 和其他可以在本地运行 AI(而不是依赖 DRAM 密集型数据中心)的公司来说,可能是利好消息。
然而:
-> 这基本上算是 DeepSeek 的第三轮。你可以让算法更高效。但这并不能取代内存或 GPU。
-> 它可能在结构上(略微)减少 DRAM 需求。
-> 我认为目前它只在像 Gemma、Mistral 和 Llama-3.1 这样的小模型上进行了测试(而且论文已经发表一年了)。
另外,市场把 DRAM 和 NAND 混为一谈了...这个算法压缩的是 KV 缓存(DRAM)。对 NAND 存储没什么影响?
无论如何:
算法总会变得更高效。人们一直在说杰文斯悖论,这是对的,因为这只会扩大使用场景。
主要需要关注的是超大规模企业的资本支出预测,而不是让事情变得更高效的谷歌算法。
感觉更像是一种叙事上的逆风,而不是对盈利有实质性影响的东西。
来源:Serenity
本文版权归属原作者/机构所有。
当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。


