谷歌推出壓縮算法TurboQuant 宣稱實(shí)現(xiàn)約6倍內(nèi)存節(jié)省
2026-03-26 11:00   
來源: 云財經(jīng)   
影響力評估指數(shù):16.38  
相關(guān)股票:
云財經(jīng)訊,谷歌近日推出了一種可能降低人工智能(161631)系統(tǒng)內(nèi)存需求的壓縮算法TurboQuant。根據(jù)谷歌介紹,TurboQuant壓縮技術(shù)旨在降低大語言模型和向量搜索引擎的內(nèi)存占用。該算法主要針對AI系統(tǒng)中用于存儲高頻訪問信息的鍵值緩存(key-value cache)瓶頸問題。隨著上下文窗口變大,這些緩存正成為主要的內(nèi)存瓶頸。TurboQuant可在無需重新訓(xùn)練或微調(diào)模型的情況下,將鍵值緩存壓縮至3bit精度,同時基本保持模型準(zhǔn)確率不受影響。對包括Gemma、Mistral等開源模型的測試顯示,該技術(shù)可實(shí)現(xiàn)約6倍的鍵值緩存內(nèi)存壓縮效果。此外,在英偉達(dá)H100加速器上的測試結(jié)果顯示,與未量化的鍵向量相比,該算法最高可實(shí)現(xiàn)約8倍性能提升。研究人員也表示,這項技術(shù)的應(yīng)用不局限于AI模型,還包括支撐大規(guī)模搜索引擎的向量檢索能力。谷歌計劃于4月的國際學(xué)習(xí)表征會議(ICLR 2026)上展示TurboQuant技術(shù)。
云財經(jīng)智能匹配相關(guān)概念
| 新聞標(biāo)題 | 時間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| 35周年司慶季臻心之作:中國太保壽險“頤護(hù)添年”保障計劃上市 | 今天 17:45 | 商業(yè)新聞 |
|
| 國務(wù)院任命香港特別行政區(qū)政府政制及內(nèi)地事務(wù)局局長 | 今天 09:14 | 云財經(jīng) |
|
| 美國華盛頓舉行集會 抗議美以對伊朗軍事行動 | 03-29 11:57 | 云財經(jīng) |
|
| 春假疊加清明假期出行熱度高漲 | 03-29 09:32 | 云財經(jīng) |
|
| 特朗普的一些年輕支持者因伊朗戰(zhàn)爭問題轉(zhuǎn)而反對他 | 03-29 04:13 | 云財經(jīng) |
|
| 泰國就本國油輪通行霍爾木茲海峽與伊朗達(dá)成協(xié)議 | 03-28 14:41 | 云財經(jīng) |
|