DeepSeek發(fā)布梁文鋒署名新論文 開源相關(guān)記憶模塊Engram
2026-01-13 09:12   
來源: 云財(cái)經(jīng)   
影響力評(píng)估指數(shù):17.05  
云財(cái)經(jīng)訊,DeepSeek于12日晚發(fā)布新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可擴(kuò)展查找的條件記憶:大型語言模型稀疏性的新維度)。該論文為北京大學(xué)與DeepSeek共同完成,合著作者署名中出現(xiàn)梁文鋒。論文提出條件記憶(conditional memory),通過引入可擴(kuò)展的查找記憶結(jié)構(gòu),在等參數(shù)、等算力條件下顯著提升模型在知識(shí)調(diào)用、推理、代碼、數(shù)學(xué)等任務(wù)上的表現(xiàn)。同時(shí),DeepSeek開源相關(guān)記憶模塊Engram。
| 新聞標(biāo)題 | 時(shí)間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| 熵基科技子公司公布新專利,可通過腦波數(shù)據(jù)確定情緒 | 今天 11:09 | 云財(cái)經(jīng) |
|
| 伊朗塔斯尼姆通訊社指責(zé)美國(guó)查封其網(wǎng)絡(luò)域名 | 今天 04:51 | 云財(cái)經(jīng) |
|
| 如果首相高市早苗在選舉中取得決定性勝利,日元可能走軟 | 01-12 23:03 | 云財(cái)經(jīng) |
|
| 固高科技:公司不涉及與微納星空建立戰(zhàn)略合作關(guān)系等事項(xiàng) | 01-12 22:05 | 云財(cái)經(jīng) |
|
| 2025年盧旺達(dá)咖啡出口收入創(chuàng)新高 | 01-11 15:11 | 云財(cái)經(jīng) |
|
| 阿根廷中部森林火災(zāi)蔓延 過火面積逾5500公頃 | 01-11 08:24 | 云財(cái)經(jīng) |
|