Mamba共1篇
Mamba-3发布:状态更小、解码更快的新型SSM模型-象者信息AI集锦

Mamba-3发布:状态更小、解码更快的新型SSM模型

近日,卡内基梅隆大学、普林斯顿大学与Together AI等机构联合推出全新状态空间模型(SSM)——Mamba-3。该模型在保持强大语言建模能力的同时,将隐状态规模压缩至前代的一半,显著降低内存占用...
daxiang的头像-象者信息AI集锦daxiang25天前
04214