返回行业动态

Δ-Mem:新型在线内存系统可降低大模型70%内存占用

2026/05/16 14:22
查看原文

OmniTools 5月16日消息,研究人员提出一种名为Δ-Mem的高效在线内存系统,专为大型语言模型设计。该系统通过仅存储和更新模型激活值的增量变化,而非完整激活状态,显著压缩内存需求。

实验显示,Δ-Mem可将内存使用量减少高达70%,同时保持模型输出质量基本无损。

该技术有望提升大模型在资源受限环境下的在线推理与持续学习能力。