Hugging Face发布PEFT基准测试，LoRA并非所有场景最优选择

OmniTools 6月18日消息，Hugging Face近日在其博客发布PEFT（参数高效微调）技术基准测试结果，涵盖大语言模型数学推理与图像生成两大任务。测试在统一硬件、数据集和代码条件下对比LoRA及OFT、BEFT、Lily等十余种PEFT方法，发现LoRA虽表现稳健，但在部分指标上并非最优：例如在图像生成任务中，OFT以0.708的DINO相似度得分和9.01GB显存占用，同时优于LoRA的0.697得分与9.97GB显存消耗。

在LLM数学推理任务（GSM8K）中，LoRA（经秩稳定初始化）达53.2%准确率、峰值显存22.6GB，但Lily以54.9%准确率略胜，BEFT则以20.2GB显存实现32.9%准确率，三者共同构成帕累托前沿。研究指出，标准LoRA（未经优化初始化）仅达48.1%准确率，建议用户优先采用改进变体。

Hugging Face强调，论文宣称的性能优势常受限于非统一实验设置与调参偏差，实际选型应基于自身硬件约束与核心指标（如显存、推理速度、检查点大小）开展实测。其PEFT库已支持一键切换配置并复现全部基准，相关结果持续更新于公开Space中。