OmniTools 5月29日消息,FaceMind团队通过覆盖100种语言、涵盖四大核心任务的实验证实,在保持语义不变前提下,使用预训练语料中出现频率更高的词汇构建提示词或开展微调,能显著提升大语言模型性能。 该现象被归纳为Adam's Law(文本频率定律),首次将“词频”作为独立维度引入数据工程实践。 研究指出,高频表达使模型更倾向于在其训练中高频出现的概率分布区域内生成响应,从而提升输出稳定性与质量。