微软研究聚焦：智能体评估与价值对齐

2026/06/01 14:16

OmniTools 6月1日消息，微软研究院近期发布研究动向，重点推进AI智能体的行为评估方法论，强调通过大规模实证评估验证智能体实际表现。研究指出，在评估过程中，代码库比文档更能有效反映智能体能力。同时，微软呼吁全球研究人员共同参与，协同攻关AI价值对齐这一关键挑战。