OmniTools 6月1日消息,微软研究院近期发布研究动向,重点推进AI智能体的行为评估方法论,强调通过大规模实证评估验证智能体实际表现。研究指出,在评估过程中,代码库比文档更能有效反映智能体能力。同时,微软呼吁全球研究人员共同参与,协同攻关AI价值对齐这一关键挑战。