Google DeepMind推出AlphaProof Nexus：融合LLM与Lean实现数学证明形式化验证

OmniTools 5月23日消息，Google DeepMind提出AlphaProof Nexus系统，将大型语言模型（LLM）与Lean形式化验证工具深度集成。该系统支持LLM在生成数学证明过程中实时读取Lean编译错误并动态修正，同时可调用更强工具辅助解决子问题。

该机制要求模型每一步推理均转化为可编译、可验证的代码，使其角色从“令人信服的叙述者”转向“候选方案生成器”。在353个Erdős问题和492个开放猜想的测试中，系统成功解决9个Erdős问题，并证明44个序列猜想。

研究凸显形式化验证在识别AI逻辑缺陷、构建“人类提问—模型探索—验证器把关”新型协作范式中的关键价值。