OmniTools 5月19日消息,近日,团队将Mythos等聚焦安全的大语言模型应用于关键基础设施的实时代码测试。测试表明,此类模型在漏洞识别与代码审计方面具备优势,尤其在复杂逻辑中发现潜在风险的能力较为突出。 与此同时,测试也暴露出其局限性,包括存在误报现象,以及对上下文的理解稳定性不足。 报告指出,在将此类安全大语言模型推广至更大规模应用前,需构建可靠的工作流程,涵盖持续验证与人工复核机制。