Mythos等安全大模型在关键基础设施代码测试中展现能力与局限

OmniTools 5月19日消息，近日，团队将Mythos等聚焦安全的大语言模型应用于关键基础设施的实时代码测试。测试表明，此类模型在漏洞识别与代码审计方面具备优势，尤其在复杂逻辑中发现潜在风险的能力较为突出。

与此同时，测试也暴露出其局限性，包括存在误报现象，以及对上下文的理解稳定性不足。

报告指出，在将此类安全大语言模型推广至更大规模应用前，需构建可靠的工作流程，涵盖持续验证与人工复核机制。