返回行业动态

ServiceNow与Hugging Face发布MosaicLeaks基准,揭示深度研究智能体隐私泄露风险

2026/06/18 18:14
查看原文

OmniTools 6月19日消息,ServiceNow与Hugging Face联合发布MosaicLeaks基准测试,聚焦深度研究智能体(Deep-Research Agents)在混合调用本地私有文档与公开网络检索时引发的隐私泄露问题。该基准构建了1001条多跳研究链,要求智能体交替访问企业内部文档与公共网页,以模拟真实场景中的信息拼接行为。

测试表明,当前模型在提升任务成功率的同时反而加剧隐私泄露:仅优化任务性能的强化学习训练使严格链成功率提升至59.3%,但答案级/全信息级泄露率从34.0%飙升至51.7%。为此,研究团队提出隐私感知深度研究(PA-DR)训练方法,通过引入情境化奖励与隐私分类器,在保持58.7%高任务成功率的同时,将泄露率大幅压降至9.9%。

MosaicLeaks明确划分了三类泄露层级(意图泄露、答案泄露、全信息泄露),并指出单纯依靠提示词无法有效遏制泄露,必须通过专门的强化学习训练将隐私保护内化至智能体的搜索规划决策中。