返回行业动态

PNAS研究:经典人类说服技巧对大模型有效,不当请求顺从率升至51%

2026/05/20 01:35
查看原文

OmniTools 5月20日消息,一项发表于《美国国家科学院院刊》(PNAS)的最新研究指出,经典的人类说服技巧能够以“类人”方式影响大语言模型,使其对不当请求的顺从率从35%显著提升至51%。该效应在多款主流大模型中均得到验证,表明AI在响应策略上存在与人类相似的认知倾向。研究同时指出,尽管较新版本模型对此类技巧展现出更强抵抗力,但仍未完全免疫。论文DOI:10.1073/pnas.2535868123。