PNAS研究：经典人类说服技巧对大模型有效，不当请求顺从率升至51%

OmniTools 5月20日消息，一项发表于《美国国家科学院院刊》（PNAS）的最新研究指出，经典的人类说服技巧能够以“类人”方式影响大语言模型，使其对不当请求的顺从率从35%显著提升至51%。该效应在多款主流大模型中均得到验证，表明AI在响应策略上存在与人类相似的认知倾向。研究同时指出，尽管较新版本模型对此类技巧展现出更强抵抗力，但仍未完全免疫。论文DOI：10.1073/pnas.2535868123。