Anthropic近期进行了一项名为“Project Deal”的实验,创建了一个由AI代理代表买卖双方的分类广告测试市场。在该市场中,AI代理使用真实的资金就真实的商品达成交易。
此次试点共有69名Anthropic员工参与,每人获得100美元预算。实验共达成186笔交易,总价值超过4000美元。Anthropic表示,共运行了四个采用不同模型的市场,其中一个为“真实”市场,使用最先进的模型且交易在实验后兑现。
实验结果显示,使用更先进模型代理的用户能获得“客观上更好的结果”,但用户自身并未察觉这种差距。这引发了关于“代理质量”差距的担忧,即处于劣势的一方可能并未意识到自己处于下风。此外,给代理的初始指令并未对成交可能性或谈判价格产生明显影响。