OmniTools 6月21日消息,由前OpenAI员工Thomas Dimson与Joey Flynn开发的新型AI评估工具“In the Weights”正式上线。该工具通过向Grok、Gemini、GPT系列、Claude、Llama等十余个主流大模型发起“Who is <name>?”类提问,聚合各模型返回结果并聚类分析,生成一个0–1000区间的“强度分”(Strength Score),用以衡量个体在模型参数权重中被隐式编码的程度。
网站将“在权重中”(In the Weights)定义为“其存在曾被判定对构建超人类AI具有重要性”。首批测试显示,演员麦考利·卡尔金(Macaulay Culkin)以988分暂居榜首,男高音歌唱家卢奇亚诺·帕瓦罗蒂紧随其后;TechCrunch编辑Anthony Ha得分为641,位列前6%。
开发者表示,该项目初衷是回应搜索行为向大模型迁移的趋势,旨在替代传统的“谷歌自查”(Google vanity search)。目前工具已开放公众使用,界面采用复古像素风格,并会标注各模型响应情况及潜在的幻觉内容。