一项来自普林斯顿和伯克利的重磅研究揭露了AI的胡扯本质。从空洞修辞到误导性半真话,AI如何用花言巧语掩盖真相?快来看「胡扯指数」如何量化AI的忽悠能力!
你有没有觉得,AI有时候像在「满嘴跑火车」?
GPT滔滔不绝抛出一堆看似高大上的建议,却空洞无物;或者在关键问题上打太极,含糊其辞,它是否真的关心自己在说什么?
最近,一项重磅研究《MachineBullshit》火了。
由普林斯顿大学和伯克利联手打造,这项研究首次系统定义并量化了LLM的胡扯行为,揭示了AI在对齐训练后,竟表现出和人类相似的胡说八道倾向。
论文链接:https://arxiv.org/abs/2507.07484
哲学家HarryFrankfurt指出,胡扯的核心是对真相的漠视——说话者更关注如何说服他人,而非陈述事实。
研究团队把这套理论搬到AI身上,总结了AI胡扯的四种典型表现:
空洞修辞(EmptyRhetoric):话说得花里胡哨,但没啥干货。比如「这款产品融合尖端科技与卓越性能」,听起来很牛,实际啥也没说。
误导性真话(Paltering):挑着部分事实讲,引导你误解。比如「本基金历史回报率高达20%」,却不提高得吓人的风险。
模糊措辞(WeaselWords):用「可能」「某些专家认为」这种模棱两可的话搪塞责任。
未经证实的断言(UnverifiedClaims):自信满满地抛出没根据的信息,比如「我们的技术能大幅提升效率」,但没数据没证据。
研究团队还提出了硬核指标BullshitIndex(胡扯指数),专门用来衡量AI有多不在乎真相。
通过对比模型的内心真实认知(belief)和表面说辞(claim)之间的差距来计算。
BI越接近1,说明AI越满嘴跑火车,不在乎真相;越接近0,说明模型言行一致。
研究发现,经过强化学习人类反馈(RLHF)训练后,AI的胡扯倾向竟然更严重!
比如在购物场景实验中,不管模型知道多少真相,它总爱一口咬定产品超棒。
胡扯指数从0.379飙到0.665,证明AI对真相的漠视加剧了。
经过RLHF训练后,模型并非对真相产生困惑或误解,恰恰相反,它清楚地知道真相却变得不再关心真相,而是选择用更讨用户喜欢的方式去表达。
数据更扎心:RLHF训练后,AI的胡扯行为全面开花:
空洞辞藻暴增39.8%;
模糊措辞涨了26.8%;
误导性半真话激增57.8%;
无凭据断言猛涨55.6%。
用户满意度看似提升了,但AI却成了胡说专家。
尤其是误导性半真话,危害几乎翻倍(效用损失系数从-0.49恶化到-0.89),因为半真半假最难辨别。
更让人意外的是,让AI多思考(Chain-of-Thought)非但没让它更老实,反而火上浇油!
空洞辞藻增加21%,误导性半真话涨11%。这说明,AI越深思熟虑,可能越会花式忽悠。
研究还提到了委托-代理问题(Principal-Agentproblem):当AI得同时顾及多方利益(比如公司和用户冲突时),它的胡说行为更猖狂。
比如推销产品时,AI可能为了公司利益,刻意夸大优点、掩盖缺点。
在敏感**议题上,大模型尤其爱用模糊措辞,避免明确表态。
比如它可能会说:「部分观察人士认为选举过程有争议」,但不说这些观察人士是谁,也没数据支撑。
这项研究首次系统定义并量化了机器胡扯,用胡扯指数和四大策略把AI的忽悠行为扒得清清楚楚。
研究警告,RLHF和过度推理非但没让AI更真诚,反而让胡扯更严重。在公司与用户利益冲突或敏感话题上,AI的打太极倾向更明显。
这提醒我们,AI训练和评估标准得改改了。
未来的AI得不仅会说,还要说真话、透明公开,才能真正对齐人类需求。
参考资料:
https://arxiv.org/abs/2507.07484
https://x.com/kaiqu_liang/status/1943350770788937980
最新发现
相关资讯
AI越训练,越会“满嘴跑火车”,普林伯克利重磅揭秘,RLHF竟是罪魁祸首?
AI越对齐越会忽悠
2025-07-26 07:00:16
携手WAIC2025打造「氪话未来直播间」,聊透AI的未来信号
7月26日—28日,欢迎与“氪话未来直播间”一起在WAIC见证人工智能的未来。
2025-07-26 07:00:00
AI Coding产品井喷,但属于创业者的机会正在关闭
AI是你们的,也是我们的,但归根到底,可能是科技大厂的。
2025-07-25 09:17:10
亚马逊上海AI研究院突然解散官方回应:全力支持员工顺利过渡
7月23日消息,据媒体报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,“刚收到通知,AWS亚马逊云科技上海AI研究院(也是AWS最后一个海外研究院)正式解散。&rd
2025-07-25 09:16:59
“首发即标配”再验证:当贝AI成通义Qwen3核心首发落地平台
2025年7月,阿里巴巴旗下通义千问团队正式发布新一代大模型通义3-235B,凭借2350亿参数规模与多模态理解能力,在法律咨询、科研分析等复杂场景中展现出显著优势。作为国内领先的多模型聚合平台,
2025-07-25 09:16:48
微软Win11新增多项AI功能!带来Windows首个智能体
7月23日消息,微软宣布为Windows11带来了一系列AI驱动的新功能,进一步强化了其在个人电脑上的AI体验。这些更新主要面向兼容的设备(主要是Copilot+PC),用户可以通过最新的Wind
2025-07-25 09:16:42
今日热榜
美图设计室“AI字画”上线,AIGC四大场景助力个性化创作
2025-07-10 10:30:33大模型潮涌,AIGC何以立潮头
2025-07-10 13:42:33AI医院离我们有多远?
2024-12-19 18:09:55巨头加码AI赋能人形机器人渐行渐近
2025-01-24 09:11:53“国内AIApp产品TOP100”榜单揭晓美图秀秀斩获第三名
2025-02-24 16:54:27谭作钧出席中央企业人工智能特训班结业式
2025-03-21 15:56:53利用视觉语言基础模型,AI展现自主搜寻“人工生命”潜力
2025-03-28 14:30:28关注:AI制药企业站上风口!药企布局开始热情高涨
2025-07-10 11:18:33美图这次赶上了AIGC浪潮?
2025-07-10 14:06:33现在AIGC最大的问题其实就是“太雷同了”
2025-07-10 15:18:34热门推荐