最新研究中发现了一个令人担忧的问题:使用AI生成的数据集来训练机器学习模型可能导致严重的“模型崩溃”。
《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练AI模型的重要性。生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。包括英国牛津大学在内的联合团队一直在进行相关研究,并在去年论文预印本中提出这一概念。在正式发表的论文中,他们用数学模型演示了AI可能会出现的“模型崩溃”。他们证明了一个AI会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。团队分析了AI模型会如何处理主要由AI生成的数据集。他们发现,给模型输入AI生成的数据,会减弱今后几代模型的学习能力,最终导致了“模型崩溃”。他们测试的几乎所有递归训练语言模型,都容易出现问题。比如,一个用中世纪建筑文本作为原始输入的测试,到第9代的输出已经是一串野兔的名字。团队指出,用前几代生成的数据集去训练AI,崩溃是一个不可避免的结局。他们认为,必须对数据进行严格过滤。与此同时,这也意味着依赖人类生成内容的AI模型,或许能训练出更高效的AI模型。对AI来说,“模型崩溃”就像癌症一样,甚至分早期与晚期。在早期时,被“喂”了生成数据的AI会开始失去一些原始正确数据;但在晚期,被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实,也和底层数据一点不相关的结果,就像本文中的例子一样。更可怕的是,“模型崩溃”的AI极其固执,错误几乎难以矫正。它会持续强化,最终把错误结果认为是正确的。这一问题值得所有关注生成式AI的人们警惕,因为它等于是在“毒化”AI对真实世界的认知。
这一问题提醒我们,确保AI训练数据的可靠性至关重要,以避免未来模型的质量下降和输出的不确定性。
最新发现
相关资讯
AI生成数据训练AI可能导致模型崩溃
研究显示,使用AI生成的数据集训练未来几代机器学习模型可能会导致严重的“模型崩溃”,使模型输出变得不相关甚至荒谬。了解生成式AI工具对模型训练的潜在风险与挑战。
2025-05-06 09:24:54
美媒:中国AI缩小与美国差距
美国《纽约时报》报道称,中国在人工智能领域正迎头赶上美国,通过开源技术和创新策略缩小两国之间的技术差距。本文探讨了中国AI技术的快速发展及其全球影响。
2025-05-06 09:04:49
AI推动存储行情分化,HBM和SSD竞争激烈
AI技术催化存储行情变化,HBM和SSD产品需求拉升。数据中心需求火爆推动HBM市场,而消费电子市场仍处低迷状态,存储行情表现分化明显。
2025-05-05 22:55:06
数字化支撑AI加持,中国科技改变百年奥运
中国科技在巴黎奥运会上通过数字化和AI技术的应用,改变了奥林匹克转播的方式和观赛体验,推动奥运迈入全新时代。
2025-05-05 22:34:57
上证科创板人工智能指数报989.84点,前十大权重包含寒武纪等
金融界7月26日消息,上证科创板人工智能指数报989 84点,近一个月微跌,涵盖寒武纪等前十大权重公司,反映科创板人工智能产业整体表现。
2025-05-05 22:14:50
高端制造企业共话AI赋能制造业将成AI应用主战场
在上海科创板开市五周年峰会上,多家高端制造企业就人工智能与制造业结合展开深度讨论。周兴宥、王项彬等行业领袖指出,人工智能将重构工厂生产模式,提升效率和质量。
2025-05-05 21:54:43
今日热榜
聚焦人工智能“互联网之光”博览会今日开幕
2025-01-15 10:48:35《广东省本科高校人工智能人才培养实施方案》在华工发布
2025-01-16 15:05:31AI造谣乱象“野蛮生长”?专家:可设置敏感关键词禁止生成显著违法信息内容
2025-01-15 10:28:26云南省第十三届“挑战杯”大学生课外学术科技节“大数据与人工智能创新科技作品”专项竞赛暨第四届中国移动“梧桐杯”大数据创新大赛云南赛区决赛顺利落幕
2025-01-16 14:25:24中国大模型助力AI技术更开放更高效
2025-03-17 10:28:27AI端侧爆发,桌面机器人迎量产,产业链上市公司加码“抢鲜”
2024-12-24 14:45:31AI推理时代来了?ASIC被看好
2024-12-25 13:48:15《爱、死亡与机器人》司马华鹏用AI重新定义生命的边界
2024-12-30 17:18:22国网克州供电公司:人工智能赋能输电线路巡视缺陷识别应用
2025-01-15 11:48:49AI眼镜风口来了!剑指千亿级规模、百万台销量,小度狂飙
2025-01-22 10:19:37热门推荐