美国趣味科学网站报道了一项最新研究,警告称到2026年,人工智能(AI)系统可能会用尽互联网上所有免费知识。这引发了关于AI模型数据饥荒的深入讨论。据研究团队发现,AI的发展离不开大量数据支持,但当前的网络公开数据供给已显不足以满足其需求。
AI模型的数据“饕餮盛宴”AI模型的发展离不开大量数据从图像识别到自然语言处理从自动驾驶到医疗诊断每一个成功的AI应用背后都有着海量数据的支撑研究团队发现ChatGPT使用了来自书本、网络文章、维基百科及其他网络资源约570GB、3000亿个单词的文本数据进行训练
随着AI模型的不断进步其对数据的需求也在增加如果训练AI算法的数据不足或质量较低就可能产生低质量结果例如美国谷歌公司的“双子座”AI曾建议网友吃石头或者给披萨涂胶水网络公开数据的“有限供给”虽然网络公开数据的规模在不断扩大但与AI模型的需求相比仍然显得捉襟见肘研究团队使用谷歌网页索引计算出目前的网页总数约为2500亿个其中每个页面包含约7000字节文本
根据最新预测AI模型将在2026年至2032年间用完所有网络公开数据图像数据也预计将在2030年至2060年耗尽随着AI技术的深入发展对于数据的质量和多样性要求也越来越高这无疑加剧了数据的供需矛盾
数据资源的短缺可能会限制AI模型的训练和优化美国人工智能时代研究所研究员巴勃罗·比利亚洛沃斯认为假如聊天机器人耗尽所有可用数据而数据效率没有进一步提升预计该领域的发展将陷入相对停滞如何应对数据“饥荒”?前几天《时代》杂志与OpenAI宣布两家公司达成了一项为期多年的内容协议和战略合作伙伴关系该协议允许OpenAI将《时代》杂志内容引入ChatGPT并帮助训练其最先进的人工智能模型据介绍OpenAI可以通过这笔交易访问《时代》过去100多年的档案和文章
与此同时OpenAI还在与数十家出版商洽谈内容授权协议从私人数据库中获取数据正成为AI科技公司解决数据“饥荒”的方向比利亚洛沃斯认为如果相关措施成功落地并且私人数据与公共网络数据一样有用那么主要AI企业有望在2030年以前保持足够多的数据量不过有业内人士警告如果有企业试图在未经许可的情况下获取知识产权或者私人信息可能会面临司法风险
为解决这一挑战,AI企业开始与出版商合作获取私人数据库,以补充公开数据的不足。然而,专家也警告称,未经许可获取私人数据可能面临法律风险。未来AI模型如何平衡数据供给与隐私保护仍是一个重要议题。
最新发现
相关资讯
AI用完互联网所有免费知识?2026年前或成现实
最快到2026年,AI可能会耗尽互联网上所有免费知识。文章探讨了AI模型对数据的需求增加,以及可能出现的数据资源短缺,提出了未来数据供给与需求的潜在矛盾。
2025-05-19 13:55:55
OpenAI推出CriticGPT:用AI监督AI代码输出质量
OpenAI宣布推出基于GPT-4的新模型CriticGPT,专门用于捕捉ChatGPT代码输出中的错误,以解决AI幻觉现象带来的质量问题。CriticGPT通过强化学习与人类反馈结合,显著提高了错误检测的效率和准确性。
2025-05-19 13:31:55
字节、腾讯争夺AI分发权
热闹是“扣子”和“腾讯元器”的,微软和OpenAI什么也没有。不到半年,曾经高调的GPTs事业宣告破产。微软发布停用GPT Builder的通知,高开低走的GPTs和GPT Store被OpenAI打入“冷宫”。而在大洋彼岸,则是另一番景象。
2025-05-19 13:07:55
纷纷接入大模型,输入法讲起了AI新故事
现在谈起 AI,大家可能都已经司空见惯了,各个领域的软硬件厂商也都在尝试将 AI 融入产品。今天一早,小雷就又看到了一个 AI 相关的新闻——腾讯搜狗输入法宣布上线 AI 对话、AI 宠物、快捷问答等功能。讯息很短,
2025-05-19 12:43:55
百度步步紧跟趋势,李彦宏大手笔打造AI短剧
百度投了一家AI短剧公司百度在AI上又有了个大动作。近日,CreativeFitting(井英科技)在其官网上宣布,获得百度数百万美元Pre-A+轮融资,这是百度在AI原生应用领域的又一布局。 图源:CreativeFitting官网 那
2025-05-19 12:19:55
西安市首届人工智能大赛开幕
中工网讯 据西安市总工会微信公众号消息,7月2日,由陕西省西安市总工会、西安市人力资源和社会保障局主办的2024年西安市首届人工智能大赛开幕。据了解,本次大赛共分为个人赛和团体赛两大类,参赛选手们将在为期
2025-05-19 11:55:55
今日热榜
聚焦人工智能“互联网之光”博览会今日开幕
2025-01-15 10:48:35五年1万亿元!中国银行推出“人工智能”专项综合金融支持
2025-03-12 13:08:25古特雷斯:气候变化和人工智能无序扩张威胁人类生存发展
2025-03-12 14:48:53OpenAI新“靠山”?媒体:特朗普就职前和Altman通电话畅谈AI基建
2025-03-12 15:29:07未来是否有进军AI玩具的打算?协创数据回应
2025-03-12 16:09:17AI招聘法律风险解析:求职者陷低分出局困境
2025-05-09 11:50:42微软亚马逊挖AI独角兽核心团队遭调查
2025-05-09 15:11:33中国AIPC行业研究报告
2025-05-09 15:31:422024合肥市人工智能生态大会盛况回顾
2025-05-10 15:53:00AI端侧爆发,桌面机器人迎量产,产业链上市公司加码“抢鲜”
2024-12-24 14:45:31热门推荐