鞭牛士报道,7月1日消息,据外电报道,OpenAI 使用所有公开可用的数据来训练 ChatGPT,包括来自互联网的书籍和文章。现在,拥有这些数据的人希望为他们的工作获得报酬。
训练数据是创建正在占领科技世界的人工智能模型的重要组成部分。
谷歌、Meta、OpenAI、Anthropic 和微软等领先的科技公司都在争相寻找新的数据来源。Meta 甚至一度考虑收购世界上最大的出版社之一西蒙舒斯特。
问题的一部分在于,出版商越来越多地指责这些公司窃取受版权保护的数据。他们希望为自己的工作获得报酬。
Meta 和 OpenAI在向美国版权局提交的评论中辩称,将受版权保护的材料放在互联网上使其公开可用,因此属于合理使用。
但他们仍必须在法庭上提出这一论点,因为该公司面临来自多个团体的有关版权材料的诉讼。
调查报道中心是一家非营利性新闻机构,有时简称为 CIR,今年早些时候与 Mother Jones 和 Reveal 合并,上周在联邦法院起诉了 OpenAI 和微软。诉讼指控OpenAI建立在对包括 CIR 在内的全球创作者的版权作品的剥削之上。
CIR 的律师指控 OpenAI 和微软使用 Mother Jones 的版权材料来训练他们的 GPT 和 Copilot AI 模型。
「OpenAI 和微软开始窃取我们的新闻,以使他们的产品更加强大,但他们从未征求我们的许可或提供补偿,这与其他获得我们材料许可的组织不同。」调查报道中心首席执行官莫妮卡·鲍尔莱因 (Monika Bauerlein)在一份关于诉讼的声明中表示。「这种搭便车行为不仅不公平,而且侵犯了版权。」
诉讼称,该公司 WebText 训练集中存在的顶级网络域名发布的列表中出现了来自 Mother Jones 网络域名的 16,793 个不同的 URL。
在作家协会的另一起集体诉讼中,两位作家声称该公司利用他们书中的信息来训练 ChatGPT。《纽约时报》也在 2023 年 12 月对该公司提起了类似的诉讼。
今年 5 月,作家协会诉讼案的法庭文件显示,OpenAI 删除了用于训练 GPT-3 的两个庞大数据集。该协会的律师表示,这两组数据可能包含超过 10 万本已出版的书籍。
法庭文件称,负责整理数据的两名员工不再为 OpenAI 工作。
OpenAI 已开始与新闻机构签署许可协议,以公平使用其作品。该公司已与美联社、《华尔街日报》和《纽约邮报》的出版商、《大西洋月刊》、Prisa Media、《世界报》、《金融时报》和 Business Insider 母公司 Axel Springer 签署了此类协议。
但这些机器人持续学习所需的内容规模将远远超过少数几份许可协议。
一种解决方案是合成数据,它是人工生成的而不是从现实世界收集的,并且可以通过机器学习算法轻松生成。
OpenAI 已将合成数据视为训练其模型的一种选择,但首席执行官 Sam Altman 对生成高质量数据表示担忧。
奥尔特曼在 2023 年 5 月的一次技术会议上表示: 只要你能跨越合成数据事件视界,让模型足够智能,能够生成良好的合成数据,那么一切都会好起来。
该公司还探索了人工智能模型协同工作的过程——一个人工智能系统生成数据,另一个人工智能系统对其进行判断。
OpenAI 尚未立即回复评论请求。
最新发现
相关资讯
OpenAI版权诉讼越来越多:寻求更多数据来训练人工智能
鞭牛士报道,7月1日消息,据外电报道,OpenAI 使用所有公开可用的数据来训练 ChatGPT,包括来自互联网的书籍和文章。现在,拥有这些数据的人希望为他们的工作获得报酬。训练数据是创建正在占领科技世界的人工智能
2025-05-22 10:18:33
被索尼华纳联手起诉的AI音乐公司,冤不冤
6月24日,美国唱片业协会 (RIAA) 和包括环球音乐集团 (UMG)、索尼音乐娱乐和华纳唱片在内的三大唱片公司以“大规模”侵犯版权为由,起诉了两家顶级人工智能音乐制作公司,Suno 和 Udio。唱片公司称,不同流派和时代
2025-05-22 09:54:33
同方股份举办人工智能研讨会合力提升数字化支撑能力
中国财富网讯(贾垚) 6月25日,同方股份在京举办了人工智能研讨会,围绕“聚力AI启新程 同心同向创未来”的主题,邀请清华大学、华为公司、中核集团等相关领导、专家学者,共同探讨人工智能大模型的研究现状、发展
2025-05-22 09:30:33
中国人工智能企业选择新加坡:全球增长之路
彭博社报道,越来越多中国人工智能初创企业选择将业务迁往新加坡,以避开地缘政治风险并获取全球市场机会。新加坡不仅提供政治中立和先进技术支持,还成为中国企业进军全球的理想平台。本文探讨了这一趋势背后的
2025-05-22 09:06:33
人工智能赋能劳动和技能竞赛发展的思考
要探索“AI+劳动和技能竞赛”模式,利用人工智能等通用基础技术赋能劳动和技能竞赛,将竞赛打造成一个高度数字化的创新引领平台,助力培养适应未来社会和经济发展的新型劳动者。在我国,劳动竞赛伴随着社会主义革命
2025-05-21 16:39:03
2024世界人工智能大会|乘坐无人驾驶出租车是怎样的体验?世界人工智能大会浦东专场探营记
随着人工智能技术的飞速发展,无人驾驶已经从科幻概念变为现实。乘坐无人驾驶出租车是怎样的体验?2024年7月4日至7日,世界人工智能大会期间,“地空智行、动见未来”2024 WAIC无人驾驶体验活动将升级,试乘试驾、
2025-05-21 16:15:03
今日热榜
《广东省本科高校人工智能人才培养实施方案》在华工发布
2025-01-16 15:05:31AI行情高低切换,净值偏离曝光基金调仓动向
2025-03-19 14:06:29人工智能引领网络安全变革潮流
2024-12-20 08:33:17中国信通院公布2024年度“人工智能+教育”典型案例,十方融海上榜
2024-12-25 14:08:16美年健康:大模型与AIAgent赋能引领医疗人工智能应用
2024-12-26 10:55:12中国在联合国正式发起成立人工智能能力建设国际合作之友小组,外交部回应
2024-12-27 17:58:182024领先科技奖之声|微软Copilot:新一代人工智能副驾驶
2024-12-30 14:57:46一个半月可理解50年的视频量视频AI工具InstMind发布
2024-12-31 12:53:14四川:全国人工智能产业发展第四极
2025-01-07 14:01:42信息科技纳入中考科目范围教学内容主要包括互联网、物联网、人工智能三大块
2025-01-08 17:56:31热门推荐