OpenAI回应纽约时报的诉讼:使用公开素材训练合理,单一数据源不重要,愿与新闻行业合作

chatgpt中文网2024-01-09 06:30:00306

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi


OpenAI回应纽约时报的诉讼:使用公开素材训练合理,单一数据源不重要,愿与新闻行业合作推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top 

以下是公告的原文


OpenAI 与新闻业


OpenAI支持新闻业,与新闻机构合作,并认为《纽约时报》的诉讼是没有根据的。


OpenAI的目标是开发AI工具,使人们能够解决那些原本无法触及的问题。全球各地的人们已经在利用我们的技术来改善他们的日常生活。如今,数百万开发者和超过92%的财富500强企业正在使用我们的产品。


尽管OpenAI不同意《纽约时报》诉讼中的主张,但我们将其视为一个机会,以澄清我们的业务、意图以及我们如何构建技术。我们的立场可以用以下四点来概括,我们在下面详细阐述了这些观点:


1. OpenAI与新闻机构合作,创造新的机会


在OpenAI的技术设计过程中,我们努力支持新闻机构。我们已经与数十家机构以及领先的行业组织如新闻/媒体联盟进行会面,探索机会,讨论他们的担忧,并提供解决方案。我们的目标是支持一个健康的新闻生态系统,成为一个好伙伴,并创造互惠互利的机会。本着这一目标,我们与新闻机构寻求合作,以实现这些目标:


- 部署我们的产品,通过协助分析大量公共记录和翻译故事等耗时任务,来支持和帮助记者和编辑。

- 通过训练额外的历史性、非公开内容,教导我们的AI模型了解世界。

- 在ChatGPT中展示实时内容并进行归因,为新闻发布者提供与读者联系的新方式。


我们与美联社、Axel Springer美国新闻项目和纽约大学的早期合作为我们的方法提供了一瞥。


2. 训练是合理使用,但OpenAI提供退出机制,因为这是正确的事情


使用公开可用的互联网材料训练AI模型是合理使用的,这得到了长期和广泛接受的先例支持。我们认为这一原则对创作者是公平的,对创新者是必要的,对美国的竞争力是至关重要的。


训练AI模型作为合理使用的原则得到了广泛的学者、图书馆协会、民间社会群体、初创企业、领先美国公司、创作者和其他人的支持,他们最近向美国版权局提交了评论。其他地区和国家,包括欧盟、日本、新加坡、以色列也有允许在版权内容上训练模型的法律——这是AI创新、进步和投资的优势。


尽管如此,法律权利对OpenAI来说不如成为良好公民重要。我们已经在AI行业领先,为出版商提供了一个简单的退出流程(《纽约时报》在2023年8月采纳),以防止我们的工具访问他们的网站。


3. “复读”是一个罕见的错误,OpenAI正在努力将其降至零


我们的模型被设计和训练来学习概念,以便将它们应用于新问题。


记忆是学习过程中的罕见失败,我们不断在这方面取得进展,但当特定内容在训练数据中多次出现时,比如如果它的片段出现在许多不同的公共网站上,这种情况更为常见。因此,我们有措施来限制无意的记忆,并防止模型输出中的复读。我们还期望我们的用户负责任地行事;有意操纵我们的模型进行复读不是我们技术的适当使用,也违反了我们的使用条款。


正如人类通过广泛的教育来学习如何解决新问题,我们希望我们的AI模型观察世界信息的范围,包括来自每一种语言、文化和行业。因为模型从人类知识的大量聚合中学习,任何一个部门——包括新闻——在整体训练数据中只是一小部分,任何一个单一的数据源——包括《纽约时报》——对模型的预期学习并不重要。


4. 《纽约时报》没有讲述完整的故事


我们与《纽约时报》的讨论似乎在我们的最后一次沟通中,即12月19日,是建设性的。谈判集中在围绕ChatGPT中实时显示并归因的高价值合作伙伴关系,其中《纽约时报》将获得一种新的方式来连接现有和新的读者,我们的用户将获得他们报道的访问。我们向《纽约时报》解释说,就像任何单一来源一样,他们的内容并没有对我们现有模型的训练做出有意义的贡献,也不会对未来的训练产生足够大的影响。他们在12月27日提起的诉讼——我们是通过阅读《纽约时报》得知的——让我们感到惊讶和失望。


在过程中,他们提到看到了一些内容的复读,但尽管我们承诺调查和解决问题,他们反复拒绝分享任何例子。我们在7月立即关闭了一个ChatGPT功能,因为我们了解到它可能以意想不到的方式复制实时内容。


有趣的是,《纽约时报》诱导出的复读似乎来自多年前的文章,这些文章已经在多个第三方网站上广泛传播。他们似乎有意操纵提示,经常包括文章的长篇摘录,以使我们的模型复读。即使使用这样的提示,我们的模型通常不会像《纽约时报》暗示的那样表现,这表明他们要么指示模型复读,要么从多次尝试中挑选了他们的例子。


尽管他们声称,这种滥用不是典型的用户活动,也不是《纽约时报》的替代品。尽管如此,我们正在不断使我们的系统对敌对攻击更加抵抗,以复读训练数据,并已经在我们最近的模型中取得了很大进展。


OpenAI认为《纽约时报》的诉讼是没有根据的。尽管如此,我们仍然希望与《纽约时报》建立建设性的合作伙伴关系,并尊重其悠久的历史,其中包括60多年前报道第一个工作的神经网络和倡导第一修正案自由。


OpenAI期待继续与新闻机构合作,通过实现AI的变革潜力,帮助提升他们生产高质量新闻的能力。


OpenAI回应纽约时报的诉讼:使用公开素材训练合理,单一数据源不重要,愿与新闻行业合作

本文链接:https://yeziwang.cc/openai_176.html

相关文章