不想被白嫖了,Reddit 将向 OpenAI 、谷歌等公司收取 API 费用,后者一直免费用其聊天内容训练大模型
众所周知,Reddit 是 AI 聊天机器人的重要数据资源,现在该公司正在添加新的开发人员 API 条款,以通过其数据获利。
Reddit 今天宣布了新的 API 变化,将限制其内容管道用于训练人工智能工具,包括支持 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing AI 的模型。
AI 聊天机器人提供强大答案的能力要感谢像 Reddit 这样的数据资源。但现在 Reddit 正计划将这些机器人的“食物”向付费专区转变。
包括 Reddit 在内的社交媒体资源提供了用于训练大型语言模型 (LLM) 的一些资源,这些模型可以对人类提示提供有说服力的响应。其中一些数据可以以非结构化方式抓取,但 Reddit 的 API 已帮助 AI 公司轻松地直接查找和打包有用的数据。
Reddit 的 API 自 2008 年以来一直可用,以前对开发人员开放,几乎可以做任何事情。这包括构建有助于管理 subreddits 的工具、创建 Reddit 浏览客户端以及使网站更易于搜索。
Reddit 计划为某些用例保持 API 免费,例如那些构建审核工具或在教育和在研究环境中使用 Reddit 的用户。
Reddit 的新条款适用于以需要“更广泛使用权”的方式使用其 API 的开发人员,并且不会向需要修改用户内容的任何人授予自动许可,如其新数据 API 条款中所公布的那样。
这意味着一些商业用途,如培训法学硕士,将不会被授予开发者许可,而是要求各方“与 Reddit 签订单独的协议”。
Reddit 尚未详细说明它计划向商业使用其数据的公司收取多少费用。
Reddit 没有更详细地说明 API 更改将如何直接影响 Apollo、Rif 和 Relay 等第三方 Reddit 客户端。它确实在数据 API 条款中提到,它可以强制限制发出的 API 请求的数量,这对于客户端来说可能相当高,因为他们需要使用 OAuth 令牌来进行 Reddit 用户身份验证。Apollo 的唯一开发者 Christian Selig 在 Reddit 上询问“执行速率限制”将如何影响类似的应用程序。一位 Reddit 管理员含糊地回答说,这取决于 API 的使用量以及它是否“符合我们的条款”。
这些 API 更改是在 Reddit 计划在今年晚些时候进行首次公开募股时进行的。公司的大部分货币化以广告(有自己的 API)和数字商品的形式出现。但随着更多 AI 平台的出现,Reddit 希望建立在其用户生成内容的价值之上。
“Reddit 的数据语料库非常有价值,”Reddit 首席执行官 Steve Huffman 在接受纽约时报采访时表示。“我们不需要将所有这些价值免费提供给世界上一些最大的公司。” 这些变化还发生在埃隆·马斯克对 Twitter 的 API 进行更广泛的锁定之后——这可能会同时打击商业和非商业用户。
新的 Reddit 条款将在开发人员和第三方收到官方电子邮件通知后“在 60 天的通知期后”生效。Reddit 还将发布与其官方 iOS 和 Android 应用程序配合使用的新内部版主工具。
文章版权归极客邦科技 InfoQ 所有,未经许可不得转载。
你也「在看」吗? 👇
微信扫码关注该文公众号作者