Reddit坚持数据收费 或将封杀搜索引擎爬虫
据《华盛顿邮报》上周五报道,聚合新闻类网站Reddit正与AI巨头商讨数据付费事宜,如果双方无法达成协议,Reddit可能会切断面向谷歌、必应的服务,即禁止谷歌、必应等搜索引擎的爬虫从平台内获取内容。
这将迫使用户登录Reddit账号才能获取到自己想要的信息。也就是说,Reddit的内容将不会显示在谷歌和必应的搜索中。
对此,《华盛顿邮报》随后的纠正报道,以及TheVerge的最新报道指出,Reddit否认了上述报道中关于“强制用户登录平台,才能查看内容”的说法,至于“封杀搜索引擎爬虫”,官方并未否认。消息人士还称,“没有搜索(网站),Reddit也能生存。”
Reddit是美国人最常访问的新闻网站,用户可以在其中创建并分享内容,有“美国版百度贴吧”之称,目前Reddit拥有超过13万个活跃社区,根据该公司2020年底的数据,其拥有超过15亿注册用户,4.3亿月度活跃用户,以及5200万日活跃用户。
训练AIGC工具需要海量数据,而Reddit积累了大量用户生成内容,均是AI优质训练数据,这家公司由此觅得商机。
4月份,Reddit宣布,将向使用其API训练AI聊天机器人的公司收取数据使用费,其中便包含微软、谷歌、OpenAI等;6月份,其高于行业平均水平的收费标准被爆出——每5000万次API请求收取1.2万美元。
如果说庞大的数据资产为Reddit提供了收费的可能性,其上市计划则提示了Reddit进行收费的必要性。
此前知情人士说,Reddit的目标是在今年晚些时候最终上市——很可能是在下半年。Reddit和包括Instacart在内的其他公司正在更新他们的IPO文件,为市场状况好转时可能的IPO做好准备。
当下,
报纸出版商为代表的公司选择高筑城墙。《华盛顿邮报》报道称,自8月以来,至少535家新闻机构(包括《纽约时报》、路透社和《华盛顿邮报》)安装了拦截器,以防止其内容被OpenAI等公司抓取,用于训练ChatGPT等产品。
其目的是相同的——
彭博称,到2032年,这一市场(数据收费市场)预计将达到1.3万亿美元。
当然,
最新消息显示,StackOverflow已经裁员28%。
目前,无论是传媒集团还是主流社交平台,仍然在与AI巨头“拉锯”,最终是否需要付费、如何收费,不同话语权的公司将得到不同的结果。
踩一下[0]

站长云网
顶一下[0]