社交巨头 Meta 下载了盗版电子书去训练其 AI 模型

社交巨头 Meta 下载了盗版电子书去训练其 AI 模型,最新证据显示 Meta 的盗版规模惊人。Meta 通过安娜的档案(Anna’s Archive)下载了至少 81.7 TB 的数据,其中包括来自 Z-Library 和 LibGen 的至少 35.7 TB 的数据(安娜的档案包含了 Z-Lib、Sci-Hub 和 LibGen 的镜像站)。Meta 之前还从 LibGen 下载了 80.6 TB 的数据。图书作者称,Meta 非法的电子书库种子下载规模惊人,认为这只是冰山一角,这些盗版电子书库仅占 Meta 盗版版权作品数量的 0.008%。

提供大语言模型数据这可能是「安娜的档案」项目实现收入的途径之一。

https://zh.annas-archive.org/

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索