实锤!村上春树、史蒂芬·金盗版书成训练数据,AI 巨头无一幸免

实锤!村上春树、史蒂芬·金盗版书成训练数据,AI 巨头无一幸免

为了训练大型语言模型,OpenAI、Meta、谷歌、微软等公司未经许可,从互联网上收割了数百万受版权保护的作品,在版权法的灰色地带中游弋。如今,OpenAI 目前正面临大量的官司,原告称该公司训练数据集中的大多数书籍来自盗版来源和非授权网站。一旦被判侵权,公司有可能将面临巨额罚款或重构算法的局面。这也导致,如今 AI 公司越来越不愿意分享 AI 训练数据的详细信息。但一些公开的盗版语料库已经被盯上

实锤!村上春树、史蒂芬·金盗版书成训练数据,AI 巨头无一幸免

实锤!村上春树、史蒂芬·金盗版书成训练数据,AI 巨头无一幸免

为了训练大型语言模型,OpenAI、Meta、谷歌、微软等公司未经许可,从互联网上收割了数百万受版权保护的作品,在版权法的灰色地带中游弋。如今,OpenAI 目前正面临大量的官司,原告称该公司训练数据集中的大多数书籍来自盗版来源和非授权网站。一旦被判侵权,公司有可能将面临巨额罚款或重构算法的局面。这也导致,如今 AI 公司越来越不愿意分享 AI 训练数据的详细信息。但一些公开的盗版语料库已经被盯上