陈根:马斯克用X数据训练AI,最大的困难是什么?
文/陈根
9月4日,马斯克旗下社交平台X(前身为推特)最近更新了隐私条款,X将使用收集到的数据来训练AI模型。
X最新的隐私条款中明确表示,“我们可能会使用收集到的信息以及公开信息,来训练我们的机器学习算法、AI模型等。”对于此事,马斯克也直接承认,并补充称“只会使用公开数据,不会使用用户私信或任何私人数据”。
X的数据对于马斯克而言并不是金矿,尽管马斯克计划用X的数据来训练人工智能。因为X拥有的数据就类似于微博与微信所拥有的数据一样,大部门的数据都属于低质量的数据,或者说是属于脏数据。对于要训练高质量的人工智能模型而言,不仅没有价值,反而会成为副作用。
而马斯克要使用X的数据用于AI训练,首先要解决的一个问题就是成本的投入。也就是说马斯克需要雇佣大量的人员,对X平台的数据进行标注、清洗,并从中筛选出能使用的高质量数据。而数据的这种标注、清洗,就意味着不仅是大量人力成本的投入,同时是一种长时间的持久工作。
如果马斯克不对X平台的数据进行标注、清洗,而直接使用的话,最终训练出来的AI可能就是一个不仅有AU幻觉病,同时还会成为造谣传谣的AI模型。
免责声明:凡本网站发布的文章、图片、音频、视频等内容所表述的观点和立场不代表本网站的观点和立场,若对该观点或立场有疑义或异议,请及时用电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。凡本网站发布的所有文章 、图片、音频、视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一和版权者联系,如果本网所选内容的文章作者及编辑认为其作品不宜上网供大家浏览,或不应无偿使用,请及时用电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
相关阅读
只是偶然搜索,天工AI竟然走心回答,勾起魔兽催泪回忆杀!
2024.04.30
盘不完,根本盘不完……怎么没人早点告诉我AI音乐这么好玩
2024.04.25
中国首个音乐SOTA模型「天工音乐大模型」今日公测
2024.04.17
解码「天工SkyMusic」,填补AI音乐领域技术空白
2024.04.12
「天工SkyMusic」跨界喜剧,用实验音乐探索笑声与旋律的碰撞
2024.04.11