机器学习泰斗迈克尔·乔丹院士:AI难以替代人,ChatGPT无法对不确定性进行量化

出品|搜狐科技

编辑|汉雨棣

“如果你问ChatGPT说,你刚刚写的内容你确定吗?它完全无法回答这个问题。”

9月7日举行的2023 Inclusion·外滩大会上,机器学习泰斗,美国科学院、美国工程院、美国艺术与科学院三院院士迈克尔·乔丹(Michael I.Jordan)教授提出了上述问题,并表示金融科技是不确定的技术,而ChatGPT不具备“确定”的技术,无法对不确定性进行量化,但人类则非常擅长处理类似的问题,擅长沟通以及应对不确定的信息。

迈克尔·乔丹教授直言,他不认为有一种所谓的超级电脑会替代人,应该把技术看作是一个工具来赋能人类,建议关注集体的智能体。

“AI的本质是集体,而不是个人。AI也不会替代人。” 迈克尔·乔丹教授表示,我们需要建立一个协作式、去中心化的系统来实现集体智能,并设计一个机制使之公平、稳定、可扩展。“我们在日常生活中经常遇到不确定性,让去中心化的系统能够帮助我们更好、有效地应对日常和世界当中的不确定性,这才是我们亟待解决的问题。”

以下是演讲全文:

非常高兴来到今天的2023INCLUSION·外滩大会。感谢主办方,也要感谢我的朋友们,给我了很多的启发和灵感,非常感谢。

大家应该都听说过自然语言模型,ChatGPT就是一个典型的例子,还有很多其他类似的模型,未来还会陆续出现在市场上,应该说它们表现非常的出色,他们的功能是我们从来没有以想象过的,而且能够涉及很多的话题。但是,这里我比较感兴趣的一点就是“不确定性”,如果你问ChatGPT说,你刚刚写的内容你确定吗?它完全无法回答这个问题。因为它的技术上是存在问题的,而这个问题其实它还没有真正的有效的解决。而人在讲到“不确定”的时候,是非常擅长处理这些类似的问题,怎么去沟通不确定的信息以及应对。

所以,目前的技术缺乏一个根本的点,对于金融、对于金融科技这点是至关重要的,因为金融科技归根结底讲的是不确定性的技术。如果说不确定性应对不好,你不可能有非常好的金融科技技术。所以,ChatGPT它也没有办法对不确定性进行量化,所以我们需要去解决这个问题,我们要找到一个可能的方法去应对这些挑战。

现在讲到技术的时候,人们很多对话的内容,人工智能会替代人,用机器来替代人,会有这样一种所谓的超级电脑,超级电脑智能,我觉得不是这样的,我们有很多的人,他们是可以赋能的,我们应该用技术看作是一个工具来赋能人类。所以,我关注的点倒不是说个人,或者说各个电脑,而是一个集体的智能体。蚂蚁就是一个很典型的例子,蚂蚁创造了双边市场,把商户和客户有效联结在一起,我觉得这才是一个智能的集体,这个是有真正的智能。怎么样设计这个机制,怎么让它公平,怎么可扩展,怎么样让它更稳定,这也是我们人工智能真正要面对的问题。所以AI它的本质是集体,而不是个人。

如果说把这两个问题结合在一起,我们怎么去应对在一个协作式的、去中心化的系统当中来实现集体智能,我们可以设计这样一个集体智能体,也可以去解决这个不确定性,我们在日常生活中经常遇到不确定性,能够有机体的去中心化的系统能够帮助我们更好的有效应对日常和世界当中的不确定性,这才是我们亟待解决的问题,你不要去想什么基点、AI,我觉得这个不是关键点,我刚刚讲的问题才是我们要去着重去解决的问题。

我今天想跟大家介绍一下我的研究项目,因为我毕竟是做研究的。这个是我的一些UC伯克利的同事,他们和我一起共同从事这个项目的研究,我想通过这个例子跟大家讲讲怎么有效的应对AI系统当中的不确定性。如果应对不当,会出现哪些严重后果?

大家都应该知道ChatGPT,但是大家应该也了解Aipha Fold,这也是一个AI系统,它主要是用于蛋白质结果预测的,它们的预测能力强于人,应该说一定程度上是有智能的。但是它依赖的是人的数据,依赖的是有标记的蛋白质结构数据,这个可以用于药品的开发、药品的监管。在生物科技领域得到了广泛的应用。建议大家要注意这几个数字,有了这样一个新的技术我们可以实现上亿级蛋白质结构的预测。比如说,它可以结合很多的氨基酸的数据,进行上亿级别的预测,做的非常好,反正比人要做的好。如果用人的X晶体结构技术的话,只能做几十万的预测。但是,我们要区分这样一个基准真实的数据,还有电脑产生的数据,这两者有差别吗?会不会产生问题?

我给大家举一个例子。在2004年有这样一篇论文,这篇论文主要是以做分子生物学的研究,主要是要了解内在的趋势是不是有一个病例可以去发现。我们都知道蛋白质是有蛋白链的,但是蛋白链的结构是什么样的?其实就决定了蛋白的功能,比如说它在2004年的时候,当时我们有一种假设,蛋白质是存在叫固有的无序性,也就是蛋白质的无序性和具有生物学功能的磷酸化有没有关系?这种关联是什么意思?就是数据上的关联性。所以我们当时做了一些技术上的研究,他们把所有的PBB(音),当时只有1万个蛋白结构的数据点,然后他们来计算了一下几率,我们说固有无序性和磷酸化之间的几率比。当时他们没有办法有足够的数据来作出一个决定,所以就在2004年的时候是一个开放的问题。到了2022年的时候我们看到有其他的研究者回答这个问题,我们现在没有真实世界的数据,但是我们有一个Aiphha ford给我们的预测数据。所以我们可以用预测数据,而不是真实世界蛋白质的数据,很多科学家都在这样做,把预测数据作为真实据来用。这可能是很好的,因为预测是非常准确的,它们可以代替真实世界的数据。所以,他们做了这样一个基因组的研究,当时有2亿个蛋白结构的预测,一个实际的数据是只有1万,一个是有2亿的预测数据。所以如果你是一个统计学家,你看这个数字你会比较担心。首先是什么?你注意到,这并不是蛋白,它可以不仅用于蛋白,而且可以用于电流的预测,或者说在银行行业,不仅是科学界。所以新的预测系统可以用于科学研究的方方面面。如果只是一个预测,一个人在一个商界当中会输什么,这不是很大的问题。但是有的情况下,如果你有偏差,系统性偏差是一个很大的问题。

什么叫系统性偏差?我们有一些小的偏差,比如说Aiphha ford就是一个小错误。左边是系统预测的结构,右边真实世界蛋白质在右边的,一个蛋白质差别就比较大了。但是在这边就是有一个偏差或者系统性的偏差。问题是我们要检测这样一个假设,我们来做一个预测,我们发现其实非常的重要,我拿这张图是比较技术性的,我回讲的比较详细。在X轴方面,我们有一个几率比,固有无序性和磷酸化之间的关系,如果这个几率比是等于1,分子、分母是一样的,它没有一个统计学的关联性。如果不是1,如果大于1就是有关联性,在统计学当中,你不仅有一个预测,而且有一个期间,所以几率比的所有的可能的数字。大家看到这个紫色的部分这叫推算,这就是使用所有预算的执行区间,总共有2亿个数据点,大家看执行区间是非常小的,也就是说你是非常自信的,你非常确定,当你使用Aipha Fold预测的时候。但是问题是,如果真相(虚线),我们做了很多的工作转到这样一根虚线,我们可以看到A预测值的执行区间对可信度非常高,但是结果非常错误,在紫色线和虚线之间是完全分开的。虽然机器对他的预测是非常自信,但是这个预测是完全错误的,即便Aipha Fold是一个非常好的,总体来说是比较高的系统。所以,统计学家就说,我们不用Aipha Fold,就要用实际观测到的科学数据。如果是这样做的话,我们是上面的确信的区间。但是这个确信区间太大了,我们说灰色的部分,即使20年之后,它依然没有办法找到这样一个效果。

所以,我们现在有一个很大的问题,我们可以用Aipha Fold,但是错误很大。如果不用Aipha Fold,就没有办法很快做科学实验。我们有一个方法叫预测驱动的推理,它是给你真正的能够找到一个高可信的值,就是蓝色的这块,这是我们用的新的技术,也就是我们讲的PPI预测驱动的推理。我来给大家讲一下,给大家举一个例子,一般我们的问题是有的时候我们是有一个科学家给我们的标签数据,还有大量的类标签数据,这是来自AI。如何把这两个一起用,用一个鲁棒性非常高的实验确保没有偏差,怎么做?最终目标就是确保我们做数学,用一个很好的自信,用一个很高的概率找到真相,这就是我们解决的问题。

现在我们要实现这一点,我们给大家举一些例子,这个问题有多重要。我们说这是一个科学的问题,就是基因表达。如果我有一个基因序列,把它放到细胞当中,它是不是会表达成蛋白呢?在右手边,大家可以看到,如果用计算预测的话,它的执行区间少,就是紫色的部分,但是它没有覆盖到虚线的真相。蓝色这一部分一它找到了真相,而且依然是非常晓得一个确信区间。这是加州的人口调查,他们就会问众人一些问题,这就好象一个保险公司问的问题,用你的收入来预测这个人有没有一个个人保险,这是政府比较感兴趣的事情,是不是可以有数字的比较好的执行区间。如果是紫色的部分,如果你用计算机的方法来做预测的话,看到执行区间非常小,但是完全的错误,没有找到虚线部分,离虚线非常远的距离,这个让大家感到吃惊。但是一个小小的个体错误,它可能会产生很大的系统性错误,我们都知道这一点。然后我们看蓝色的这执行区间,它是覆盖了真相,它没有紫色那么小,但是因为它下面的系统不是非常准确。也就是说,现在的大的语言系统是没有办法知道自己是不是非常的确定。

这个就是投票,我们都知道选举当中投票的结果,还有用计算机视觉检测星系的体系。这是同样的现象,如果只是计算机的预测的话,可以看到执行区间非常小,但是离真相非常远。这个是用计算机视觉测试,可以看到左手边有很多我们做过的例子,在天体不同的区域可以看到不同的现象不停的出现。

这是我最后一个PPT,我们如何来做?我们比较技术的话,大家感兴趣可以线下谈。但是我要说,这个工作都是在icapu(音)上,我们所有的文件都在里面,我们把所有AI相关的文献都放在ArXiv(全称为The arXiv,是一个免费的在线科学预印本存储库)上面,这是国际上最好文献合作的机构,我到中国来是20年前,当时没有人读我们的论文,但是5年之前,所有人都在读我们的论文,所有的人都有了解我们这个论文当中的细节,开始问我们。所以ArXiv对于中国研究是有很多的很好的影响力,因为很多学生他可以成为研究合作的一部分。

我非常简单的跟大家解释一下这是什么概念。我们有一个芯,还有AI预测的值,这个值是上标是F。我们可以看到在人口当中这个是不同的,或者在极当中是不一样的。我们可以预测这两者之间的差别,我们可以有这样一个+或者减,要获得执行区间,这是需要一个修政值的执行区间,这是一个关于修正值的区间,我们的系统是可以获得的,而且可以把所有做出修正。这样一些经过修正的数字,就是我们新的一个可预测的数字。我讲的非常快,但是这是一个非常新的系统,他也是我们一些系统性的偏差。

这是我最后一张幻灯片,这是我个人对AI的一些看法,今天大家都听到,我并没有觉得AI会替代人,它只不过就是一个新的工程系统,科技就是一个非常很好的新的工程系统,为每个人是普适,而且是公平、公正、透明、稳定的,这些特性是整个工程系统的特点,而不是系统当中个体的特点。所以AI它是关于一个集体,而不是关于一个个体。谢谢大家。