当前位置:首页> 圈子> 大咖秀场

姚期智:人工智能理论的三大新方向

来源: 时间:

7月9日,2020年世界人工智能大会云端峰会于上海召开。本次大会以“智联世界 共同家园”为主题,集聚全球智能领域最具影响力的政府领导人、科学家和企业家,围绕智能领域的技术前沿、产业趋势和热点问题发表演讲和进行高端对话。会上,图灵奖获得者、中国科学院院士姚期智与我们分享了主题为“人工智能理论的新方向”的演讲,他表示,AI 已经不是一个新的概念,其已经发展了很多年。

姚期智教授传递了对于 AI 的三个观点:第一、AI 理论十分重要。如果回顾下 AI 发展中面对的困难和挑战,从 AI 理论方面考虑,我们至少能知道所面临的困难是什么,也就有了如何解决问题的思路;第二、AI 的发展需要共同的智慧,人工智能绝对是一个跨学科的行业。有许多例证可以表明,在 AI 方面获得的一些巨大成果往往是因为一些看似完全不搭界学科之间的合作,这可能需要几十年的努力,因为没有其他学科科学家所取得的研究成果的话,在 AI 方面我们是不可能取得这么快的发展。第三点、希望通过一些例子,告诉大家一些非常有意思、值得探索的新方向。

深度学习的成功某种意义上说是令人吃惊的,因为它已经沉寂了很多年,我们也在思考深度学习的力量缘何而来,背后有哪些支撑?如果我们能了解为何神经网络会取得成功,或许就能知道该如何来提升以及从哪些方面来找到突破口。

正如李彦宏教授谈到的,深度学习和神经网络是很多应用程序的基础。姚期智教授在这里要谈到了几个机器学习从业者比较感兴趣的理论问题,指出了未来人工智能理论的三大方向,其核心观点是:AI发展中的巨大成功往往取决于一些看似不相关的跨学科合作,因为在研究中进行交叉科学研究。

第一个人工智能理论的新方向是神经拓扑结构。深度学习在很多年里都没进展,后来却意外地在AI应用上获得了成功。可是神经网络的力量到底来源于哪里?AI标准机器学习的方式是从高维数据中去寻找范式,而高维度数据集正是数学家关注多年的一个方向,拓扑学中贝蒂数的概念就可以应用于高维度子集。把数学和神经网络的能力结合起来,有助于我们了解什么样的数据集更便于神经网络去识别。

第二个理论方向是人工智能+MPC(多方计算)的隐私保护学习。现行技术让密码学的应用有了实现的可能,通过多方密码的做法,我们可以将多个当事方的数据结合在一起交给AI来挖掘价值,但过程中又不会暴露数据的来源。这样就能在实现高质量学习的同时保护数据隐私,对金融科技、药物研发非常有用。

第三个方向是可控的SuperAI(超级人工智能)。AlphaZero、人脸识别仅适用于特定领域,通用的超级人工智能何时会到来?我们对此不可预知,但可以做好准备。Stuart Russel提出“确保安全”的超级AI应具备三个原则:利他的、谦卑的、尽心的。也就是说人的利益应凌驾于机器利益,机器不能自以为是,而且要学懂人的偏好。

姚期智教授分别举了三个例子,进行说明:

第一个例子他谈到机器学习和拓扑学之间的联系,是数学非常有意思的分支。第二个例子是关于人工智能和隐私之间的关系,就是密码学,这是 AI 一个全新的领域。第三个例子是一个很多人非常感兴趣但也充满争议的话题,就是可控的超级人工——Super AI,人们比较担心的是 AI 快速进展可能会带来对于人类社会的威胁。

下图是一个波动的数据。假设有一个算法来分析气候,到底是风暴还是正常现象,一个比较标准的方法就是会看一张图把它看成二维或者三维,希望从中找到范式,看一下这张图是不是符合一个风暴的特点。在深度学习或者最近的机器学习当中,人们可能从更高层次、角度来看,整张图应该被认为是一个高维度的点,一个高维的数据。比如看一张猫的图片,可能包括几百万个像素,可以被代表成一个一百万维的一个点,这就是 AI 标准机器学习的方式。我们如何来分析一个内容?比如给到一个数据它是一个点,但是是一个极高维度的点,我们去分析这个点是不是属于一个数据集,这个数据集就叫猫的图象。

抽象来讲,大家可以看一下所有猫的图片,它是一百万维度的一个子集,没有人知道在高维度当中的数据集是什么样,可能对于低维度数据是有感觉的,在高维度空间当中有很多非常有意思的洞见。所以,在神经网络这样计算网络当中,核心的问题就是神经网络要达到什么样的大小和深度,才可以区分一个猫的图片和一个其他非猫的图片。

在高维度情况下,数学家一直在关注高维度数据集,而且关注了很多年。一个自然的问题就是如果人们去了解神经网络能做什么,我们想要知道什么样的数据集是神经网络比较容易去识别的,以及什么样的数据集是我们不能用神经网络来解决这样问题的。在过去 10 年当中,神经网络方面的专家开始这样去思考。事实上,我们也看到这方面的一些结果,就是把一些数学和神经网络的能力联系起来,然后做计算。

在拓扑学当中一个非常重要的概念是应用于高维度子集或者任何维度的子集叫贝蒂数,最低的是 b0,等于一个子集当中不相关的元素数,而 b1 你可以认为它代表着子集当中有多少个洞,平面有一个圆圈 b0 等于 1 就是有一个元素,b1 也等于 1,中间是个洞。看更复杂的案例一个环面,像一个圈圈饼一样。b1 一维洞的数量等于 2,有两个不同类型的圆圈,每个圆圈代表一个洞。如果这些数字集合在一起,这个数列就叫做总的贝蒂数,数学角度看到它就说一个数据集在高维度领域有多大复杂性,会让我们可以猜测过去 10 年一直考虑的问题。

如果一个数据集是非常复杂的,对于神经网络来讲就更难识别。这也给了我们一个灵感,要解决 AI 问题,不妨从另外一个学科角度来考虑这个问题,这个案例当中讲的就是拓扑学。拓扑学方面的一些概念、技术和复杂度的理论可以让我们获得一种 AI 方面新的理论,只看 AI 是不可能的。

第二个例子,关于隐私的保护。姚期智教授表示他本人对密码学非常感兴趣,特别是 MPC,假定有很多不同的当事方,每个方面都有一些数据,你需要各方面数据结合在一起才能够通过 AI 挖掘到一些重要的结果,但是所有当事方所拥有的数据是秘密的,而且是非常有价值的,他们不希望把自己的秘密给到第三方知道。

那我们是不是可以这样做,让计算的结果不需要去揭秘这个数据属于谁,甚至不必要揭秘这个数据,是否可以通过多方密码做法来实现这个结果?姚期智教授认为,其实可以通过密码学实现这个目标。

密码学的技术很早就已经开发出来了,当时应用得非常少,但那么多年之后,成本已大大下降,现行技术让我们有了实现的可能。

最后一点,很多人担心是不是会出现超级人工智能。我们不知道超级人工智能会不会出现,但是伯克利大学的一位教授去年有一本书,讲了一个非常有意思的概念。他说,“尽管我们不知道超级人工智能会不会来,但是我们最好做好准备。他提出了一些很好的方法论,让大家用一些非常具体的方法做好准备。”

最后,姚期智教授向大家传递出一个基本概念就是——现在的应用来自于过去的理论研究和所做的理论研究在未来某一天会让我们获得巨大的进步。

热门板块