张钹院士致辞
各位老师、各位同学,很高兴能参加求真书院的开学典礼。
今天在座的老师和同学都是从事数学的,你们热爱数学,在年轻人中间也有一定的数学天分,而且决心将来为我们国家数学事业的发展做贡献。我是今天来的人中间为数不多的、不是做数学的人,但是有一点跟大家相同——我年轻的时候也非常喜欢数学。1953年也就是68年前,我考大学的时候,是以数学满分的成绩进入清华大学,但实际上我是在工作的过程中逐步认识到数学的重要性,以及数学在推动其它学科发展的重要作用。
今天借此机会,向大家讲一下我的体会。我是1958年从清华大学自动控制系毕业,我从事的工作是自动控制,而且干了20年的自动控制,到1978年为止。“自动控制”这个专业怎么形成的?大体上是从第二次世界大战以后,数学家诺伯特·维纳在1948年写了一本书,英文叫《Cybernetics》,我们中国把它翻译成为《控制论》,它有一个副标题,叫做“动物和机器中间的控制和通讯”。第二次世界大战前后,我们搞了很多自动化的系统,比如高炮的自动控制、温度的自动调节,跟人体上的很多系统很相似。他(维纳)发现一个人得了运动失调的疾病以后,行为上就会发生振荡的现象,比如当手去摸东西的时候,常常抓不到东西,在要摸的东西周围反复振荡,他觉得这个现象也发生在温度调节系统,也发生在高炮控制系统中。这是什么现象,这是一个反馈闭环系统中发生的不稳定现象。为了揭示这个现象,他引进了数学。
在分析和设计控制系统时,我们必须掌握两个数学工具。一个我们叫做时域法,在时间领域里头去解决它,基本上用的是微分方程,研究微分方程解的稳定性,它在什么条件下发生振荡;第二个方法叫做频域法,通过拉布拉斯变换,把它变换到复数空间去,用的是复变函数。我在清华学了5年,用3年学基础科学,微积分就学了5个学期,当时微积分的参考书是3册7本,后面还学了线性代数、复变函数和投影几何等。
实际上我们搞自动控制的,离不开数学工具,而且后来自动控制系统发展的越来越复杂,非线性、分布式、变参数……需要用的数学工具也越来越复杂。到了1978年的时候,清华大学自动控制系变成计算机系,我就进入了计算机系,从事人工智能教学与科研。计算机跟数学有非常深的渊源。大家知道计算机是1946年在宾夕法尼亚大学做出来的,这个计算机全名叫“现代电子数字计算机”。1936年的时候,阿兰·图灵就给出计算机的数学模型,这个数学模型叫图灵机(Turing Machine),以后计算机就是根据这个数学模型发展起来的。通过这个数学模型,首先解决了计算机能算什么、不能算什么,所谓“图灵可计算性”理论。第二,从计算机数学模型出发定义了算法,又从这个数学模型出发定义了计算机的体系结构。从1946年计算机做出来以后,计算机的发展为什么一路顺风?因为从这个数学模型人们知道应该发展什么硬件,应该发展什么软件,应该发展什么样的操作系统,所以计算机的发展离不开数学的推动。
这些我讲的是过去的事,接下来我要讲现在的事。现在我搞人工智能,人工智能跟数学有什么关系?首先人工智能是1956年开始的。第一代人工智能,主要是模拟人类的理性智能(行为),像理性推理、分析、规划、决策等。当时给出的数学模型是符号推理模型,主要的数学工具是一阶谓词逻辑,但是这个数学工具过于简单,深入不下去,为什么?缺少表达不确定性的数学工具。大家想一想,人类的推理中绝大多数不是逻辑推理,或者说不是确定性的推理,而是不确定性的。大家想一想,医生看病,如果知道一些症状,就知道一定犯那种病,知道犯那种病,就一定知道怎么治疗。如果是这样,我们还要医生干吗?大家看一看书就能看病了。所以医生的存在,也就是人类的存在就是要解决不确定性问题的。看病时发现了你的一些症状,例如发烧、咳嗽等等。你有可能是感冒,也可能是肺炎,也可能是冠状病毒……犯同样病的人,不同的人治疗方法也不一样。这种不确定性,数学上应该怎么描述?大家费了好大劲找来了两个工具,一个是概率,一个是模糊数学。但是我可以告诉大家,这两个数学工具都不足以描述人类的不确定性推理和不确定性知识。所以现在卡在那儿了,谁能够解决得好,谁就能让人工智能往前走一步。
第二代人工智能大家都非常熟悉,所谓数据驱动、深度学习。深度学习是什么?为什么发展这么快?它实际上就是一个函数拟合。这个拟合函数现在主要用优化的方法来求解,所以好多的数学工具可以用,如概率统计、泛函、变分……有了这些数学工具,深度学习发展极快。大家知道,人工智能中有一个GPT-3(生成式预训练转换器)模型——一种具有 1750 亿个参数的自回归语言模型,看看这个函数的模型有多大!谷歌公司利用这个模型,学了3000亿个词,也就是说,这个计算机学的内容比我们一辈子看过的和听过的词多了100倍。换句话说,GPT-3把所有我们能看到的文本都读过了。读过这么多材料以后,会有什么本事?我们发现它会做许多出乎我们意料的事。比如能做两位数(或三位数)的算数加法,基本上没有错。它从哪儿学到这些本领的?目前还说不太清楚,希望数学能帮忙去解决这个问题。与GPT-3类似的模型统称基础模型,这个基础模型很重要。当它学的文本很多时,具有比较强的推广能力,这是为什么?可是在有些地方却显得很笨。比如,你问它:“人有多少只眼睛?”它说“两只”,没问题。当问到 “我的脚有几只眼睛” 时,它回答也是“有两只”,这叫什么?无知,或缺乏常识。它一方面表现出学问很高,但有时又显得非常笨拙。这又是为什么?我们能用什么样的数学工具来理解它和解决它?
我们现在提出来发展第三代人工智能的主张,要达到这个目标必须把数据驱动跟知识驱动结合起来。光靠数据驱动的方法,通常学不到它的本质,也理解不了它的内容,只有在知识的引导下,才有可能真正把学问学到手。但是数学问题又来了,因为我们在做理性推理的时候用的是离散符号,而处理图像等信息时用的是连续向量,一个是连续的向量空间,一个是离散的符号空间,如果把这两个空间放在一块,需要什么样的数学工具?
人工智能进一步向前发展,问题就更多了。我们现在处理的数据,拿图像来讲,可以看作是由高维向量组成的二维矩阵,它属二维欧氏空间数据。至于文本,如果不考虑文法等结构,就是一个简单的词序列,是一个时间序列数据。我们叫做符合欧氏空间要求的数据,但是我们目前处理的大量数据并不符合欧氏空间的条件。比如说社交网,人与人之间的关系通常不符合欧氏条件。比如,“我的朋友的朋友”不见得是我的朋友。我们过去还常常说“敌人的敌人是朋友”。换句话说,它不符合传递性,所以这个空间是非欧空间。非欧空间我们现在应该用什么样的数学工具来解决它?丘先生说过用图论,我们回到图的关系上。图就复杂了,有环、无环、有向、无向等等。比如,因果关系是有向的。了解了这些困难与问题之后,就明白我们为什么需要重视数学。大家经常问人工智能应该跟哪些学科结合?我首先把数学放在第一位。好多人把神经科学、心理学等放在前面,我认为应该第一位放数学,把神经科学、心理学等放在它的后面。
我今天来讲这些,就是给予大家厚望。刚才丘先生讲了,我们的数学要达到世界领先水平或者世界最高水平,人工智能实际上也面临同样的任务。人工智能必须要走到世界前列,她跟数学还有点不一样,数学已经发展了千百年,有很多很多的积累;而人工智能我们跟大家基本站在同一起跑线上。虽然它已经发展了60多年,但这60多年进展并不是很大,所以我们应该更有机会去做成世界最高水平。我们需要依靠数学,数学首先达到世界先进水平了,我们(人工智能)才有希望达到世界先进水平。如果我们国家的数学很落后,相信我们的人工智能也会受到影响。好多人问我,发展人工智能的关键在什么地方,我说关键在于基础研究,因为人工智能要闯无人区。大家都在同一起跑线上,你想跟谁学?我们想跟也没地方跟,只能靠自己。我们非常愿意跟丘先生合作共同开展人才培养工作,我一直认为如果我们没有世界一流的数学,也不可能有世界一流的人工智能。
今天我来祝贺大家。我1953年进入清华大学,到如今在清华大学学习工作了68年。我想以一位老师或者老学长的名义,欢迎大家来到清华园,希望我们密切合作,共同把数学的事业和人工智能的事业推向前进。
谢谢大家!
嘉宾介绍
张钹,清华大学计算机系教授,中国科学院院士。2011年德国汉堡大学授予自然科学名誉博士,获2014年度CCF(中国计算机学会)终身成就奖,2019年度吴文俊人工智能科学技术奖最高成就奖。
他从事人工智能、人工神经网络和机器学习等理论研究,和模式识别、知识工程和机器人等应用技术研究。在上述领域共发表学术论文200多篇和5部(章)专著,其科研成果获ICL欧洲人工智能奖等。此外,他是智能技术与系统国家重点实验室创建者之一,并于1990-1996年担任该实验室主任。