清华主页 EN
导航菜单
综合新闻

没有世界一流的数学,

就不可能有世界一流的人工智能

来源:清华大学求真书院 09-03 张钹院士

图片

张钹院士致辞

各位老师、各位同学,很高兴能参加求真书院的开学典礼。

今天在座的老师和同学都是从事数学的,你们热爱数学,在年轻人中间也有一定的数学天分,而且决心将来为我们国家数学事业的发展做贡献。我是今天来的人中间为数不多的、不是做数学的人,但是有一点跟大家相同——我年轻的时候也非常喜欢数学。1953年也就是68年前,我考大学的时候,是以数学满分的成绩进入清华大学,但实际上我是在工作的过程中逐步认识到数学的重要性,以及数学在推动其它学科发展的重要作用

今天借此机会,向大家讲一下我的体会。我是1958年从清华大学自动控制系毕业,我从事的工作是自动控制,而且干了20年的自动控制,到1978年为止。“自动控制”这个专业怎么形成的?大体上是从第二次世界大战以后,数学家诺伯特·维纳在1948年写了一本书,英文叫《Cybernetics》,我们中国把它翻译成为《控制论》,它有一个副标题,叫做“动物和机器中间的控制和通讯”。第二次世界大战前后,我们搞了很多自动化的系统,比如高炮的自动控制、温度的自动调节,跟人体上的很多系统很相似。他(维纳)发现一个人得了运动失调的疾病以后,行为上就会发生振荡的现象,比如当手去摸东西的时候,常常抓不到东西,在要摸的东西周围反复振荡,他觉得这个现象也发生在温度调节系统,也发生在高炮控制系统中。这是什么现象,这是一个反馈闭环系统中发生的不稳定现象。为了揭示这个现象,他引进了数学。

在分析和设计控制系统时,我们必须掌握两个数学工具一个我们叫做域法,在时间领域里头去解决它,基本上用的是微分方程,研究微分方程解的稳定性,它在什么条件下发生振荡;第二个方法叫做频域法,通过拉布拉斯变换,把它变换到复数空间去,用的是复变函数。我在清华学了5年,用3年学基础科学,微积分就学了5个学期,当时微积分的参考书是3册7本,后面还学了线性代数、复变函数和投影几何等。

实际上我们搞自动控制的,离不开数学工具,而且后来自动控制系统发展的越来越复杂,非线性、分布式、变参数……需要用的数学工具也越来越复杂。到了1978年的时候,清华大学自动控制系变成计算机系,我就进入了计算机系,从事人工智能教学与科研。计算机跟数学有非常深的渊源。大家知道计算机是1946年在宾夕法尼亚大学做出来的,这个计算机全名叫“现代电子数字计算机”。1936年的时候,阿兰·图灵就给出计算机的数学模型,这个数学模型叫图灵机(Turing Machine),以后计算机就是根据这个数学模型发展起来的。通过这个数学模型,首先解决了计算机能算什么、不能算什么,所谓“图灵可计算性”理论。第二,从计算机数学模型出发定义了算法,又从这个数学模型出发定义了计算机的体系结构。从1946年计算机做出来以后,计算机的发展为什么一路顺风?因为从这个数学模型人们知道应该发展什么硬件,应该发展什么软件,应该发展什么样的操作系统,所以计算机的发展离不开数学的推动。

这些我讲的是过去的事,接下来我要讲现在的事。现在我搞人工智能,人工智能跟数学有什么关系?首先人工智能是1956年开始的。第一代人工智能,主要是模拟人类的理性智能(行为),像理性推理、分析、规划、决策等。当时给出的数学模型是符号推理模型,主要的数学工具是一阶谓词逻辑,但是这个数学工具过于简单,深入不下去,为什么?缺少表达不确定性的数学工具。大家想一想,人类的推理中绝大多数不是逻辑推理,或者说不是确定性的推理,而是不确定性的。大家想一想,医生看病,如果知道一些症状,就知道一定犯那种病,知道犯那种病,就一定知道怎么治疗。如果是这样,我们还要医生干吗?大家看一看书就能看病了。所以医生的存在,也就是人类的存在就是要解决不确定性问题的。看病时发现了你的一些症状,例如发烧、咳嗽等等。你有可能是感冒,也可能是肺炎,也可能是冠状病毒……犯同样病的人,不同的人治疗方法也不一样。这种不确定性,数学上应该怎么描述?大家费了好大劲找来了两个工具,一个是概率,一个是模糊数学。但是我可以告诉大家,这两个数学工具都不足以描述人类的不确定性推理和不确定性知识。所以现在卡在那儿了,谁能够解决得好,谁就能让人工智能往前走一步。

第二代人工智能大家都非常熟悉,所谓数据驱动、深度学习。深度学习是什么?为什么发展这么快?它实际上就是一个函数拟合。这个拟合函数现在主要用优化的方法来求解,所以好多的数学工具可以用,如概率统计、泛函、变分……有了这些数学工具,深度学习发展极快。大家知道,人工智能中有一个GPT-3(生成式预训练转换器)模型——一种具有 1750 亿个参数的自回归语言模型,看看这个函数的模型有多大!谷歌公司利用这个模型,学了3000亿个词,也就是说,这个计算机学的内容比我们一辈子看过的和听过的词多了100倍。换句话说,GPT-3把所有我们能看到的文本都读过了。读过这么多材料以后,会有什么本事?我们发现它会做许多出乎我们意料的事。比如能做两位数(或三位数)的算数加法,基本上没有错。它从哪儿学到这些本领的?目前还说不太清楚,希望数学能帮忙去解决这个问题。与GPT-3类似的模型统称基础模型,这个基础模型很重要。当它学的文本很多时,具有比较强的推广能力,这是为什么?可是在有些地方却显得很笨。比如,你问它:“人有多少只眼睛?”它说“两只”,没问题。当问到 “我的脚有几只眼睛” 时,它回答也是“有两只”,这叫什么?无知,或缺乏常识。它一方面表现出学问很高,但有时又显得非常笨拙。这又是为什么?我们能用什么样的数学工具来理解它和解决它?

我们现在提出来发展第三代人工智能的主张,要达到这个目标必须把数据驱动跟知识驱动结合起来。光靠数据驱动的方法,通常学不到它的本质,也理解不了它的内容,只有在知识的引导下,才有可能真正把学问学到手。但是数学问题又来了,因为我们在做理性推理的时候用的是离散符号,而处理图像等信息时用的是连续向量,一个是连续的向量空间,一个是离散的符号空间,如果把这两个空间放在一块,需要什么样的数学工具?

人工智能进一步向前发展,问题就更多了。我们现在处理的数据,拿图像来讲,可以看作是由高维向量组成的二维矩阵,它属二维欧氏空间数据。至于文本,如果不考虑文法等结构,就是一个简单的词序列,是一个时间序列数据。我们叫做符合欧氏空间要求的数据,但是我们目前处理的大量数据并不符合欧氏空间的条件。比如说社交网,人与人之间的关系通常不符合欧氏条件。比如,“我的朋友的朋友”不见得是我的朋友。我们过去还常常说“敌人的敌人是朋友”。换句话说,它不符合传递性,所以这个空间是非欧空间。非欧空间我们现在应该用什么样的数学工具来解决它?丘先生说过用图论,我们回到图的关系上。图就复杂了,有环、无环、有向、无向等等。比如,因果关系是有向的。了解了这些困难与问题之后,就明白我们为什么需要重视数学。大家经常问人工智能应该跟哪些学科结合?我首先把数学放在第一位。好多人把神经科学、心理学等放在前面,我认为应该第一位放数学,把神经科学、心理学等放在它的后面

我今天来讲这些,就是给予大家厚望。刚才丘先生讲了,我们的数学要达到世界领先水平或者世界最高水平,人工智能实际上也面临同样的任务。人工智能必须要走到世界前列,她跟数学还有点不一样,数学已经发展了千百年,有很多很多的积累;而人工智能我们跟大家基本站在同一起跑线上。虽然它已经发展了60多年,但这60多年进展并不是很大,所以我们应该更有机会去做成世界最高水平。我们需要依靠数学,数学首先达到世界先进水平了,我们(人工智能)才有希望达到世界先进水平。如果我们国家的数学很落后,相信我们的人工智能也会受到影响。好多人问我,发展人工智能的关键在什么地方,我说关键在于基础研究,因为人工智能要闯无人区。大家都在同一起跑线上,你想跟谁学?我们想跟也没地方跟,只能靠自己。我们非常愿意跟丘先生合作共同开展人才培养工作,我一直认为如果我们没有世界一流的数学,也不可能有世界一流的人工智能。

今天我来祝贺大家。我1953年进入清华大学,到如今在清华大学学习工作了68年。我想以一位老师或者老学长的名义,欢迎大家来到清华园,希望我们密切合作,共同把数学的事业和人工智能的事业推向前进

谢谢大家!


嘉宾介绍

张钹,清华大学计算机系教授,中国科学院院士。2011年德国汉堡大学授予自然科学名誉博士,获2014年度CCF(中国计算机学会)终身成就奖,2019年度吴文俊人工智能科学技术奖最高成就奖。

他从事人工智能、人工神经网络和机器学习等理论研究,和模式识别、知识工程和机器人等应用技术研究。在上述领域共发表学术论文200多篇和5部(章)专著,其科研成果获ICL欧洲人工智能奖等。此外,他是智能技术与系统国家重点实验室创建者之一,并于1990-1996年担任该实验室主任。

返回顶部
相关文章
  • 清华大学求真书院2021级开学典礼杨乐院士致辞

    清华大学求真书院2021级开学典礼杨乐院士致辞:把握珍惜好时代,再创数学辉煌!

  • 清华大学求真书院2022级开学典礼嘉宾致辞 | 曾嵘副校长

    尊敬的丘成桐先生,亲爱的各位老师们、同学们:今天很高兴受邀参加求真书院开学典礼,首先对朝气蓬勃的新同学们表示热烈的欢迎,也对大家即将在清华、在求真开始一段新的人生旅程表示美好的祝愿。2020年,对清华大学的教育教学改革发展来说,是非常重要的一年。在这一年的5月,学校成立了五个强基计划书院,为国家基础学科的长期发展及关键领域的重点突破培养拔尖创新人才。同年,丘成桐数学科学领军人才培养计划正式对外发布,...