王怀民院士:图灵计算模型仍是最深刻的理论基础,是新科学基础的基点

下文为国防科大王怀民院士在第 24 届全国高校计算机学科系主任 / 院长论坛上的主旨报告《人机物融合智能化时代,计算机学科专业创新人才培养》。机器之心做了不改变原意的整理。 在计算无处不在的当下,计算机学科专业却大有泯然众生之态。新时代的计算机学科专业创新人才该如何培养? 王怀民院士以 120 年的时间跨度回顾计算机学科专业的发源和发展历程,不同的历史阶段有着不同的发展模式,在时代的激流中什么改变了,什么是不变的?计算机科学和技术的发展具有国家战略意义,在人机物融合的新时代,如何理解从而实现科技创新?

图片

王怀民院士

王怀民,分布计算领域专家。中国计算机学会会士。2019 年当选中国科学院院士。长期从事面向网络的分布计算研究,在分布计算模型、技术与平台方面取得系统性和创造性成果,为我国分布计算核心关键技术自主创新、为国家和军队网络信息系统建设和发展做出了突出贡献。曾获国家科技进步特等奖 1 项、二等奖 2 项,国家技术发明二等奖 1 项,国家教学成果二等奖 2 项。

人机物融合智能化时代

计算机学科专业创新人才培养

1、矛盾问题:渗透性 VS 存在感

计算机教育经常谈及的一个矛盾,就是计算机技术的渗透性和计算机学科专业的存在感的问题。

1991 年,前 Xerox PARC 首席科学家 Mark Weiser 在《科学美国人》杂志上提出了泛在计算(Ubiquitous Computing)的概念。他认为最深刻的技术是那些似乎从人们视野中消失的技术,这些技术被编织进日常生活中,使人们用而不觉。

实际上,我们今天已经处于这样一种人机物融合的智能化新时代当中,计算无处不在,软件定义一切,网络承载文明,人机物融合的智能化基础设施已经成为现代社会基础设施的重要组成部分。我们切身感受到了泛在计算的现实存在。

但同时,在新的时代,计算机教育如何发展,我们又面临一种存在感的困惑。

30 年前,计算机科学技术学科由三个二级学科构成,这在很大程度上是因为学科发展内涵和知识体系的不断丰富,使得在四年本科教育以及之后的研究生教育当中,需要更多的专业化、专门化。

图片

如果把计算机科学与技术学科比作一只老母鸡,那么在历史进程中,我们看到的是老母鸡生下了若干个鸡蛋,然后孵出了一群小鸡。随着计算机学科专业向着泛在形态发展,期间产生了若干个和计算机学科专业平行或脱胎于计算机科学与技术学科,比如软件工程、集成电路、网络空间安全等,乃至于如今越来越多的岗位需要人工智能、大数据、物联网等专业的专门人才。

因此,社会的发展以及计算机学科专业自身学科建设的要求,不仅需要我们在有限的时间内通过专业化的人才培养来产出人才,还需要通过学科和专业体系的独立发展,使其在大学办学过程中,能够成为有效承载使命任务的资源分配单位。

学科也好,专业也好,已经不简单是知识体系的问题,或专业岗位人才培养的问题,还是大学进行资源配置的基本单位。

在大学办学过程中,一个独立的学科,在教授名额上,在教授评价分配指标上,在人才引进指标上,乃至于在招生分配指标上,都是一个独立的单位。有了学科,就可以承载资源分配的任务,才能够去实现培养社会所需要的人才的任务。

更进一步,在大学教育过程中,还需要一套行政体系来有效支持学科专业培养的资源配置,于是又发展出了计算机学院、软件学院、网络空间安全学院、集成电路学院、人工智能学院。这种发展趋势是符合国家战略和对人才这样一种第一资源的需求的,大学也应该积极响应并施行相应的举措。

但我们还是难免会有一些失落,最后在这样一个鸡圈当中,我们已经分不清最初的老母鸡是哪一只了,计算机学科专业作为其中的一员,出现了一种存在感的失落,这是我们面临的现实问题。

2、从何而来:知识创造 VS 技术创新

那么,人才培养大的格局从何而来?我想从科技创新的视角,即知识创造和技术创新相互作用的视角,进行一个长周期的复盘。

计算机学科专业孕育、生长、发展图谱可以从长达 120 年的周期来看。其中,前 60 年计算机学科专业的发育发展是知识创造驱动型的发展模式,它的重要的特征是以学科知识体系构建为重点,而后 60 年则是以技术创新为主导的推动力。

图片

1900 年,数理学科发生了两件重要的事情,一个是希尔伯特在当年的巴黎国际数学家代表大会上提出了 23 个重要的数学问题,另一个是物理学家开尔文宣布「物理学的科学大厦已经基本形成,但仍有两朵乌云」。

在数学这个分支里,简单说,希尔伯特相信数学是可以完备化和机械化的,由此发展出了元数学,在这种思想观念的革命中,产生了颠覆性的哥德尔不完全定理和图灵不可判定问题的回答,由此「无意中」产生了图灵可计算理论。而物理分支则在解释「两朵乌云」的过程中,产生了相对论和量子力学,尤其推动了微电子学与固体电子学的新发展,特别是与图灵模型的结合,使得可编程通用电子计算机成为可能。

于是,在这样一种典型的知识创造驱动发展模式下,在数学和理论物理的深邃思考当中,产生了今天我们所知的计算机科学与技术学科。

然而,从上世纪 60 年代开始,计算机学科专业发展增加了一个新引擎——技术创新,知识创造与技术创新双引擎驱动成为主要的发展形态。

伴随着集成电路、大规模集成电路、超大规模集成电路的产生,以及程序设计理论与软件开发方法的进步,计算机进入到社会、商业领域,也进入到了千家万户。同时,市场和企业的力量,对于计算机学科专业发展也产生了巨大作用。也是在这一过程中,我们这一学科的渗透性得以体现。

之后,互联网、移动互联网、云计算、大数据乃至于社会网络和人工智能等一系列技术的发展,既是计算机学科专业向生产、生活和社会各领域更进一步渗透的体现,同时也让我们看到既有学科体系的基础理论已经 hold 不住新技术的发展。

今天,我们已经进入一个由信息空间、人类空间以及物理空间相互融合的智能化时代。在 120 年的历史进程中,我们看到这样一个发展规律,一方面是数理科学的深邃的原始理论创新所积累起来的计算机科学技术持续发展的巨大的内在原动力,推动了计算机学科专业的发展。同时,技术创新释放了计算机科学内在的科学或者说积累起来的知识对社会生产力的影响。

在过去二三十年,跨界组合的颠覆性创新,成为推动计算机学科专业发展的外在动力,开放共享的群体融合创新,成为计算机技术持续发展的一个鲜明的时代特征。

从教育视角看,便出现了两种形态的教育:一种可以称之为学科知识体系导向的教育,通常表现为研究型大学的教育风格;还有一种是专业技术职业导向的教育,可以称之为应用型大学或职业型大学的技能型教育模式。

图片

其中,研究型大学更加注重由知识体系所形成的学科开展人才培养。为什么会这样,我的一个结论是,研究型大学要应对未来,而给学生以基础性的知识体系的构建,是应对不确定未来的一个有效方法。

而对于职业型大学、专业技术型大学,则侧重对特殊工具和对特殊工具的有效使用技能的培养,比如说新媒体技术、电影特效制作技术,这是社会对于计算机领域技能型专业人才的现实需求,因此大学教育必须响应,设立这些专业无可厚非。

在这个进程中,我们看到过去 60 年特别是近 30 年由技术创新驱动的发展,给计算机学科专业的发展、社会的发展,以及计算机学科专业对社会发展的影响,产生了极其深刻的影响。

所以,我们常说的计算机学科专业发展对社会产生的深刻影响,实际上是由技术创新驱动所带来的深刻影响。

数字化或者说信息化的三次浪潮,本质上是一种持续性创新与颠覆性创新交替作用的产业发展的历史进程。

图片

这一进程遭遇过几次天花板,比如上世纪 90 年代中后期,个人计算机的市场规模出现了天花板。这个天花板是如何突破的呢?是互联网产生以后,使得计算机由企业和重要机构得到广泛应用,并进而向家庭和个人普及。

过去 5 年,互联网发展似乎也出现了瓶颈期,中国的网民人数已经超过 10 亿,似乎我们又遇到了一个天花板,表现为互联网产业发展的市场空间的天花板。如今,这个天花板又被机器学习、人工智能突破。

因此,一个技术出现后,通过持续性的创新,市场空间不断拓展和扩大,从而向社会渗透,在市场空间达到一定的饱和或者说遭遇一个瓶颈后,又一个技术的创新,再次拓展了市场,突破这个天花板。

这一过程对计算机学科专业产生了极其深刻的影响,我们也感受了明显的变化。但在这个变化之中,有什么是不变的呢?

3、变与不变:坚守经典 VS 超越经典

变与不变的核心,是关于坚守经典和超越经典的问题。

相对于今天的变化,120 年来不变的是,图灵计算模型仍然是推动人机物融合智能时代的那个不变的强大模型。

图灵提出图灵机,是为了间接挑战希尔伯特关于数学系统是完备而且数学定理是可以机械证明的这个乐观预言,他定义了一个思想实验,即用图灵机模型这个可操作、可机械执行的数学系统,证明在这个数学系统中有不可判定问题,也即图灵机停机问题。

我们进一步认识到,一个计算能力足够强大(即包括自然数算术运算)的计算模型的非平凡性质对于该计算模型是不可判定的。既有能力足够强大的计算模型的计算能力都等价于图灵机。所有能力足够强大的计算模型的计算效率都在多项式复杂性意义上等价。

可以说图灵机是一个意外的收获,其能力如此强大,似乎触达了人类智能确定性计算的极限,在今天仍然有深刻的意义。

图片

这是一种世界观的改变。希尔伯特也好,开尔文也好,他们认为世界是一个确定性的机器。哥德尔、图灵则认为这个确定性的机械的世界观是有边界的,他们指出了这个边界,而这个边界本身是极有价值的。在这样一个新的世界观下,人类可以把我们能够 「说清楚」 的东西进行编码,并由通用图灵机解释执行。

后来微电子学与固体电子学的发展,让我们能够把这个思想实验变成可自动执行的物理装置,今天的冯 · 诺依曼体系结构的通用数字计算机就是通用图灵机的物化人工计算装置,并且我们可以让这个物理装置自动执行我们编写的那些已经想清楚的确定性过程,也就是算法。

通用计算机的诞生使得人工智能研究成为现实,而实际运转的人工智能系统必须要有一个人工装置来模拟和执行人的智能,而这样的系统如今看来似乎都是图灵可计算的,以至于我们现在说让一个设备变得智能,实际上就是让这个设备具有通用计算的能力。

过去我们把软件「固化」在一个物理设备上,今天我们发现,应该让这个固件具有通用计算的能力。实际上今天的操作系统是通用计算能力在系统软件上的一个呈现。

图片

还有一件事情没有改变,就是计算技术由「专」到「通」的特殊发展路径。图灵模型是在解决特定数学问题过程中无意产生的一个通用计算模型,最初的计算机是用来进行弹道计算的,但它竟然是通用的,乃至于后来个人计算机、互联网应用、大数据等等一系列通用平台都源自解决特定问题的技术,通用平台产生了渗透性。

到了人机物融合的智能时代,我们需要构建通用的复杂智能软件的平台,进一步推进通用技术的发展。

如今越来越多的设备中嵌入了一种通用计算的能力,比如嵌入式计算机及其操作系统,我们还希望由「专」生成通用的,所谓的泛在操作系统。

通用和专用的相互渗透性,在图灵计算模型的那种形态时就已经打下了基础,今天又可以具体化到特定领域,形成通专相继的渗透性的发展模式。

图片

今天我们呼唤泛在操作系统,不变的依然是存算一体的通用计算模型,这是计算机学科专业要教给学生的「不变」。

当然,我们也要注意到这里面的「变」:感、通、控使得如今的系统和外部世界建立起了联系。过去计算系统只在编码空间里谈事情,而今天在这个体系当中需要有传感器感知外界,需要有通讯设备和主体之外的主体,包括人在内进行交流,还要控制对外部物理世界的干预,因此和外界的联系成为今天人机物融合智能化时代需要关注的「变」。

这个变首先表现在计算机由「工具」变成了人类社会方方面面都依赖的「基础设施」。因此,计算机学科专业和人才培养也应该有一次新的世界观的改变。

图片

过去,经典算法是指有穷表达,有穷编码,有穷执行,它表达的是一个可计算函数,执行结果只和参数相关,执行过程不和外界有任何信息交流的算法。

今天,我们看到的是持续表达,持续学习,持续执行,任何时候都可以产生结果,而这个结果在和外界交互过程中又被改变的执行过程。

比如说今日头条,我们每次打开看到的都是不一样的结果,输入同样的关键词,搜索引擎每次给出的是不同的结果,因为这个系统和外界持续进行信息交流。更不用说持续学习系统,在与外界进行数据交换的过程中,获得越来越多人类行为空间和机器行为空间当中的新的数据,进一步训练模型,进而又会产生行为的变化。

这种持续的执行过程,从一台机器的意义上讲,仍然是图灵机模型,图灵机模型是可以持续执行过程的。但重要的是,我们注意到一个可能超越经典图灵机模型的变化,是被我们长期忽略的。

图片

在 1939 年的博士论文中,图灵曾提出了一个「天启图灵机」的概念,当图灵机在执行过程中碰到一个状态,不知道该如何行动时,它可以寻求天启(Oracle)的帮助,Oracle 是一个智慧的「神」,具体是什么我们不知道,但至少图灵在当时就想到了机器可以借助外界的支持。

今天,在人机物融合的智能化时代,人工构造的联网计算机系统中,每台通用的计算机总是在和外界进行联系。因此,我们看到了人机物融合的复杂智能系统,大量局部自治智能软件系统以多种形态混合呈现、关联耦合,形成人机协作、持续学习、成长演化的大规模生态系统。

这个系统不仅包括信息系统,也和与该信息系统相互作用的社会系统和物理系统密切相关。尤其是系统要素之间的耦合交互关系、动态变化,日趋复杂。整个系统的行为难以通过各自治软件系统特征的简单叠加加以刻画。

我们还缺乏有效理论解释人机物融合智能化时代的系统生态的基本规律。但是,技术创新驱动已经生动展现在我们面前,我们一边享受着它的便利,也一边面对着它可能产生的对人类社会的侵害,而我们现在对这种可能性一无所知或者知之甚少,这就是我们今天面临的「变」。

图片

计算机学科专业发展到今天,我们应该注意到其发展驱动力的转换,也即从知识驱动的学科发展模式,转换为技术创新驱动的历史进程。

今天,我们已经在创造人机物融合的智能化的社会,一系列的现实问题需要解决。为了应对挑战,我们需要全面理解科技创新。

4、应对挑战:全面理解科技创新

当年朗讯在设计 logo 的时候,试图诠释其对知识创造和技术创新及其关系的理解:知识创造是科学发现和基于科学发现开展的技术发明的创新活动;技术创新则是把科学发现和技术发明转化为现实生产力的一系列的制度设计及其实践活动。

图片

我们今天看到的历史进程,已经不是一个简单的从知识创造到技术创新的顺序过程,也不是简单的叠加过程,而是一个相互作用的持续过程,在这个相互作用的过程中,会产生若干新的科学问题。

今天的科技创新,不能简单理解为知识创造和技术发明的叠加,而是一个相互作用的持续过程。知识创造再多,如果没有技术创新加持,知识创造效益就难以得到体现,而一旦技术创新有效机制和新知识创造作用在一起,就会产生倍增效应。

同时,技术创新走到今天,当我们对于人机物融合新时代的认知没有新的科学升级的时候,也就是这个领域的知识创造为 0 的时候,技术创新的危险性也会影响到科技创新的真正作用。

图片

我们在学科和专业建设的时候,在人才培养的时候,研究型大学在注重未来创造性和原创性知识解释过程中,也要重视这个时代技术创新带来的新问题。专业型大学或者是职业型大学,也需要关注新知识创造的趋势和新知识点产生的可能性。

同时,在学科建设的时候,像我刚才举的一窝鸡蛋、大鸡带小鸡,到最后到一群鸡的例子,我们要把握界内和界外,把世界观打开,比如计算机学科在学习机器学习课程的时候,是不是应该学习一点信号处理知识;在讲数字控制器的时候,是不是要学习一点控制理论;在微电子走到尽头的时候是不是要学习量子信息;我们在形成技能的时候,不仅是计算机技能,对于社会学、管理学、经济学和传播学这样一些知识是不是也要有所涉及?

当然,时间是对大学教育的一个不可逾越的约束条件。40 年前我们就学 8-10 门专业课走到今天,为什么现在的学生要学那么多门课,怎么平衡好这个课程与课时的矛盾,也引发我一些思考。未来的课堂授课应该聚焦基础理论性的课程,当然基础理论性的课程也有如何授课的问题,例如我们能不能用 3 个小时、6 个小时、8 个小时,帮学生建立起对图灵计算模型的正确认知,而不是在课堂上推导图灵停机问题不可判定的冗长证明。对于技能型的课程,例如程序设计,不可能用课堂授课的形式完成,需要给学生更多动手实际的机会,这样可以省出很多课题授课课时。而如何提高技术创新的实践能力,我认为可能的答案是开源创新。

图片

最后总结一下,这个时代不变的东西是什么?我认为图灵计算模型仍然是最深刻的理论模型,计算机学科专业教育走到今天,这个模型仍然是我们认识变化的理论基点。图灵计算模型的思想是人机物融合智能化时代新科学基础基点,是基础,是起点,是参照物。理解变化需要基点,基点的基础要打好。

同时,计算机学科专业的教育需要全面深刻地理解科技创新,它不仅仅是研究型大学里面所讲的知识创造,也不能仅仅偏废于专业型、职业型大学里面的技术创新的含义,应该是相互作用的一个历史进程。

新的时代,计算机学科专业创新人才的培养需要新的教育范式的支持。

我就和大家谈这么多。请同志们批评指正。谢谢!

相关资讯

矩阵元获批“上海市分布式隐私人工智能技术创新中心”

近日,上海市科学技术委员会发布了《关于2020年度上海市技术创新中心建设立项的通知》,为贯彻落实《关于进一步深化科技体制机制改革 增强科技创新中心策源能力的意见》,推进重点产业领域技术创新,经专家评审论证,确定将“上海市特种数控装备技术创新中心”等18家技术创新中心列入2020年度上海市技术创新中心建设立项计划。矩阵元全资子公司上海阵方科技有限公司将承担“上海市分布式隐私人工智能技术创新中心”的建设工作。党的十九届四中全会提出将数据与资本、土地、知识、技术和管理并列作为可参与分配的生产要素,这体现出数据在国民经济运

姚班校友、斯坦福助理教授吴佳俊翻译,视觉计算经典《Vision》中文版面世

这本书曾深刻地影响了一代脑、认知、计算机视觉领域的学者。

2021图灵奖揭晓:高性能计算先驱、超算TOP500榜单创始人之一Jack Dongarra获奖

他曾说过:未来的计算架构会是 CPU 和 GPU 的结合。