郭雷
中科院国家数学与交叉科学中心主任
中国科学院院士
科研教育

系统的反馈原理及魅力

来源:《科学名家讲座》第十一辑第65页-75页 | 发表时间:2013-01-01 | 作者:郭雷 | 打印】 【关闭
今天的报告涉及控制论与系统科学领域的一些基本内容。我将首先从中外两位著名科学家谈起,他们分别是被称为“控制论之父”的维纳和被誉为“中国航天之父”的钱学森。随后,我将简单介绍系统、控制与反馈等几个基本概念,然后通过若干实际例子来说明反馈原理的重要性和内在魅力,最后简单概述反馈系统的设计方法。
 
一、维纳与钱学森
 
被称为“控制论之父”的维纳是美国著名数学家,他写过一本书,名字就叫《我是一个数学家》。1906年12岁时,维纳进入塔夫茨数学系学习;18岁时,在哈佛大学取得博士学位。维纳与另外一位同时代的著名数学家冯·诺依曼一样,被称为是“信息时代的英雄”, 他们都是数学与其它学科交叉研究的光辉典范。维纳早期的贡献主要在数学领域。1933年,因有关陶伯定理的工作,他与莫尔斯分享了美国数学会五年一次的博赫尔奖。几乎同时,当选为美国科学院院士。他于上世纪30年代应邀来到清华大学与李郁荣等合作,并讲授数学课。维纳曾把他在中国的这一年作为自己学术生涯中的一个里程碑。1964年,维纳获得美国总统授予的国家科学奖章,是为了表彰他“在纯粹数学和应用数学方面并且勇于深入到工程和生物科学中去的多种令人惊异的贡献及在这些领域中具有深远意义的开创性工作”,这个授奖词恰如其分的表述出了维纳对数学及其交叉学科的贡献。
 
但是,真正使维纳在社会中名声大振的,则是他所著的《控制论》(或动物与机器中的通讯与控制)一书。《控制论》是一本科学名著,共有10章,表面看来内容有点分散,但各章自成体系。总体上,该书从“动物智能”与“机器智能”的若干重要方面展开对比讨论,密切围绕 “控制与通信”这条主线以及“反馈”这一基本原理,分别论述了时间问题、遍历性与统计力学,时间序列与信息,反馈与振荡,计算与记忆,视觉识别,大脑可靠性,社会系统通讯与内稳定性,学习和自生殖机,脑电波与自组织系统等。这是一本划时代的开创性著作!维纳对数学、生物、电子工程都有很深的造诣,因此他能深入浅出,直达问题本质,并有很大创新。这种综合集成能力又与他的哲学素养有关。维纳在数学与交叉学科研究中所达到的深度和广度堪称典范!
 
谈到控制论和维纳,我们自然会想到我国著名科学家钱学森先生。大家知道,钱先生长达70年的科学生涯,纵跨了三个不平凡的时代。第一个是20世纪30年代中到50年代中,在美国的20年, 钱学森以其出众的才华成为空气动力学等领域的著名专家;第二个是1955年回到祖国至1978年,他投身到我国“两弹一星”工程中并做出了重大贡献,被誉为“中国航天之父”;第三个历史年代,是我国改革开放以来迅速发展的30年,他投入了相当大的精力从事系统学的研究,并结合我国现代化建设的实际问题,逐渐发展形成了其系统科学思想。
 
钱学森先生是工程控制论的奠基人,这是以钱学森1954年在美国出版的英文著作《工程控制论》为标志的,该书先后被翻译为俄文、德文、中文。因为这本书,钱学森先生获得中国科学院颁发的首届自然科学一等奖金,同时获得一等奖金的还有中科院数学研究所的华罗庚和吴文俊先生。在《工程控制论》的序言中,钱先生指出,“工程控制论是一门技术科学,而伺服系统工程却是一种工程实践……把工程控制论建成一门技术科学的好处就是:工程控制论使我们可能有更广阔的眼界用更系统的方法来观察有关问题,因而往往可以得到解决旧问题的更有效的新方法,而且工程控制论还可能揭示新的以前没有看到过的前景”。该书后来出版了修订版,增加了现代控制论的一些重要内容,作者为钱学森与宋健。在修订版序言中,作者通过下面一个例子来说明控制论的作用:“虽然作为现代火箭技术和航天技术萌芽的V-2火箭在控制论诞生之前好几年就出现了,但是,同应用工程控制论所实现的高精度、高可靠性的制导技术比较起来,V-2机电式制导系统实在是太原始了。法西斯德国向伦敦发射了2000枚这种射程300公里的火箭,只有1230枚落入市中,这其中又仅只有半数落在距目标中心13公里的范围内。而现代制导技术可以达到这样的成就:射程1万公里的洲际导弹弹头落点圆公算偏差在30米以内。”
 
钱学森认为,在现代科学技术体系中,系统科学如同自然科学、社会科学、数学科学、思维科学等一样,是重要的科学技术部门之一。在体系结构方面,他提出系统科学具有如下三个层次:应用技术(系统工程、自动控制原理等)、技术科学(运筹学、控制论、信息论等)和基础理论(系统学,Systematology)。钱先生认为,系统学是一门需要创建的基础科学。在多年的探索中,他与合作者先后提出了开放的复杂巨系统、 从定性到定量的综合集成法、综合集成研讨厅体系、大成智慧学与大成智慧工程等基本概念和方法论,并出版了《创建系统学》一书 。钱学森先生在系统科学的三个层次上,都有重要贡献。
 
二、系统、控制与反馈
 
为了说明反馈的作用和魅力,首先需要了解几个基本概念。
 
1、什么是系统?
 
我们几乎时时都离不开系统这个概念。概括来讲,系统是由相互关联、相互作用和相互依赖的若干部分所组成的具有特定功能的整体; 这个“系统”本身又是它所属的一个更大系统的组成部分(子系统)。系统的整体功能往往不等于其组成部分功能的简单相加, 称之为涌现。系统可以分为自然系统与人造系统(例如太阳系与工厂企业)、开放系统与封闭系统(开放指与外界有物质、能量和信息交换)、 动态系统与静态系统(动态指系统的状态随着时间的改变而改变),以及复杂系统与简单系统(复杂指子系统种类繁多且相互作用关系复杂。例如,生物系统、人脑系统、人体系统、地理系统、社会系统等等)。
 
2、什么是控制?
 
系统的行为可以用其状态来描述,对系统进行控制的目的,就是通过对系统施加影响而改变系统的状态,以达到我们所期望的目标。与系统概念一样,控制也是一个普适概念,与其密切相关的概念还包括:调控、调整、调节、校正;操纵、驾驭;管理、决策、调度等。我们日常生活中常说控制这个词, 例如:导弹控制、火箭控制、温度控制、压力控制、速度控制、位置控制、燃烧控制、经济控制、宏观调控、生态调控、污染控制、噪声控制等。控制与系统是密切相连的两个概念, 控制系统是系统科学中所研究的一类重要的典型系统。维纳曾说,“一个控制系统不是一个孤立的系统,而是一个与周围环境密切联系的系统,特别是控制系统通过自身的反馈机构可以减少系统的‘无组织程度’,因此,在控制系统中经常发生熵减少的过程” 。钱学森也曾说,“控制论所讨论的主要问题是一个系统的各个不同部分之间的相互作用的定性性质,以及整个系统总的运动状态。”
 
3、什么是反馈?
 
直观来讲, 反馈是将系统的输出信号以某种方式返回到输入端, 并以适当方式改变输入,进而影响系统状态或功能的循环过程, 一般对应闭环系统(可以称为循环因果,如人走路、骑自行车、开汽车等)。反馈还可进一步分为正反馈和负反馈。正反馈使输出起到与输入相似的作用,使系统偏差不断增大,使系统振荡,可以放大控制作用(如多米诺骨牌、核爆炸链式反应、麦克风尖叫、恶性循环、奖励激励等);负反馈使输出起到与输入相反的作用,使系统输出与系统目标的误差减小,系统趋于稳定(如驾车或骑自行车、恒温装置、修正惩罚)。与反馈概念相对应的, 还有前馈概念。前馈是对系统进行预先设定或采取的控制措施,一般对应开环控制,前馈需要系统的先验信息 (对应通常的因果律,如汽车躲避前方障碍、开电梯等)。虽然前馈概念也很重要, 并且一个控制系统中往往同时具有前馈和反馈机制, 但是由于反馈能够对付系统内外的各种不确定性因素, 因此对反馈的研究是控制论的核心问题。钱学森先生认为,工程控制论一个最主要的概念就是反馈,维纳认为,反馈出现在几乎所有有目的行为中。控制论这门学科区别于其他学科的一个核心概念就是反馈。如何有效设计反馈规律来对付系统内外各种不确定性,以达到预期的控制目的, 是控制理论的基本研究问题。在自动化系统中,反馈控制算法就是其“大脑”。本人认为,信息反馈是一个系统具有智能化行为的一个关键特征,反馈原理像物理定律一样具有基本的重要性,应该得到普遍重视。从历史上看,反馈的有效利用常常对工程技术领域产生革命性的影响。
 
三、反馈的作用和魅力
 
我们将通过历史上若干著名例子, 来说明反馈原理和反馈的内在魅力,以及其在现代科学技术发展中所起的重要作用。
 
第一个例子是著名的瓦特蒸汽机。蒸汽机有很长的发明历史。事实上,世界上第一台蒸汽机至少可以追溯到公元一世纪古希腊数学家、亚历山大港的希罗发明的汽转球。1698年,英国人托马斯·塞维利发明了利用蒸汽压力的抽水泵 “矿山之友”。1712年,英国人托马斯·纽可曼发明了大气压蒸汽机。瓦特则发现了导致这种蒸汽机效率低下、不能大规模应用的原因: 气缸外壁热耗散太厉害,冷却系统不合理,蒸汽浪费了; 蒸汽机的速度不能很好的控制:烧煤多时蒸汽多,机器就转得快,烧煤少时就转得慢等。1782年,瓦特发明了其“核心技术”:用离心调速器来反馈控制蒸汽机速度。从而使蒸汽机可以大规模应用,成为英国工业革命的主要象征。“离心调速器”的基本工作原理可以简单描述如下:当蒸汽机转动过快时,调速器竖轴也转动加快,两个金属小球在离心力作用下,由于转动快而升高,通过与小球连接的连杆便将蒸汽阀门关小,从而蒸汽机的转速也便可以降低。反之,若蒸汽机的转速过慢,则竖轴转动慢了,小球的位置也便下降,这时连杆便将阀门开大,从而使蒸汽机转速加快。谈到这里,我们自然想起英国伟大的物理学家麦克斯韦(James Clerk Maxwell,1831-1879),他不但建立了著名的麦克斯韦方程,而且还可以被称为首位“控制理论专家”。因为调速器使用后,初期运行很正常,但是当蒸汽机的速度提高后,调速器就不能稳定运转了,会出现一个震荡过程。麦克斯韦是最早研究调速器稳定性问题的, 他1868年发表的《论调节器》最早把调速器的运动状态用微分方程来描述,导出了调节器的微分方程,并在平衡点附近进行线性化处理,指出稳定性取决于特征方程的根是否具有负的实部。
 
第二个著名例子是远距离通讯。大家知道,电信号由于传送距离的增长而逐渐衰减,需要用放大器将信号放大继续传送,而放大器的非线性往往导致信号失真,放大器将信号放大的同时,也会把噪声和失真放大。1921年时,最远通信距离不超过1000英里,直到20世纪30年代,H.S.Black发明的反馈放大器对远距离通讯做出关键贡献。说起来,这里还有一个曲折的故事。1921年,Black 就开始研究放大器的问题,但直到 1927年8月初, 他在去工作的船上,才突然想到解决原理和实际应用中出现的阻抗匹配的问题,并在当天的“纽约时报”背面写下了自己的发明。1928年8月8日 ,Black 将负反馈放大器的发明递交到专利局。但是, 直到1937年12月21日,专利才被批准,时隔九年多时间。反馈思想并不复杂,但是,通过适当选取信号通道的放大系数和反馈回路的比例系数,就能够在实现放大信号的同时,降低噪声和失真的影响,的确令人惊叹。无数事实说明,现在看来简单的思想,当年被普遍接受的过程也很可能没那么简单 ! 1957年,Black 因为负反馈放大器的发明,以及负反馈放大器原理的成功发展与应用而获得兰姆金质奖章。贝尔实验室研究主任 M.B. Kelley在1957年曾有如下评论: “毫不夸张地讲, 若没有 Black 发明的反馈放大器, 当今覆盖全国的长途电话和电视网络以及越洋电话电缆将不存在”。
 
第三个著名例子是扫描隧道显微镜(STM)。这是由IBM公司的两位科学家G.Binning和H.Rohrer 于1981年根据量子力学中的隧道效应发明的,利用隧道电流控制针尖在样品表面的精细扫描,反馈原理在这里起了关键作用。两人因此获得1986年诺贝尔物理学奖。STM的诞生,被认为是20世纪80年代世界十大科技成就之一,对物质科学、生命科学以及微电子技术的研究和发展都有重大意义。STM使人类第一次能够实时地观测到原子在物质表面的排列状态,研究与表面电子行为有关的物理化学性质, 还可实现对原子和分子的移动和操纵。
 
第四个例子是机体的调节与帕金森病。大家知道,机体的各种组织、器官和系统之所以能维持正常的生理功能,离不开各种形式的反馈调节,包括神经调节,体液调节和局部的自身调节等。机体生理活动的调节在分子、细胞和系统的各种水平都存在,而且每种反馈调节都必须得到精确控制,否则将会引起各种疾病。例如,人的体温、血压、血糖等必须通过反馈调节稳定在正常水平上。帕金森病是我们理解生命活动过程中反馈调节机制的一个典型例子, 它的产生就是大脑有关脑区兴奋和抑制的反馈调节失衡造成的。
 
第五个例子是著名的阿波罗登月计划。阿波罗登月计划也称阿波罗工程,是20世纪60~70年代美国组织和实施的一项载人登月工程,被认为是20世纪人类最伟大的工程之一。现代控制理论在其中起了重要作用,比如,火箭上升阶段用到了最优控制理论,轨道修正的过程则用到了卡尔曼滤波方法。但是一般人并不知道数学算法在其中起的重要作用, 数学方法和控制算法往往被称为“Hidden Technology”。事实上,1988 年美国SIAM 的 “Future Directions of Control Theory” 研究报告中,就指出“非常普遍地,一片计算机芯片被看作是科学突破,而认识不到这芯片的“大脑”实际上是数学算法。例如,就阿波罗登月任务而言,很多人提出关键科学是舱载数字式飞行计算机,而忽视了存储在内存中的创新的数学算法对这次任务的成功是同等重要的”。
 
第六个例子是生态系统的平衡。生态系统通过负反馈的自我调节机制保证其平衡。当生态系统中某一成分发生变化的时候,它必然会引起其他成分出现一系列的响应变化,这些变化最终又反过来影响最初发生变化的那种成分。著名的Lotka-Volterra方程描述了两个相互依赖的种群之间,通过反馈机制如何保持种群数量平衡的基本原理。
 
总而言之,反馈原理广泛存在于有智能行为的自然生物和人造机器中,没有反馈机制就无法消除各种不确定性因素的影响,从而保证系统正常工作所需要的稳定性和控制精度。
 
四、反馈系统的设计与分析
 
如何有效的利用反馈原理来设计反馈规律,从而保证系统达到所需要的性能和期望目标?比如,用最少能量来保证一个系统温度的稳定性、用最短时间来跟踪某一个移动目标?这就引出了如何具体设计反馈规律问题。如果一个反馈控制系统不能达到期望目标,从设计的角度,可能有两个原因:第一是反馈算法或反馈回路设计中存在缺陷,从而不能有效工作。第二是由于系统本身的不确定性和系统结构的复杂性太大,使得无论如何设计反馈算法都不可能达到期望目标,这涉及反馈机制的最大能力和局限等根本性问题。
 
下面我们来简略谈谈反馈的基本设计方法。
 
首先,控制论与信息科学密切相关,反馈需要测量和检测信号,这需要传感器;反馈算法的指令需要执行,这需要执行机构;反馈算法的设计可能需要知道系统的状态信息,这就需要滤波器。进一步,控制系统的状态是动态变化的,系统的内部和外部都可能存在不确定性的影响,如何利用所获得的信息,设计出反馈算法使被控系统达到最优或理想的性能?这是控制理论的核心内容。下面我们简单介绍几种反馈设计方法。
 
第一种方法,我们称之为“传统方法”。在这里,假设我们利用第一原理和系统辨识等方法可以得到一个精确的数学模型,那么根据模型的类型,可以利用已知的结构和信息来设计反馈规律达到系统的稳定性、最优性和瞬态响应等要求。
 
第二种设计方法是“鲁棒方法”,这不同于传统上“小扰动”或“连续依赖”的概念,目的是设计反馈控制规律来对付数学模型具有“较大”不确定性的系统。在鲁棒方法中,通常假设有一个标称模型(nominal model),和一个以其为中心的“球”用来描述不确定性的大小。一个自然问题是:根据理想化的标称模型所设计的反馈控制规律,能否有效的用到这个“球”所描述的所有可能的(无穷个)系统中?这就是鲁棒性问题。过去近30年来,鲁棒控制和鲁棒分析领域取得了大量有价值的成果。然而,鲁棒控制最大的问题是,他没有试图利用系统运行过程中得到的信息去缩小乃至消除初始不确定性的大小,即鲁棒控制无法改进系统的不确定性的大小,这一特性决定了鲁棒控制的适用范围是有限的,其控制精度也比较“粗糙”。
 
第三种设计方法可以叫做“自适应方法”,这是一种在同一个反馈回路中同时进行控制和辨识的方法。由于嵌入了在线学习机制, 因此, 自适应控制可以对付比鲁棒控制大得多的不确定性,特别是随着时间变化的不确定性。顺便提一下,还有一种与传统自适应方法相关但本质不同的方法,叫做“自抗扰控制”方法,该方法通过构造高增益滤波器,可以将系统的内外不确定性统一估计,因此具有很大的优点。
 
第四种设计方法可以叫做“智能化方法”,这是一种正在发展的方法。人们希望通过智能化方法的研究,可以使反馈对付更复杂的系统,这体现在系统具有更大不确定性,混杂与不完全信息,同时还有更复杂的结构,如多自主体、多层次、多目标、多约束、博弈行为等。特别地,拓广传统控制理论的研究框架使其包含被控对象的博弈行为,是一个重要发展方向。
 
那么,究竟如何科学设计与定量分析反馈系统?这是控制理论要回答的问题。控制理论与数学有着天然的联系,不仅表现在它的主要奠基人维纳(维纳滤波、维纳过程等)、卡尔曼(Kalman 滤波器,状态方程等)、贝尔曼(动态规划原理,HJB 方程)、庞特里亚金(庞氏示性类,极大值原理)都同时是数学家,而且系统本身的控制精度、控制速度要达到最优,也必须有量化的标准和优化实现方法。现代控制理论涉及到几乎所有数学分支学科,并广泛应用于社会经济、自然科学、工程技术等众多领域中。
 
五、结束语
 
同学们,“系统”是人类认识世界的基本概念,而“反馈”是调控世界、保证动态系统正常工作的根本性原理,反馈原理既有“魅力”又有“威力”。随着现代科学技术在极端尺度与复杂系统层面的深入发展,被控系统的复杂性与控制性能的高要求,使得反馈原理将继续发挥不可替代的作用,它与“物理定律”等一样,应该受到广泛重视和应用。此外,“系统学”仍是迫切需要继续创建、深入发展的基础学科,而维纳的《控制论》所提供的丰富思想仍是今天许多学科发展的重要源泉。毫无疑问,控制论与系统学的深入研究和广泛应用必将继续推动科学和技术发展、造福人类社会。
 
未来寄希望于年轻一代!谢谢大家。
 

附件下载: