历史

4复杂系统和心-脑的进化(1/2)

    人们如何解释心和脑的形成呢?本章首先扼要回顾一下心-身问题的历史。除了宗教传统以外,前人所持有的心和身的概念常常受到科学和技术的最高级标准的影响(4.1)。在复杂系统框架内,大脑的模型是非线性动力学的复杂细胞系统。精神状态的形成(例如模式识别、感情、思维)被解释为大脑集合体中(宏观)序参量的演化,序参量是远离热平衡的学习策略中神经细胞的非线性(微观)相互作用引起的。例如,模式识别就被解释为某种相变,显示出与决定着物理学、化学和生物学中模式形成的演化方程有相似之处。在神经生理学的认知心理学的最新研究中,科学家甚至推测,意识和自我意识的形成也取决于作为自反映的神经实现的“元细胞集合体”的产生率。弗洛伊德的无意识,被解释为某些注意状态和序参量的(部分)关闭。甚至我们的做梦和情绪也表现为是受非线性动力学支配的。

    “人的脑和心问题上的牛顿”被找到了吗?当然没有。复杂系统探究方式不能解释精神是什么。但是,我们可以为在一定条件下的某些精神状态动力学建立模型。甚至原则上也包括为意向性行为建立模型。复杂系统不需要类似于大脑中的“小人”这种虚构的中心处理者。因此,瓦丘的富有嘲笑意味的观察过时了,他的观察中没有发现人体中有任何灵魂,甚至经过了上百次的解剖也是如此。精神气质被理解为复杂系统的一种整体状态,由其部分的局域非线性相互作用引起,但是不可能被还原为部分。我们的奇妙的情感、想像和创造性,自从人类文化开始以来一再为诗人和艺术家所赞颂,但是复杂系统方式还没有触动这些问题,尽管我们将模拟其非线性动力学的某些方面。

    4.1从柏拉图的灵魂到拉美特利的《人是机器》

    自然中的最复杂的器官之一是人的大脑。今天,我们知道,由于有了大脑,才使得人的精神、意识和人格的形成成为可能,而这一切自从人的思维出现以来一直被看作是人的最大的奇迹之一。运用复杂系统探究方式,我们可以用复杂神经网络的非线性相互作用来为人的感知和思维的形成建立模型。因此,复杂系统的模型就有助于我们去理解心-身过程是如何工作的,是如何在一定条件下的自然进化中出现的。基于这种观点,从长远来看,对于符合自然进化规律的意识和精神的形成,也就不会感到惊奇了。但是,它的产生仍是一个谜。

    在我们探讨复杂系统和心-身的进化之前,让我们先回顾一下早期的精神哲学和神经生理学史。对照历史背景,我们可以看到,传统的心-身问题中的哪些问题已经由复杂系统探究方式解决了,哪些问题还没有得到解决。

    在前面的几章中,我们已经指出早期的神话和宗教信念都试图解释人们生活的世界并对自然力作出想像。显然,人的**、恐惧、愤怒和想像力,如同自然的强制力那样,支配着人所生活的世界。意识或心灵或精神或灵魂都是生命所经历的,它们似乎在人死后就“离开”了人体。人们已经力图用自己熟悉的关于相互作用着的物理事物的经验,来为这些未知的过程建立模型。精神或意识状态被假定为叫做“灵魂”的特殊的实体或某种类似的东西,正是它们造成了人的意向性行为。伴随着这种精神状态的假设,引出了这样一个问题:灵魂处于身体中何处。通常的回答是,它是由身体提供的,或它是集中在某些器官中,例如心脏和肺部。尽管这种惊人的“事物”效应显然是真实的,但是它不能像上帝或幽灵那样,是不可见、抓不住的。因此,人们普遍地相信,它具有某种神性的起源。前苏格拉底的哲学家们,在对传统的信仰和宗教信念的批判中,从自然中寻求原因和原素。一些思想家把“灵魂”看作诸如“气”和“火”这样的物质,因为,它们被看作最精细、最轻盈的物质形式。在阿那克萨戈拉看来,精神是运动和有序的原则,因此也就是生命的原素。在赫拉克利特看来,灵魂如同由宇宙的规律(逻各斯)所控制的火焰。灵魂如同火,被水消灭:“死就是灵魂变成水”。这些探索就是用熟悉的已知的东西来为未知的东西建模。

    值得注意的是一位早期的医学思想家、毕达哥拉斯派学者、克劳东的阿尔克梅翁,他看来是第一位把感觉和思维定位在大脑的古希腊思想家。像古希腊早期的太阳中心宇宙中的天体模型一样,这种天才的思想很快就淹没在亚里士多德的权威之中,亚里士多德认为心脏是意识的场所,大脑仅仅是用空气来进行冷却的机器。尽管亚里士多德深受古希腊医学思想家的影响,但是他不同意希波克拉底的伟大洞见:大脑是“意识的信使,并告诉它发生什么”。

    德谟克利特捍卫了早期的还原主义精神哲学。他力图把精神状态还原为最小原子的相互作用。他的还原论中,“灵魂”当然就仅仅由特殊的物质(但不可观测的)原子来定义。与物质的定义或类比相反,毕达哥拉斯哲学家把人或动物的灵魂解释成非物质性精质,因为它可以想像为非物质的思想,如数字和关系。换言之,灵魂是用数学的比例系统来建模的,它的和谐或不和谐代表着如同音乐旋律的精神状态。

    毕达哥拉斯的概念影响了柏拉图关于人类灵魂的哲学,这种哲学与他的形式或理念论结合在一起。在他的对话《美诺篇》中,柏拉图表明,一个未受训练的奴隶是可以求解数学问题的。在柏拉图看来,所有的人在获得任何(先验的)经验之前都有某种永恒的知识。人通过分有永恒的形式和理念具有某种先验的知识例如数学,这些形式和理念是ante

    rem即与存在物的失真的、暂时的表面现象无关。

    亚里士多德批评了柏拉图的实在背后的理念世界的假说。理念是人对形式的抽象,形式在自然中发挥着作用。灵魂被描述为活物体的形式(“实质”),即“原初隐德来希”,它是一种目的性力。但是,它并不与物质分离。灵魂是人体中的一种潜能。按照亚里士多德的说法,人的机体被理解为一个整体。

    然而,在亚里士多德和斯多葛传统中,已经发现了神经系统的解剖学。盖仑相信,神经把心灵普纽玛输送到肌肉,从而引起运动。心灵普纽码不仅仅是一种如同呼吸和空气那样的物质材料,也是一种生命精灵。在中世纪,亚里士多德和斯多葛派的自然哲学对伊斯兰传统中的医学思想家有巨大的影响,如阿维森那,他建立了一个医学学派,在手术、药理、治疗和康复中都留下了令人印象深刻的活动。后来,这些波斯和阿拉伯世界的医学准则只为少数几个基督教中世纪的思想家如艾伯特·马格努斯所认识。在关于心和脑的哲学方面,例如,有关人的意识问题的科学讨论总是被宗教意识形态所掩盖,解剖尸体长期以来也是相当危险的事情。

    与亚里士多德和阿维森那传统中的整体论哲学相反,笛卡尔的理性主义倡导了一种二元论的本体论,把精神和物质、灵魂和身体严格两分。人体是一台物质机器,是按照机械和几何定律构造起来的。它受到天赋观念的引导和控制,天赋观念体现在人的精神之中。在他的《沉思录》中,笛卡尔通过怀疑一切事物的方法而得到人的精神的最基本直觉。方法上的怀疑是要找到那不容置疑的东西。笛卡尔能够怀疑所有的科学的结果、常识的结果和感知的结果,但是他不可能怀疑他自己的存在,这样的存在使得认识过程如怀疑成为可能。

    那我是什么呢?是那进行思考的东西。所思考的东西是什么呢?它在进行着怀疑、理解、肯定、否认、下决心、反驳,它还在进行想像和感受。

    当然,笛卡尔理论的困难之处在于精神和身体的相互作用。他假定人的机体以及它的种种器官都是受到座落于大脑中的精神所引导的。神经是进出于大脑的消息通道。它们作为发令的精神和执行的肌肉之间的因果链而起作用。按照他的力学的钟表范式,笛卡尔相信,在神经通道中快速地运动着所谓的“动物精灵”的细微物质粒子,它们相互推动着,从而把来自大脑的输入传递给肌肉。

    与自然界的所有机械效应相反,人的精神可以自由地决定运动的方向。因此,精神对动物精灵的作用就使它们的运动转向。这并不违反笛卡尔的物理学规律,只要“运动的量”是守恒的(即后来所谓的动量守恒定律)。图4.1示意出笛卡尔的机械感知模型:微小的光线粒子撞击着人的眼睛,通过特定的神经激发了大脑及其“动物精灵”。手臂的运动由大脑中的精神的感知所协调。

    在《灵魂的情感》一书中,笛卡尔甚至试图把所有的情绪状态如害怕和热爱分析为被动的物理结果,种种“动物精灵”的流动都由外部事件引发。如果在笛卡尔的机械模型中,用生物化学物质和物理电效应如荷尔蒙和神经激发来取代动物精灵,那么这种神经活动概念就显得相当现代了。

    笛卡尔的主要困难是非物质的中介相互作用问题,也就是无广延的不可见的精神,与物质性的即有广延的可见的身体之间的相互作用问题。笛卡尔把精神植于非常小的脑器官——松果腺之中,而松果腺驾驭着动物精灵的运动。但是,无广延的精神是如何作用于有广延的粒子如动物精灵的呢?在力学的框架中,这种相互作用问题原则上是无法解决的,从而引起了精神哲学的若干发展。

    在偶因论哲学家如马尔布兰奇看来,所有的因果关系都是不可思议的。上帝必定干预了所有特定情形的因果作用。因此,心-身问题就赋予了神学的特设假说。斯宾诺莎把笛卡尔的心和身的二元论归结为单一实体的一元论。上帝就是万物的唯一实体。自然、精神和身体的一切外表,都仅仅归结为宇宙“实体”的属性(“状态”)。任何时候都没有奇迹。但是,上帝和人的精神都自然化了,自然也就在宇宙泛神论中变得神圣了。

    按照复杂系统探究方式,正是莱布尼茨提供了最令人瞩目的精神哲学。与其自然哲学相联系,我们回想起莱布尼茨的宇宙,它与笛卡尔和斯宾诺莎的宇宙相反,是由无限的许多实体(“单子”)构成的,它们相当于空间中不同点的观察,或多或少地透视了整体。因此,单子被看作一种类似灵魂的实体,被赋予了感知和记忆,但是其意识的清晰程度有差别。有些实体例如人,与动物、植物和石头(它们的意识程度是逐次降低的)相比,具有较大感知和较高程度的意识。甚至上帝也可以植于莱布尼茨的单子论中,它作为中心单子,对整体具有最高程度的意识和最好的感知,但仍然是一种个体和有差异的实体。

    显然,莱布尼茨没有笛卡尔的相互作用论的形而上学问题。他实际上试图把经典的力学与传统的亚里士多德自然目的论结合起来,因为他意识到机械论缺少的精神哲学成份。从现代的观点看,莱布尼茨的类似灵魂的实体显得有些奇怪,它们具有感知和记忆,具有或多或少的生机。但是,对他来说,在具有或多或少复杂性的自动机框架中,用单子论来建立模型却毫无困难。莱布尼茨提出,每一实体都可以用一种单子的自动机来建立模型,单子的不同状态相应于单子的不同的感知。其意识程度是用其复杂性程度来度量的,标志着单子状态空间和信息处理能力的大小。莱布尼茨的具有不同复杂性的自动机的状态,都在关联网中相互关联,用他的名言来说就是单子没有“窗户”、没有相互作用,但是像巴罗克建筑中的镜子一样相互反映。在第五章“复杂系统和人工智能的进化”中,将更详尽地讨论莱布尼茨的单子之网。总之,莱布尼茨假定了,精神不仅仅属于人类,而且也是系统的一种特征,这些系统按照其复杂程度表现出不同程度的强度。

    英国经验主义哲学家如洛克和休谟批判了笛卡尔-柏拉图的如下信念:精神状态可以用反省和纯粹思维的方式进行分析,而无需感觉经验。在经验主义哲学家看来,精神只不过是一块白板,一个接受感觉数据的贮藏室,它是通过联想和抽象而形成概念的。想像只是感觉印象的不那么生动的复本;感知印象可以形象地结合起来,形成如同独角兽那样的概念。

    从复杂系统探究方式来看,休漠发展了一种著名的联想心理学理论。他主张,自然中没有因果机制,精神中也没有因果规律,因果关系只不过是对于那些感觉印象的无意识的联想反映,它们在若干情形如闪电和雷鸣以关联的方式出现。我们可以说,大脑具有无意识的建造感觉印象模式的能力。概念只不过是标志具有或多或少复杂性的感觉印象模式的术语。除了数学以外,再没有建立在感知基础上的明确概念,只有一些关于事件的或多或少概率断言的模糊模式。在《人类的本性》一书中,休谟写道:

    在我面前的桌子仅其外表就足以得到广延的观念。于是,这种观念是从印象中获得并表现的,是在这一时刻显示给感觉的。但是,我的感觉向我传达的印象,不过是有颜色的点,处于某种方式。如果眼睛可以更进一步地感知事物,我就希望它可以向我揭示这一切。但如果它不可能进一步显示出任何东西,我们就可以得出有把握的结论,广延的观念只不过是这些颜色点以及它们的表现方式的复本。

    按照笛卡尔的理性主义,人的精神支配着身体机制,如同他所处的**主义时代的君主统治着国家。对于休谟来说,不存在脱离的人的精神实体。存在的只不过是一个自组织的区域,其中不断地发生着新模式的生成和旧模式的消失,这都由强度不同的感觉印象的联想所引起。休谟的感觉印象的自发结合和分离,可以比做民主社会中的自由公民,他们以群体或党团形式结合起来,而不是听命于君主。

    康德试图把理性主义和经验主义综合起来。经验主义的观点是,认识始于经验和感觉资料。但是,理性主义是对的,因为我们需要精神结构、认知图式和范畴,以组织经验和认知。康德试图引人奠定牛顿力学公理的哲学范畴。他的认识论的主要特征是,认识并不是我们大脑的白板对外部世界的被动印象所引起的。在康德意义上的认识,是一种主动的过程,由先验的范畴产生着世界的模型。物理事件的空间和时间顺序被归结为直觉的几何形式。在康德意义上的感知是主动的信息处理过程,受到先验预期的调控。通过先验的因果范畴,事件的因果联系在哲学上成为可能。

    因果关系是不能感觉在这点上休谟是对的,但是,在休谟看来,为了精确预见和计算弹子球弹出的路径,只是重复弹出弹子球几次并重复联想感觉印象几次还是不够的。我们必须预期,原因和结果可以由某种确定论的关系联系起来。康德认识论中的一般(确定论的)因果图式实现了这一点。但是,哪一种特定的原因作用是合适的,这个问题要由物理实验来确定和检验。认知图式已经在日常生活中运用着。它们在计算机科学中甚至用编程语言的数据图式来建立了模型(参见5.2节)。因此,康德的认识论可以解释为现代认知科学的重要先驱,在认知科学中假定由认知图式整理大量的经验材料。但是,与康德相反,这些认知图式可以在历史发展中发生变化,正如相对论中从欧几里得空间转变到非欧几何空间所表明的那样。

    斯宾诺莎主张一种精神的一元论,以跳出笛卡尔的二元论,而拉美特利却支持一种唯物主义一元论。笛卡尔的分离中类似灵魂的实体的假设被认为是多余的,因为所有的精神状态都应该归结为人体中的机械过程:“人是机器”。拉美特利主张,在人和动物之间并无根本性差异。智能和反映行为都应该用神经的“冲动”来解释,而不是用“机械中的幽灵”来解释。但是,在18世纪的力学框架中,拉美特利的革命性观点只是鼓舞了生理学研究纲领。

    著名的数学物理学家和生理学家赫尔曼·冯·赫姆霍兹(1821-1894)是一位后康德哲学家。他支持一种自然化的认知范畴框架,它是构造任何对世界的特定感知所要求的。当然,康德以后,范畴也发生了变化。然而,仍然有一些基本的图式如空间、数目、测量和因果性概念标志着19世纪的物理学理论。例如,赫姆霍兹意识到了非欧几何的数学可能性。因此,他认为,正确的物理几何必须由物理测量来确定。

    在生理学理论方面,赫姆霍兹起初是约翰尼斯·米勒(1801-1858)的学生,约翰尼斯·米勒常常被人们称作现代生理学之父。米勒坚持一种特殊的神经能定律,它要求每一神经都具有其自身特定的能量或品质。他发现,感觉是可以由机械影响或化学影响、热、电等等所激发的。康德有关感知的一面现在自然化了,因为它证明了,脑必须根据其对于神经的效应来重构世界。然而,米勒坚持一种非物质的动物精气的概念。他相信,动物精气是不可能测量的,因为它们的速度太快了。

    赫姆霍兹从数学方面探讨了能量守恒定律。由于能量可以转化,但是不可能创造或消灭,生命的非物质的能量超出了守恒定律因而显得没有意义。赫姆霍兹偏向于这样的理论,即一旦涉及到能量问题,身体就可以看作是把能量从一种形式变换为另一种形式的机械装置,而无需特殊的力或精气。化学反应可以产生出机体所产生的所有物理活动和热。肌肉的活动是由肌肉中的化学和物理变化所实现的。赫姆霍兹进一步测量了神经传导速度,并揭示出,它甚至比声速还要慢。从哲学上看,这些结果被解释为对米勒的生命力论的驳斥。

    埃米尔·德·博伊斯-雷蒙德(1818-1896)是米勒的另一位学生。他认为,神经效应实际上是一种电活动波。在那时,组织学借助显微镜开始发现独立的细胞体和纤维。按照这些结果,神经活动和大脑看来是复杂的神经细胞(“神经元”)系统,具有复杂联结网络。20世纪初,人们首次描述了神经元通信结构,其中一个神经元向另一个神经元发送信号。但是,对于突触联系的观察,在本世纪中叶左右开始运用电子显微镜之前是不可能的。

    感知、思想和情感的出现如何从这些神经解剖学和神经生理学的描述中得到解释呢?一位最先用神经网络的细胞集合体来解释精神状态的思想家,是美国哲学家和生理学家威廉·詹姆士。詹姆士在他的简明教程《生理学》(1890)中,坚持达尔文主义和进化观点,认为大脑并非是为了进行抽象思维在进化中构造起来的,而是为了保证生存才构造出来的。他以实用主义的方式假定,大脑具有许多良好的工程求解问题的特征,它们适用于精神操作:

    离开了进行认识的物理环境,精神因素就不可能得到适当的研究……总之,精神和世界必须一起进化,因此也就是某种相互适合的结果。

    大脑组织在进行算术演算和形式逻辑推导时显得十分可怜。但是,形成概念和联想的能力,作出好的猜想和提出假说,却是大脑的显著特征。詹姆士提出了一种关于联想的机械模型,它可追溯到休谟的先驱性工作,并启发了我们后来的联想神经网络。以更定性的方式来看,他提出了某些原理,其中一部分为现代复杂神经网络的数学模型所吸收:

    1.詹姆士相信,联想是机械性的,是大脑皮层的功能。

    2.詹姆士的联想原理:

    当两个基元脑过程一起被激活或随即相继被激活时,其中之一具有再现出将激发传播给另一个的趋势。

    3.詹姆士的脑活动的加和规律:

    脑皮层中任意给定点的活动量,都是所有其他点向它放电的趋势之和,这种趋势(1)正比于该点伴随的激活次数;(2)正比于这种激发的强度;(3)正比于竞争点的缺少,这种点与第一个点没有功能联系,向其中放电可能转移。

    如果在第二个原理中,用“神经元”代替“脑过程”这个术语,那么我们就获得了一种突触的描述,突触是霍布后来引入的(参见4.2节)。如果在第三个规则中,用“神经元”代替“大脑皮层中的点”,我们就获得了突触输入的线性加和规则,这与某些霍布类型的神经网络模型很接近。詹姆士还讨论了部分联想的网络通过某种特殊的细胞联结程序将遗失部分重建起来的能力。尽管詹姆士虽然是不熟悉计算机辅助建模的,但是他已经抓住了复杂系统探究方式的基本见解,即复杂的事件是由大量子联想构成的,它们是通过诸如突触这样的基本机制联结起来的。

    在论述“联想”的一章中,詹姆士讲到了一个人对一个晚宴聚会的思考。此人在考虑晚宴的所有活动时,首先只是想到第一步具体做什么。这第一步的所有细节的组合又只是随后提醒下一步,如此等等。对于图4.2,詹姆士概括地描述了这种过程:

    例如,如果a、b、c、d、e是由晚宴聚会最后活动所激发的基无神经迹,可将其称作动作A;l、m、n、o、p是要穿过夜幕回家的基元神经迹,我们将其称作B;因为a、b、c、d、e的每一个和全部放电都将通过此路径向l放电。类似地,它们向m、n、o、p放电;这些后来的基元神经迹每一个都将加强另一个动作,因为在经验B中,他们已经共振起来。图4.2[4.19,图5.7]中的线段示意了放电进入每一个B的组元的加和,这些影响的组合强化了其中的处于加和的B,使B被唤醒。

    詹姆士坚信,“精神质料表现出的有序只是脑生理过程引起的”。在现代的复杂系统探究方式中,序参量被用来描述精神状态,它们是由宏观的神经元集合体引起的。在后面的各节中,我们将看到,从前苏格拉底哲学家到康德和詹姆士,他们对于精神操作的许多基本见解,甚至今天也并没有从根本上被改变。

    4.2复杂系统和神经网络

    19世纪,生理学家发现了诸如感觉、视觉和肌肉运动等等依赖于个体细胞的神经系统的宏观效应。这些细胞通过引发电流或对电流作出反应,从而能够接收和传送信号。显然,神经系统和大脑是自然界进化中的一种最为复杂的系统。人的大脑中至少有100亿个神经细胞(神经元)。每一个神经元都接受其他细胞的输入,并把输入整合起来,产生出某种输出,并将它送给其他的神经元。输入由特定的突触所接收,输出由特定的输出线所发送,这种输出线叫做轴突。

    一个神经元自身就是一个复杂的电化学装置,其中包含有连续的内部膜电势。如果膜电势超过了一定的阈值,神经元就传送一个数字作用电势给另外的神经元。在细胞体中产生的神经脉冲,沿着一个或数个轴突传播。神经学家通常区分出激发突触和抑制突触,这使之有些类似于神经元的发放动作电势。围绕着突触的树突可以接收来自数个到数千个其他神经元发送来的信号。一个神经元的活性是用它的发放频率来度量的。生物神经元并非二元的,因为输出是连续的。不过,许多神经网络模型都进行了简化,运用二元计算单位。

    大脑是这种细胞的复杂系统。虽然单个神经元没有视觉,不会推理,也不能记忆,但是大脑却可以具有这些能力。视觉、推理和记忆被理解为较高级的功能。倾向于自下而上策略的科学家提出,只有每一神经元和突触的特殊性质都得到探讨和解释以后,大脑的较高级的功能才能得到认识和理解。

    复杂系统探究方式的一种重要洞见是揭示了,整体系统的突现效果不可能还原成单个元素的系统效果。从哲学上看,整体大于其部分之和。因此,对于大脑的纯粹的自下而上的探索策略是注定要失败的。另一方面,纯粹自上而下策略的拥护者主张认知完全独立于神经元系统,他们又置身于老笛卡尔的两难境地:“幽灵是如何驱动机器的?”

    在精神哲学中传统的做法(参照4.1节)总是或多或少地倾向于其中的一种研究策略。在18世纪,莱布尼茨和后来的动物学家邦尼特已经指出,自然界中存在着组织发展程度不同的复杂性。在图4.3中,示意了神经系统中的组织水平。解剖学的组织等级包括不同的大小尺度,从分子尺度到整个中枢神经系统。

    这种尺度考虑了分子、膜、突触、神经元、核、环路、网络、皮层、映射、系统和整个神经系统。在图的右边底部示意了化学突触,中间的网络模型示意了神经书细胞如何连接成一个简单的视皮层细胞,在上部示意视皮层的可视区的亚组织,左边是整个的中枢神经系统。

    对这些等级水平的研究透视,可能涉及到这样一些问题,例如,信号是如何在树突中整合起来的,神经元是如何在网络中相互作用的,网络是如何在例如视觉系统中相互作用的,系统是如何在中枢神经系统中相互作用的,或者中枢神经系统是如何与其环境相互作用的。每一层都可以用决定其特定结构的序参量来标志,序参量是相应的特定等级层次的子系统的复杂的相互作用引起的。例如,从底部出发,我们可以区分出不同次序:离子运动、通道构型、动作电势、电势波、行进、感觉、行为、情感和推理。

    十分显然的是,神经系统的一种重要功能是支配和控制机体在环境中的生活条件。例如,一个初级可控状态的例子是有机体的温度。在环境状态变化的最高水平上需要有预先计划和社会相互作用,这就导致了在复杂的文化进化中出现了人类的书面通信功能、创造艺术、解决数学问题等等。

    从达尔文的观点来看,神经系统及其复杂性层次不断增加的进化,表现为受自然界的最基本目的——适者生存——所推动。一些脑科学家甚至强烈主张:诸如抽象思维这样的精神现象的形成,也仅仅是某种“副现象”,它并非是自然自身所倾向的。关于自然的意向性和目的性的信念,当然仅仅是人的一种隐喻,假定了某种世俗化的神性——称之为“自然”——在支配着进化。按照复杂系统探究方式,每一中枢神经系统水平都具有其自身的功能特征,是不可还原为较低层次的功能特征的。因此,从层次透视来看,抽象思维只能被看作某个层次例如体温控制系统的某种“副现象”。

    为了给大脑及其复杂的能力建立模型,区别出如下的范畴是十分合适的。在神经元水平的模型中,研究集中在每一神经元的动力学性质和适应性质上,以把神经元描述为单元。在神经网络水平上,均一的神经元相互关联起来展示出突现的系统功能。在神经系统水平上的模型中,若干个网络结合起来展示出更复杂的感知功能、原动功能、稳定控制等等。在精神操作水平的模型中,描述的基本的过程是认知、思维和问题求解等等。它们的模拟与人工智能框架密切相关(参照第5章)。

    从方法论的观点看,我们必须意识到,模型决不可能穷尽一切,也不可能是实在的同构映射。例如,在物理学中,单摆模型忽略了摩擦。在化学中,分子模型将轨道中的电子看作类似于太阳系中的行星,而不理睬海森伯不确定原理。然而,这些模型在一定应用条件下都是有用的。大脑模型的条件由大脑组织的水平给出。如果建立起一定水平上的大脑组织的功能模型,该模型就应该考虑到该水平之上和之下层次的条件。较高水平的性质常常是无关的。一般地,建立模型的方法论由计算方法的代价和收益来决定。一个试图在各个方面都是现实的人脑模型就需要过于高昂的分析和建构。它可能永远难以满足所希望的目的,因此是不实际的。科学家在致力于为大脑组织的一个个水平建立模型时,对有关的下一层次进行简化,就将更为成功。另一方面,模型必须是富有成果的,以能揭示大脑组织的根本性的复杂特征。

    按照复杂系统探究方式,大脑功能的建模应该采用适当的描述大脑活动的动力学轨迹的态空间和相图。法国数学家和哲学家勒奈·笛卡尔已经在(欧几里得)几何框架中描述了感觉、手臂运动和大脑的合作(图4.1)。

    今天,神经网络是用矢量空间和神经矩阵来进行几何描述的。神经元的电化学输入与输出之间有权重联结。在小脑的图式区(图4.4)中,神经矩阵的权重Wij允许网络通过矩阵相乘从输入矢量计算出输出矢量。

    图4.4的例子涉及3×4的神经元矩阵。神经生理学建模要求巨大的灵活性,因为神经网络可能是相当复杂的。但是,联结矩阵可以有效地将高维态空间变换到其他的不同维数。在数学上,这些高维的变换可能引起几何问题,使用初等形式分析几何难以求解。在这种情况下,就需要广义的张量网络理论,以管理复杂的坐标。从历史上看,令人惊奇的是,从欧几里得几何转变到更一般的拓扑空间和度量空间,不仅仅可以在相对论中表述外部世界,同时还可以表述神经系统的内部特征。

    用笛卡尔早期的方法,让我们涉及一种基本的感知原动坐标,它由矢量或张量变换来代表。动物如何抓住一个被它的感官所感知的对象(图4.5a)?在一个简化的模型中,两眼的位置最先在一个感知数据的二维空间进行编码。这个态空间可以形象表示为一个二维拓扑图。从感知态空间的某一点发出一个脉冲到相应的原动态空间的一个点,原动态空间也是由一个二维拓扑图来代表的。原动态空间的一个点为相应的手臂位置进行编码(图4.5b)。

    眼前庭反射是另一个感知原动坐标的例子。生物藉此神经排列,通过与头部运动方向相反的眼球的短弛像运动,从而把影像稳定在视网膜上。在此神经系统中,涉及两种神经结构,它们可以由中枢神经系统固有的不同的坐标系来代表。首先,我们必须分析耳前庭器的半圆通道,每一边有3个通道,可由三维坐标系来代表。其次,每一个眼球都有6条外眼肌,这相应于六维坐标系。因此,眼前庭反射感知原动坐标,用几何方法由三维(共变)向量的张量变换来描述。这种数学框架可以用来计算任何的由一定前庭输入造成的眼肌激活。

    在神经元和神经网络水平上,人工单元的网络用来模拟和考察大脑组织。这些单元被假定在0和1之间变化。每一单元接收来自其他单元的信号,其间通过突触以不同的权重联结起来。接受和发送表示是值的有序集合,输出单元是适当激活了的。数学上,这种程序可以解释为作为证据的某种输入对于作为功能值的输出的一个映射。功能规则是由权重的排列所决定的,它们依赖于神经网络的拓扑。

    在大脑中,神经元常常构成了作为输入层的群体(图4.6)。这些细胞的轴突发送到第2层神经元。在这第2层细胞的轴突又可以投射到第3层细胞群体上,如此等等。在所有输入单元中的自发激活的集合体是作为矢量的输入刺激的网络表示。这种输入矢量及其活化层次向上面的中间层次传播。结果是一组活化层次,它们由输入层的输入矢量,以及从输入单元的分枝末端到中间层那些关联权重所决定。这种中间层的活化矢量向上传播到最高的单元层,在3层网络的情况下产生了一个输出矢量。这个输出矢量由中间层的活化矢量和处于中间单元到输出单元的分枝的终端的关联权重决定。

    一个仅仅具有输入层和输出层的两层网络是一种简单的刺激-反应图式,具有可观测的、可测量的输入和输出。在3层网络的情况下,中间层的单元及其权重常常难以直接测量,而只是被假设为某种处于黑箱中的隐藏机制。因此,它们被称为隐含单元。

    当然,真实的神经系统显示出多得多的单元和层次。例如,对于人来说,大脑皮层的结构包含了至少6层各异的神经元。顺便指出,图4.4所示的小脑的神经矩阵的输入对于输出的映射,可以等价地由具有输入和输出的两层神经网来描述。3层神经网络等价于顺序相连的两个神经矩阵。但是这种多层的网络不可能推广到整个大脑和神经系统,因为在实际大脑中细胞群体往往在给定层次中表现出广泛的细胞与细胞的关联。这需要在某些不同的模型中加以考虑。

    按照复杂系统探究方式,特定层的神经元可以被解释为态空间轴线,代表了该层可能活性状态。状态的发展,即其动力学由轨迹来说明,轨迹可由该特定网络的某种学习过程所引起。

    例如,感知可以用神经网络的矢量处理来解释。最初,来自外部世界的对于输入神经元的刺激样品(例如,作用于眼睛的电磁光信号、颜色,或者作用于耳朵的声波),它们在神经网络中被加工,产生出某种输出矢量,代表了例如外部世界的视觉或嗅觉图像。但是神经网络必须学会在大量的输入信号中区别和识别出正确的形式、颜色、声音等等。

    学习程序只不过是一种对于众多极重的调节,以获得所希望的输出矢量(例如感知)。学习程序可以由数学算法来加以模拟,这是人工智能研究中的重要课题(参见5.3节)。它们在每一神经层次上(也是由矢量来代表)产生出权重构型。在任一给定的时间,突触值的完整集定义了一个权重空间,在每一轴线上的点说明了每一特定权重的大小。一般来说,学习意味着使得最适解(感知、思想等等)和不适解之间的错误和差异最小化。因此,学习过程可以形象表示为权重空间的轨迹,轨迹从初始的随机集合位置出发,到达最终的最小误差位置(图4.7a)。这种建模的关键意味着,可以通过算法程序使某个函数具体化来获得网络中的权重。业已假定,任何可表示的世界都可以通过权重的构型在网络中得到表示。

    图4.7a示意了学习过程中突触权重空间的轨迹。这个空间进行了简化,只有3个权重,代表了3层网络中突触的所有权重值的组合(图4.6)。图4.7示意了相应的活化矢量空间,其轴线是3层网络中的隐含单元(图4.6)。

    权重空间和活化空间是类似的空间,因为代表类似事物类似矢量由位置近似来反映。权重构型把类似的事物集合在一起,考虑了权重空间可能对于事物之间的细微差异的敏感性。因此,在活化空间,我们可以区分出原型矢量,它们代表了具有细微差异的类似事物,细微的差异由其到原型矢量的距离来度量。在观察和行为的宏观水平上,这些原型矢量可以代表特定的范畴,如树木、植物、果实、人物等等,它们都有或多或少的相似性。在复杂系统动力学的框架中,原型矢量可以被解释为点吸引子,把态空间划分为若干个区域。

    类似的原动行为(诸如抓拿、行走等等)用原动态空间的类似轨迹来表示。正如我们看见的,学习意味着权重依据某种算法程序重新构型。关键性问题在于:成千上万的细胞和突触如何知道它们在什么时候应该变化其状态而不需要小妖的指引?

    唐纳德·霍布在他的著名的《行为组织》(1943)一书中提出,学习必须被理解为一种复杂脑模型中的自组织。如同生命有机体的进化,组织“妖”的信念可以去掉,用复杂系统探究方式的自组织程序来代替。历史上,这是首次清楚地提出了生理学的突触变化的学习规则。霍布在关于复杂的脑模型中使用了“联结主义”一词。他引入了突触概念,后来被称为“霍布突触”。如果两个神经元同时发放,两个神经元之间的联结就得到加强。

    当细胞A的轴突充分靠近细胞B使之激发,并可以反复地或持续地向其发放,在细胞之一或两者之中就发生了某种生长过程或代谢变化,使得A向B的发放效率也就增加了。

    “霍布规则”在1949年还只能是一种假设的实体。今天,它的神经生理学上的存在得到了经验确证。霍布规则并非一种精确的数学陈述。我们在后面还将看到可能霍布类型的联结主义学习规则。霍布规则的一种简单的数学表述要求,神经元A映射到神经元B的权重WBA的变化△WBA正比于A的发放速率vA和B的发放速率vB的平均值,即△WBA=εUAUB,其中ε是常数。

    在霍布类型的规则主张的图式中,强化神经元的前提倾向于是“毋需[外部〕教师”。在此意义上,它是一种自组织的方法,使得神经元发放与成群的刺激模式越来越好地关联起来。霍布意识到,大脑运用相互联结的神经元的整体模式来表示某种事物。他明确地运用了“细胞集合体”一词,这对于现代神经科学是关键性的。激活的细胞集合体可以相应于复杂的感觉或思维。哲学上,霍布的细胞集合体的思想使我们想起休谟的联想概念,但他的联想只具有脑心理学上的基础而没有脑生理学的基础。

    霍布的生理学概念是如何溶进现代的神经网络复杂系统之中的呢?这个联想网络的基本概念要求,一个输入矢量与输出矢量用某种变换而“联结起来”。在数学上,两种矢量类似性可以由其内积来度量,内积即由两个矢量相乘,其中的元素乘以元素,然后将这些乘积加起来。在几何上,内积是正比于矢量之间角度的余弦。在两个矢量总相等的情况下,角度为零,这意味着相似性是完全等同的。

    因此,所贮存的原型矢量(例如典型树的原型图)与输入矢量(例如对于特定树的感觉)之间的相似性,就可以在联想网络中由其内积来计算。原型矢量假定贮存于联结网络中的输入和输出的权重矩阵之中。图4.8a示意的网络中,有代表着输入元素的水平输入线、垂直输出线和联结的权重(这里采用二进制,空心圆圈为零,实心圆圈为1)。

    如果一般地,输入矢量(xj)与输出矢量(yj)通过线性变换从yj=EWijXj联结起来,其中Wij是贮存的权重矢量,于是我们就获得了一种简单的线性联想子。这种联想网络,能够对于代表某种范畴例子的矢量进行分类,这种范畴是由所贮存的原型矢量实现的。对于动物的生存,这个任务实际上是关键性的。在现实中,种种或多或少的类似的感觉(例如怀着敌意的动物)必须进行鉴别并归于某一范畴。

    某一种联想网络可以进行矢量完善或矢量校正。所谓的自动联想网络可以产生一种输出,使之在仅仅给出贮存矢量的一部分作为输入时,尽量地接近预先贮存的矢量。在现实中有噪声的(例如一个人的图像),必须根据所贮存的图像来加以完善。一个霍布类型的规则,可以通过加强在神经元之间的相关活性程度的关联权重来完成这一任务。

    一种增加这样的复杂网络能力的方法是,对于输出单元引入非线性的阈值。线性的联想网络(例如图4.8a)具有前向反馈拓扑,信息从输入单元流向输出单元。霍布类型的学习程序认为,神经单元的局域的相互作用通过自组织而收敛到正确的总输出。网络中的循环信息意味着某种反馈构造。在图4.8b中,每一单元都接受从外部的输入,同时也接受网络中内部单元的反馈。权重由水平线和垂直线的交接点来表示。

    显然,图4.8b模型的复杂系统是一种非线性的反馈网络,它允许范围广泛的可能的动力学。约翰·霍普菲尔德讨论了一个著名的例子(1982)。他的非线性反馈网络的类型具有收敛解的动力学。对于它们的兴趣不仅仅是由于对大脑的建模,而且是由于(正如我们将在关于人工智能的第6章见到的)发展出新的网络技术。对于我们的复杂系统探究方式,值得注意的是,霍普菲尔德是一位物理学家,他把运用于自旋玻璃体物理学的数学方程运用到了神经网络上。

    铁磁体的动力学是大家熟知的一个热平衡态的保守自组织的例子。在伊辛模型中,铁磁体由自旋体点阵构成,每一方向都可以是向上(↑)或向下(↓)的。每一自旋体都可以与其近邻发生相互作用。在最低能量状态中,所有的自旋体都以相同方向排列。在高温下,自族体的方向是随机的,因为热能使得涨落大于相互作用能。如果减低温度,自旋体就变得按照相同方向排列。显然,自族体的行为类似于磁体(参见2.4节)。在动力学上,它表现为寻求作为某个吸引子状态的最近的局域能量极小值(图4.9a)。但是,只有所有的相互作用是吸引作用,才有在相同方向上的所有自旋体点的单个能量极小值。在吸引相互作用和排斥相互作用混合的情形下,复杂系统如自旋玻璃体可以具有许多局域能量极小值。

    霍普菲尔德提出,神经系统的功能是在态空间发展起来的一些局域稳定点。态空间的其他的点流向作为系统吸引子的稳定点。由于对稳定点的偏离的消失,这种动力学是一种自校正程序。另一方面,稳定点适当地将一个并不完善的始态矢量丢失的部分弥补起来。因此,这种动力学可以用来完善有噪声的输入。

    霍普菲尔德的模型是相当简单的,包括有阈值的逻辑单元。加和的突触输入并将此加和与阈值进行比较。如果此加和处于阈值或阈值之上,就产生出1,否则就产生出0。除了自联结之外,神经元相互联结时,就认为该网络恢复了。数学上,相应的联结矩阵的主对角线为零。霍普菲尔德提出,运用霍布类型的学习规则来构建联结矩阵元。复杂系统的演化如自旋玻璃体伊辛模型遵循非线性的反馈动力学。能量差异项逐渐减少,直到它到达某一个——可能是局域的——极小值。

    字符特征识别问题是人们熟悉的一个简单应用。此复杂的网络由2维格子的相互作用的布尔变量来代表。一个模式(例如字母A)可以被联想到格子中,其中黑点代表激活态变量(其值为1),空点代表其值为零的变量。这里假定,字母作为所希望的动力系统状态被联想到吸引子(不动点)。我们可以想像,通过多次看见正确的字母,人的大脑中贮存了正确的字母形状。如果某个不完善的、部分受损的字母显示给该系统,它就应该能够重新构造出正确的形状——这是以前已经学会的(图4.9b)。

    因此,模式识别就意味着自组织的模式演化。这种过程指向某些吸引子,作为所希望的系统状态。我们回忆一下,一个吸引子就是从一定条件出发,系统将向其演化的一种状态。吸引盆由起始条件来定义,起始条件推动着在吸引子方向的系统的轨迹。正如我们在前面的章节中已看见的,一个吸引子可以是包含不动点的或稳定态的唯一状态,如同在霍普菲尔德网络和自旋玻璃体系统的例子。但是,一个周期相继的状态(“极限环”)或几种形式的混沌吸引子(在耗散系统中)也是可能的。因此,霍普菲尔德网络对于以复杂系统的吸引子来建立神经状态的模型,仅仅是初级的、简化的方式。

    霍普菲尔德注意了自旋玻璃体中的局域能量极小值与联想的大脑原型之间的类似性。在自旋玻璃体的形式网络中,吸引子可以被设计为原型矢量。在图4.10a中,霍普菲尔德系统的态空间用能量地形图形象地表示出来,这里利用了它与自旅玻璃热力学的类似性。网络上所有可能的状态都由平面上的点来代表。表面的高度表示相应的网络状态的能量。

    图4.10b中的相图显示,轨迹从不同的起始点向稳定的局域最小值的收敛。平面上的每一点就是该网络的一种状态。能量地形图具有霍普菲尔德动力学轨迹的吸引盆。稳定点(“吸引子”)处于盆的底部。在模式识别的例子中,原型字母与稳定点相关联。因此,模式完善的过程是一种反省形式,在形式上可与保守自组织的退火过程相比较。在此物理学例子中,终态是自旋玻璃体、磁化的铁磁体或冻结的晶体的有序结构。

    一般地说,霍普菲尔德网络仅仅收敛到低能态的局域最小值。在某些应用中,局域最小值是与特定的贮存项目相联系的,也许是不必要到达某种全局最小值的。不过,在许多情况下是需要全局最小值的。这种问题的一个解,是由个体单元的随机运动而不是确定论运动来提供的。

    图4.11a中,通过一个沿着能量地形曲线运动的小球很可能最终是落入最深的最小值,从而显示了问题的求解。从一定的起始状态出发,小球将向能量最小值或曲线的底部运动。如果能量地形是由多个靠得很近的极小值标志的,结果就取决于最初的起始条件。如何来阻止网络粘在某个局域极小值上呢?这种想法是以一定的能量增量来动摇能量地形,该增量是逃离局域极小值B(低谷)而进入全局极小值A所需要的。

    于是,在力学上,小球从B进入A比从A进入B的可能性要大。平均来看,小球应该终止于低谷A。在热力学语言中,动摇地形的动能相应于系统温度的增加。在适当高的温度情况下,在低谷之间的转移几率不再是可忽略的。在热平衡态,占有不同凹地的几率仅仅取决于它们的深度。

    实际上,模拟退火的方法是人们所熟悉的,并用于全局优化上。正如我们已经提到的,退火是加热一种材料(例如金属或玻璃)到高温、然后逐步地减低温度的过程。但是,该材料将仅仅终止于其全局能量最低点,如果退火过程进行得足够慢的话。例如,金属的突然冷却将留下仅仅有局域极小值的材料,处于易脆状态。模拟退火使得有可能逃离局域极小值,跳跃到较高的能量状态。

    在气体热力学中,气体由其相转移的几率来描述。波耳兹曼对处在均匀温度分布的气体,推导出来气体状态的几率分布。欣顿、西杰诺夫斯基等人认为,这种分布可以运用于描述神经相互作用。在这种模型的情形,加进系统中的低温项被解释为小噪声项。它是神经与气体中分子的随机热运动的类似物。

    这种形式上的等价,是上述网络被称为“波耳兹曼机”的原因。但是,这里并非是物理主义,并非打算把神经相互作用还原为气体分子相互作用。在波耳兹曼的形式表达式中,可以证明,冷却得充分慢时波耳兹曼机可保证找到所希望的全局极小值。显然,具有模拟退火动力学的神经网络,是能够通过搜索模式的态空间给出全局最小值的。

    一种按照这种动力学的可能的学习规则,是与网络及其环境之间的几率相匹配的。该网络的所有可能状态在热平衡时都是可能的,具有波耳兹曼分布的相对几率。如网络中状态的几率与环境状态的几率相同,那么网络便得到一个适当的环境模型。因此,学习规则必须能够调整波耳兹曼机中的权重,以便减少网络模型与环境之间的差距。

    最初,学习规则让系统自由地运行。每一单元的状态几率可以估计出来。然后,输入和输出单元就被强制或被迫取得适当的值。其次,单元的几率值是估计出来的。局域的权重变化正比于与该权重耦合的单元的几率的差。

    形式上,权重的变化规则要求

    △Wij=E( <sisj>强制-< sisj>自由)

    式中E是比例常数(“学习速率”),Si是第i个单元的二进制单元,sisj在网络达到平衡后的时间的平均值是<sisj>。在强制的条件下,输入和输出单元都固定在其正确值上。在自由条件下,这些单元都不是固定不变的。于是,学习规则并未受到指示。如果输入在自由的条件下是固定不变的,学习规则就是受指导的。

    在图4.11b中,波耳兹曼机的网络中的单元采取了二进制值,它们之间的联结是相互的。连接的权重可以进行训练,也就是把模式提供给存在着和不存在输出模式的输入单元,并应用波耳兹曼学习现则。在学习过程中,网络中的所有的权重都发生了变化。并不直接接受外界信息的隐含单元,可以使得该网络产生出在输入模式和输出模式之间的复杂的联想。因此,在其中间层有隐含单元的波耳兹曼机具有内部的对于环境的表示,而这对于仅仅具有可见(输入和输出)单元的网络则是不可能的。

    从神经生理学的观点看,由“教师”指导的学习在自然界看来是颇为不现实的。动物对感觉输入分析中进行的特征提取或范畴划分必定是自组织的。在输入矢量中出现得越是频繁的特征,就越是可能归属于一定的范畴。网络的输出必须学会使相应的原型矢量收敛为吸引子。

    如何设计一个网络使得在没有外部教师指导的情况下产生出分类标准呢?一些作者提出,这种自组织取决于多层系统中的非线性相互作用和有选择地强化联结。这种学习程序是在选择和竞争的达尔文过程中组织起来的。

    图4.12中,所设计的竞争学习系统的多层构造,可产生出诸如分类和范畴划分这样的突出的认知任务。活性单元由实心点来代表,而惰性单元则由空心点来代表。输入层与第2层的每一元素的联结是激发的。第2层可以划分为若干组,每组中每一元素都抑制所有的其他元素。同一组中的元素处于相互竞争之中,以对输入模式作出反响。按照拉梅尔哈德和奇普塞的法则,在同一组中,一个单元只有在它能够赢得与其他单元