历史
鱼菜小说网 > 其他类型 > 人有人的用处-美-N.维纳 > 第三章:定型和学习:通讯行为的两种模式

第三章:定型和学习:通讯行为的两种模式(2/2)

此人我一天跟他打三次电话)和我跟某乙的联系过程(此人在我的电话本上是不受注意的一户)等量齐观,不是理想。假如稍微多分配一些我跟某甲直接联系的手段,那我即使花费加倍的等候时间来和某乙接通也是完全可以补偿过来的。如果这样,那我们就可以不费多少钱而设计出一部仪器来记录我过去的谈话,按照我过去使用线路的额数重新分配给我一个服务度,那它就会为我服务较好,或花钱较少,或二者兼而有之。荷兰菲力普电灯公司已经成功地做到这一点。借助罗素所讲的“高级逻辑类型”的反馈,它的服务质量已经得到了改善。这种设备具有较多的变化,较大的适应性,工作起来比常见的设备更为有效,因为常见的设备都具有熵趋势,几率大的压倒了几率小的。

    重讲一下:反馈就是一种把系统的过去演绩再插进它里面去以控制这个系统的方法。如果这些结果仅仅用作鉴定和调节该系统的数据,那就是控制工程师所用的简单的反馈。但是,如果说明演绩情况的信息在送回之后能够用来改变操作的一般方法和演绩的模式时,那我们就有一个完全可以称之为学习的过程了。

    另外一个关于学习过程的例子见于预测机的设计工作中。在第二次世界大战初期,防空火力的效率较差,以致有必要去发明一种仪器,要求它能够跟踪飞机的位置,计算出飞机的距离,确定炮弹在击中它之前在空中所经历的时间,还要算出在该时间终了时飞机将要达到的位置。如果飞机能够采取完全随意的逃避动作,拥我们的任何技巧都无法掌握我们所不知道的飞机在高射炮开始射击和炮弹到达目标附近这段时间内的运动。但是,在许多情况下,驾驶员不是或者不能采取随意逃避动作的。他受到这一事实的限制:如果他快速转弯,离心力会使他失去知觉;他还受制于另一事实:飞机的控制机构和飞行员所受的驾驶训练实际上迫使他遵守某些有规律的控制习惯,甚至在其逃避动作中也不例外。这些规律性不是绝对的,而是多次实践所表现出来的统计优势。对于不同的飞行员讲来也许是不同的,对于不同的飞机讲来则肯定是不同的。让我们记住:在追踪快得象飞机这样的目标时,计算者是没有时间拿出仪器来计算飞机飞向何处的。全部计算程序都必须编进高射炮本身的控制系统中。这个计算程序必须包括我们对一定类型的飞机在不同飞行条件下的过去统计经验的数据在内。现在所用的高射炮都附有一个校准仪器,仪器或者使用这类固定数据,或者对这些有限个的固定数据作选择使用。它们的正确选择可依炮手的需要而随意更变,按一下电钮就行了。

    但是,还有另一级的控制问题,它也是可用机械方法来解决的。通过对飞机飞行的实际观测求得其统计材料,再把这些统计材料变换成控制高射炮的规则,这个问题本身就是特定的数学问题。和通过实际观测来追踪飞机的办法相比,按照给定规则来追踪飞机的办法是相对缓慢的,因为它得对飞机过去飞行的情况作大量的观测。但虽然如此,要使这个长时间的活动就象短时间的活动那样地机械化起来,不是不可能的。因此,我们有可能去建造一种防空武器,它自身能对飞行目标的运动情况作统计的观测,然后对这些材料进行加工,把它们编成一个控制系统,最后以该系统作为快速调整的方法,使武器的位置对准所观测的飞机位置及其运动。

    就我所知,这一点目前还没有做到,但它已经纳入我们的研究范围,而且有希望应用于其他预测问题中。防空武器之能够根据飞机的特定运动来进行瞄准和射击,这样一个总计划的构成,就其本质讲来,是一种学习行为。这是防空武器计算机构中的程序带的变化,它和数字数据的解释过程并无太大的不同。事实上,它是一种非常一般的反馈,能对仪器操作的整个方法作出改变。

    我们这里所讨论的高级学习过程仍然受到所在系统的机械条件的限制,它显然不与人的正常学习过程相当。但是,从读过程出发,我们可以推导出一些完全不同的方法使复杂类型的学习过程得以机械化起来。这些方法的指导思想是由洛克的联想学说和巴甫洛夫的条件反射理论分别给出的。但是,在我讨论它们之前,我要先做一些普通的解释,来答复对我下面将要提出的见解的某些批评。

    让我再讲一下关于学习理论可能建立的根据。神经生理学家的绝大部分工作都是研究神经纤维或神经元的冲动传导,而这个过程是以“不全则无”的现象给出的。这就是说,如果一刺激沿神经纤维到达其上的某点或某端,它就沿着该处的某一神经纤维传播下去,只要它在相对短的距离内不消失掉,那么,该刺激在神经纤维的较远点上所产生的效应与共初始强度本质上无关。

    这些神经冲动沿着一根纤维传播到另一根纤维是要经过其间的连接点即所谓突触这个地方的,在这个地方,一根输入纤维可见和多根输出纤维相接,而一根输出纤维也可以和多根输入纤维相接。在这些突触中,单根输入神经纤维所提供的冲动往往不足以产生一个有效的输出冲动。一般地说,从输入突触到达一给定输出纤维的各个冲动如果太少,则输出纤维不作应答。我这里所说的太少,并非必然地意味着所有的输入纤维的作用相同,甚至也不是必然地意味着有了一批从事输入活动的突触作为连接点,则输出纤维的应答与否这个问题就可以一劳永逸地得到解决。我也不想忽视这样的事实:有些输入纤维不仅不在它们所连接的输出纤维中产生刺激,反而有阻止这些输出纤维接受新刺激的趋势。

    无论如何,冲动沿神经纤维传导的问题,即使可用颇为简单的办法来描述,例如,用全或无的现象来描述,但是,一冲动通过突触层的传递问题仍然要取决于复杂的应答模式,其中输入纤维的某些组合能在某一限定时间内激发,使消息作进一步的传递,而其他组合就不是这样。这些组合不是一成不变的,甚至也不仅仅取决于该突触层过去接收消息的情况。大家知道,它们是随温度而变化的,很可能还随着许多其他因素而变化。

    关于神经理论的上述见解和那些由一系列开关装置组成的机器的理论相符。在这种机器中,后面开关的接通取决于前面一批相关开关的同时接通这样一种精确配合的行动。这种“全或无”的机器叫做数字计算机。它在解决各种各样通讯和控制的问题上有着很大的便利。特别是,由于它仅仅是在“是”和“否”之间作出决定,这就使得它的积累信息的方式很便于我们在非常庞大的数字中把极为细小的差别区分出来。

    除了这些按照是和否的原则来工作的机器外,还有其他计算机和控制机,它们是用来测量的,不是用来计数的。这类机器叫做模拟计算机,因为它们的操作是以待测的量和代表它们的数值量之间的类比关系为根据。模拟计算机的例子之一就是计算尺,它和进行数字运算的台式计算机完全不同。凡用过计算尺的人都懂得,印有刻度的标尺和我们眼睛的准确度都给我们在尺土所能读到的精密度带来了明显的限制。这些限制,并非如人们所想的那样,只要把尺子造得大一些,就可以方便地得到解决。十英尺长的计算尺只比一英尺长的计算尺增加十分之一的精密度,为了取得这个精密度,我们不仅要把大计算尺的每一英尺造得和小计算尺的精密度相同,而且这一英尺和那一英尺接续起来的排列方向又必须和小计算尺所预期的精密度相一致。除此以外,保持大尺的刚性这个问题要比保持小尺的刚性麻烦得多,这就使得我们依靠增大尺寸来增加精密度的办法受到了限制。换言之,从实用目的看来,用作测量的机器不同于用作计数的机器,因为它的精密度受到了极大的限制。把这一点加到生理学家对全或无活动的偏爱上面,那我们就不难理解为什么对人脑的机械模拟所做过的大部分工作都要在不同的程度上以计数作为基础。

    但是,假若我们过分坚持人脑是一部值得推崇的数字计算机,那我们就要受到某种非常公正的批评了。批评可以部分来自生理学家,部分来自心理学家,后者是跟那些不喜欢用机器作对比的心理学家们多少持着相反意见的。我讲过,数字计算机中有程序带,它决定所要完成的操作程序,而程序带在过去经验基础上的变化就和学习的过程相当。在人脑中,最最显见的类似于程序带的地方就是突触阈的确定性,即激发一个与之相连的输出神经元的那些输入神经元要在彼此之间作出精确组合的确定性。我们已经知道,这些阈值随着温度而变化;我们没有理由认为,它们不随血液的化学成分以及许多自身根本没有全或无性质的现象而变化。因此,在考虑学习问题时,采用神经系统的全或无理论,我们就必需特别当心,如果我们对这个概念还没有做过理论上的批判,而又没有特定的实验证据来支持这个假设的话。

    常常有人说,任何一个适用于机器的学习理论都是不存在的。也有人说,就我们目前的认识水平而言,我所能提出的任何一种学习理论都不免为时过早,它和神经系统的实际情况大概不对头。我希望从这两种批判意见的夹缝中穿过去。一方面,我希望提出一种制造学习机器的方法,要求这个方法不仅能够使我造出一些特定的学习机器,而且能够给我提供一种制造多种多样学习机器的一般工程技术。只有在我达到这种一般性的程度时,我才能够免除下述的批评:我所主张的类似于学习的那种机械过程事实上是某种与学习的本质完全无关的东西。

    另一方面,我希望使用与描述神经系统以及人和动物的行为的实际过程不太不同的语言来描述这种机器。我充分了解到,我在表述人的实际机制时不可能期望在每个细节上都是正确的,我甚至可能在原则上发生错误。但虽然如此,只要我提出一种能够用那些属于人心和人脑方面的概念对之进行文字描述,那我就是给出一个免于受到批评的起点,也是给出一个用以和其他理论所能得到的成果进行比较的准绳。

    在十七世纪末叶,洛克认为人心的内容就是他称之为观念的那种东西构成的。对他说来,人心完全是被动的,是一块干干净净的黑板,是tabula rasa(一张白纸),个人经验就是他在这张白纸上面所写下的印象。如果这些印象经常地出现,或是同时地出现,或是在某一序列中出现,或是在我们往往归之于因果联系的那些情况中出现,那么,按照洛克的意见,这些印象或观念便具有某种能动的趋势把各个组成部分粘合在一起而形成复合观念。观念粘合的机制就在于观念自身之中,但是,洛克在其所有的著作中,有一个令人感到奇怪的反对描述这种机制的意图。他的理论与现实的关系只能是火车的照片与行进中的实际火车的关系。它是一张任何部分都是静止不动的图表。如果我们考虑到洛克学说产生的时代,这一点就不值得惊奇了。动力学的观点,动态地描述事物的观点,首先是在天文学中而非首先在工程学或心理学中获得其重要性的,这项工作要归功于牛顿,但牛顿不是洛克的先驱者,而是他的同时代人。

    在许多世纪中,科学在亚里士多德冲动的驱使之下,着重于分类工作而把现代的研究冲动即研究现象发生作用的方式扔在一边。的确,当植物和动物还有待于调查研究的时候,要是不经过一个不断搜集材料以描述自然史的过程,我们就很难理解生物学如何能够进入真正的动力学时代。伟大的植物学家林耐(Linnaeus)就是一个例子。对于林耐讲来,种和类都是固定不变的亚里士多德式的形式,而不是进化过程的路标;但是,我们只有根据林耐的全面描述,才有可能找到令人信服的进化实例。早期的自然史家都是知识领域中的实干的拓荒者,他们围攻和占领新领域的**太强烈了,以致对于他们所观察到的新形式不能十分细致地作出解释。拓荒者之后来了讲究操作的农场主,自然主义者之后来了现代的科学家。

    在上做纪最后四分之一和本世纪最初四分之一的年代里,另一位伟大学者,巴甫洛夫,以其独特方法从本质上研究了以前洛克研究过的同一个领域。但是,他的条件反射的研究是实验地进行的,而不是象洛克那样理论地进行的。除此以外,他认为条件反射是在下等动物中出现的东西,而不是在人体中出现的东西。下等动物不会讲人的语言,但是,它们能讲行为语。在它们的比较显眼的行为中,就其动机而言,大多数都是情绪方面的行为,而它们的情绪又大部和食物相关。巴甫洛夫正是从食物和唾液的生理征候而开始其研究的。我们可以很容易地把一根小管插入狗的唾腺中,并观测唾液在食物刺激出现时的分泌情况。

    通常,许多东西都和食物没有什么联系,例如,视的对象、听的声音等等,它们对唾液不会产生任何的影响。但是,巴甫洛夫观察到,如果狗在进食时系统地出现某种对象或某种声音,那么,这个对象或声音单独出现时也足以激起唾液。这就是说,唾液的反射受到过去联想的制约。

    这里,在动物反射的水平上,存在着某种类似于洛克的观念联想的东西,即反射应答所产生的联想,其情绪内容显然是很强烈的。我们现在考察一下那些性质相当复杂的为产生巴甫洛夫型的条件反射所必需的前提。首先,它们一般是动物生活中居于重要地位的东西,在上述情况下,就是食物,虽则在反射的最后形式中食物因素可以全部消除掉。我们还可只用畜牧场周围的电网为例,说明原始刺激在巴甫洛夫的条件反射中的重要性。

    在畜牧场上,要建造一个足够牢固的线网来圈住牲口,不是一桩容易做到的事情。因此,比较经济的办法就是用一两根较细的、通有高压电流的导线来代替这种笨重类型的线网,一当动物身体触及电网从而使电流短路时,动物就受到了一个十分可观的电击。这种电网要能在开头一两次承受住了牲畜的压力,但继此以后,电网的作用,不在于它能够承受机械压力,而在于牲畜已经养成力图避免与电网接触的条件反射。在这里,反射的原始扳机乃是痛苦,而避免痛苦对于任何动物的生命延续讲来则是一枚极为重要的事情。形成该反射的扳机是牲口对于电网的视觉。除饥饿和痛苦外,还存在着其他的产生条件反射的板机。对于生物的这些情绪状态,我们可以用拟人的语言来讲述它们,但我们用不着这样一种的拟人主义,即把这些东西说成具有动物经验中所不具有的重要意义。动物的这些经验,无论我们可否称之为情绪的,都能够产生强烈的反射。在形成一般的条件反射时,反射应答使转移到这些扳机状态之一。这个扳机状态经常伴随原始扳机而出现。对于引起给定的应答,刺激物可变,这在神经方面一定是互为相关的:导致应答的突触通路是开着的,不然的话,就应当关着,或者说,不导致应答的突触通路是关着的,不然的话,就应当开着;这样就构戍了控制论所讲的程序带中的变化。

    程序带中的这种变化是在旧的、强有力的、引起特定反应的自然刺激和新的、伴随而来的刺激之间经过多次反复的联系而后产生的。看来旧刺激在其活动的同时似乎具有一种能力,即改变其消息通路的渗透性。有趣的是,新的、起作用的刺激除了重复伴随原始刺激这一事实外,几乎没有其他的要求。所以,原始刺激在其出现之时似乎对于所有输送消息的通路都产生了一个长期的效应,至少对其中的大多数通路是这样的。刺激的代替物之具有任意性表明了原始刺激的变形效应极为丰富多样,它不是被限制在少数特定的通路上面的。因此,我们可以认为,原始刺激能够释放出某种一般性的消息,但它仅在原始刺激起作用之时才在那些消息通路中起到作用。这种作用的效应也许不是经久的,但它至少是相当长期地存在着。看来发生这种第二级活动的最合理的场所就在突触之中,因为这个地方最便于改变它们的阈值。

    非直达消息这个概念,大家并不生疏。这种消息在找到接收者之前不停地传播出去,然后,它使接收者受到它的刺激。这类消息经常被用作警报。火警就是通知全城居民的信号,特别是通知消防人员的,不论他们呆在何处。在矿井中,当我们发现沼气而要求远处通道上的所有人员离开时,我们便在通风口处把一瓶乙基硫醇打破。我们没有理由认为神经系统中不会有这类消息。如果我去建造一架普通类型的学习机,那我就非常乐意采用这样的方法:把一般地传播“敬告所有与此事有关者”式的语息和特定通路的消息两者结合起来。设计种种电方法来执行此项任务,应该不难。当然,这完全不等于说,动物的学习实际就是采取传播性的和通道性的两种语息相结合的方式。坦白地说,我认为动物的学习完全可能就是这样,但是,我们的证据不足,所见它还只是一种猜想。

    至于说到这些“敬告所有与此事有关者”式的消息的性质时,那我还是站在玄想较多的基础上面而假定它们的存在的。它们也许的确是神经性质的,但我宁愿倾向于把它们看作非数字的、类似于产生反射与思想的机制。把突触的活动归因于化学现象,这是自明之理。实际上,在一根神经的活动中,我们不可能把化学势和电势分开来;说某一特定活动是化学的,这几乎是毫无意义的话。但虽然如此,假定突触变化的原因或伴随物中,至少有一个原因或伴随物,不论其来源为何,可以局部地表现为化学变化,这跟流行观点不相抵触。这种变化的出现完全可以局部地取决于神经所传送出来的信号的。我们至少可以同样地设想:这类变化可以部分地起因于化学变化,而化学变化一般是通过血液而非通过神经来传送的。我们又可以设想:“敬告所有与此事有关者”式的消息是由神经来传送的,这些消息自身局部地表现为化学活动的形式,伴随着突触的变化而出现。作为一个工程师,我认为,比较经济地传送“敬告所有与此事有关者”式的消息的办法似乎是通过血液,而不是通过神经。但是,我没有证据。

    让我们记住:“敬告所有与此事有关者”式的消息所起的作用,在一定程度上,是和那种把全部新的统计资料都送进仪器的防空控制装置中的变化相似,而不是和那些只把特定的数字资料直接送进仪器的防空控制装置中的变化相似。在上述两种相似的情况中,都有一种也许是长期积累起来的活动,由于长期持续之故,这种活动将有种种效果产生出来。

    条件反射对其刺激作出迅速的应答,并不必然地标志着条件反射的建立过程也是比较迅速的。因此,我认为,下述看法是适宜的:使得这种条件化得以产生的消息乃是通过血液流的缓慢而又普遍的传播作用带来的。

    设定饥饿、痛苦或任何其他刺激的固定影响可以通过血液引起条件反射,这就已经把我所需的观点作了相当的限制了。要是我企图去确定这种未知的由血液带来的影响的性质,要是这种影响存在的话,那我的观点就要受到更大的限制了。血液自身带有种种物质,可以直接地或间接地改变神经的活动,这在我看来是一桩非常可能的事情;某些荷尔蒙或内分泌的活动至少暗示了这个事实。但是,这并不等于说,决定学习阈值的那种作用就是特定荷尔蒙的产物。此外,它虽然引导我们在饥饿和电网所引起的痛苦之间找出某种可以称之为情绪的共同物,但如果认为情绪就是决定反射的全部条件,而对反射条件的特殊性不作任何进一步的讨论,那就肯定跑得太远了。

    但虽然如此,了解下述一点是有意义的:那种被我们主观地称之为情绪的现象,也许并不单纯是神经活动中的一种没有用处的附带现象,它很可能控制着学习过程中的以及其他类似过程中的某一重要阶段。我并不是说,它一定是这样的,但是,我要说,那些在人与其他生命体的情绪和现代类型的自动机的应答之间截然划上一条不可逾越的鸿沟的心理学家们,在他们作出否定的结论时,应当象我作出肯定的结论时那样地小心谨慎。