惊人的假说-英-弗兰西斯.克里克 - 正文第六章知觉瞬间：视觉理论

析基本的、但是相当有限的视觉操作，如由阴影恢复形状、理发店标志错觉等，并且编制能解决这些问题的计算机程序。在人工智能领域，这种传统仍然很强。还有一些人则将大脑中的过程比作日常生活中的物体或事件。他们经常谈论“探照灯”或“为某一物体打开一个文件”之类的东西，在过去的二三十年间，所使用的解释常常建立在计算机如何工作这一基础之上。他使使用一系列明确的规则以获得所需的结论，并且涉及某些计算机概念，包括中央处理、随机存储等，较新近的进展便是神经网络（由相互作用的神经元集合组成），它们的相互作用大致上是并行的，而且没有明确的规则。（在第十三章中将作较全面的讨论。）

    正如我们在第四章看到的那样，格式塔心理学家希望揭示视觉活动的基本原理。他们争辩说，正如理解空气动力学定律对于理解鸟和飞机的飞行非常重要一样，理解视觉也必须寻找它所涉及的普遍原理。这一研究方法的现代形式常使用信息学术语表达他们的理论。毫不奇怪，数学家们则倾向于发现某种普遍的数学原理。对普通读者来讲，要描述所有这些思想也许需要一大本书的篇幅。

    所有这些观点都有一定的价值，但它们尚未被融合在一起，形成一个详细的、被广泛接受的视觉理论，只要回避视觉意识问题。任何现有的视觉理论都是不充分的，无论如何，视觉是一个复杂和困难的过程，直到下一个世纪以前，我们都不大可能提出一个综合的视觉理论。如果现在我们就想研究视觉意识问题，我们就不得不竭尽全力。为此，我们需要某种尝试性的观点，否则我们就只能错失良机。

    我认为，已故戴维·马尔（Devid MaIT）提出的研究方法是非常有用的，马尔是一个英国年轻人，为了给脑研究做准备，他在剑桥大学获得了一个数学学位。其博士论文提出了一个详细而新颖的小脑理论。后来，悉尼·布伦纳（sydney

    Brenner）和我在英国剑桥我们的实验室内为他提供了一间办公室，在那里，他提出了有关视皮层与海马的一般性操作理论，他的兴趣部分转向视觉人工智能，并到麻省理工学院（MIT）与意大利理论家托马索.波吉奥（Tomaso

    Poggio）合作，1979年4月，他们两人一块到索尔克研究所（Salk

    lnstitute）对我进行了为期一个月的访问。马尔曾经写了一本名为《视觉》的著作（他死后才出版）。在书中，他以简捷的方式解释了许多有关视觉的创新思想（他的科学论文不易读懂）。虽然并非所有这些思想都能经得起时间的考验，但在当时，这本书对这些问题的阐述仍然是巧妙精辟的。最后一章中有一段马尔与一个勉强的信奉者（我本人）之间的假想对话，它大体上模仿了他和波吉奥在索尔克的时候，我们三人之间的多次谈话。

    马尔设想出一个普遍的框架，用以描述视觉过程的粗略轮廓。他认为视觉的主要任务是获得形状的表象；明度、颜色、纹理等都不如形状重要，他自然而然地采纳了这样的观点，即大脑在其内部构建外部世界的符号表象，使隐含在视网膜图像中的很多方面显现出来。马尔认为（当然，这基本上是正确的），所有这些不可能一步完成，相反，他假设存在一个表象序列。他把它们称为“原始要素图”、“2.5维图”和“三维模型”表象。

    原始要素图（primal sketch）使二维图像中的光强变化、几何分布和组织等重要信息显现出来。它处理的特征包括边界线段、斑点、端点、间断点和边界等。2．5维要素图使以观察者为中心的坐标系中的可见表面的朝向（和大概深度）和它们的轮廓显现出来。3D模型表象则描述以物体为中心的各种形状及其空间组织。

    这样视觉任务至少可分成三个独立的阶段。这是非常有益的，因为它至少使我们意识到，看东西还需要做那么多事情。但在细节上不可能都是正确的。三个阶段可能只是一级近似，比如，颜色、纹理、运动理应加到“形状”之上。也许比三个阶段还要多，而且这些处理阶段也可能并不像他描述的那样具有严格的区别，它们可能存在双向相互作用，然而，他的框架毕竟说明了当我们看物体时所发生的处理类型，（我将在第十七章中讨论它和神经科学的关系。）

    马尔35岁时因患白血病英年早逝，这是理论神经生物学研究的一个重大损失。我坚信，如果他还在世，他绝不会固步自封，而会随着研究的进展进一步发展其脑理论，他的聪明才智和富于想像的创造力一定会帮助我们冲破今天所面临的一切困难。因为他不仅仅具有非凡的智力，对不同领域内的大量实验证据还有极强的消化吸收能力。

    为了理解大脑我们需要怎样的解释风格呢？我本人所持的观点与拉马参准的知觉功利主义理论最为接近，他认为，视知觉既不涉及我们争论时所使用的那种严格的、理智的推论，也不涉及大脑对视觉输入的“共振”那种含糊不清的想法。视知觉也不像人工智能研究者经常暗示的那样，需要求解复杂的方程才能解决。与此相反，他认为知觉“使用的是粗略的拇指规则、捷径以及某些手法熟练的小窍门。这些都是经过亿万年的自然选择，由实验和错误获得的。这是生物中熟悉的策略，但由于某种原因没有引起心理学家的注意，他们似乎忘记了大脑本身就是一个生物器官。……”我也同意拉马参准的如下表述：“直接打开黑箱去研究神经细胞的响应是解决这一问题的最好方法。但是心理学家和计算机科学家却常常对此心存疑虑”。

    按照拉马参准的观点，现阶段视觉心理学家的主要任务不是构建复杂的数学理论来解释他们的结果，而是去勾画出所谓的视觉“自然历史”，特别是视觉的旬级阶段。当视觉任务被分解成许多组成部分，特别是当显示出某些相互作用较弱或缺少时，我们就会知道到底哪些东西需要用神经元术语去解释。这些解释未必包括复杂的数学理论，但必定涉及相互作用的神经元的特性以及它们相互联结的细节。因此，由于视觉世界的复杂性，人们期望找到具有多种动态相互作用方式、粗糙但却有效的快速加工过程。

    下一步我们就要了解人脑（和猴脑）以及组成它们的众多神经细胞和分子，这将是第二部分的主题。

    ①雷诺兹报告他的结果时使用的术语是“刺激前沿非对称”（stimulus

    onsel asynchrony）(SOA）。由于刺激的持续时间为50毫秒，因此，50毫秒的SOA意味着刺激结束后掩蔽立刻开始。我把它称为零延迟。

    ①请注意，被试者井非在一个实验中报告所有这些阶段。本结果是通过比较不同的掩蔽延迟之后的知觉做出的推论。

    ②我把里贝特（Libet）的某些研究工作放到第十五章去考虑。

    ①当然，对于那些进行视觉意识实验的人，最重要的是要具备视觉心理学和各种视知觉理论的详尽知识。这样，起码可以避免出现不应有的错误。

    (2）“关于大脑，你需要知道的一切就是如何模拟它。”哲学家、人工智能专家和语言学家常常采纳这种观点。在逃避严格的科学方法的人中间，这种观点并不陌生。

第六章 知觉瞬间：视觉理论（2/2）

第六章知觉瞬间：视觉理论（2/2）