第七章 推知

上一讲主要讲语言和理知的联系。讲到语言,我的感受是:没有人不着迷语言这种东西,本来值得大谈特谈,但我们这个系列的主题不是语言,因而只谈了跟我们课题最密切相关的部分内容。但占用的时间已经太多了。好在以前我在华师大谈得比较多——那个时候,你们还没有来上学,我也写过不少,要想知道我的想法,你们可以去读读,我这里就不再去重复。[1]

语言使得推理成为可能

我们讲到语言是一个系统,一个意思是说,其中的元素之间具有某种逻辑关系。在一个语词系统里,各个语词互相勾连,这种勾连,最宽泛地讲,就是逻辑联系。红色跟绿色是并列关系,跟颜色是从属关系,跟旗子是形容关系,等等。这些是最简单的联系。你进入一个系统,就获得了一种形式,跟系统中的其他成员之间具有一种非自然的、形式上的、逻辑上的联系。逻辑,我是在广义上用的,不是我用错了。你本来是一个游民,现在日内瓦市给了你一个公民身份,公民身份这个形式使你进入了跟日内瓦其他公民的一种逻辑关系,不是一个自然人的关系,而是权利义务关系,比如说你可以去选举公职人员。

既然语词之间有逻辑联系,那么,你掌握了一个语言系统——也就是你会说这种语言之后——你就可以依赖这个系统来进行推理。比如说,你可以从这个人是你的舅舅推论出他是男的,你还能推论出他是你母亲的兄弟。当然,推理不一定都是这个样子的,例如,在我看,类比也是一种推理。不过舅舅这个例子比较简单,我们就以此为例。你可以从雪推论出白色——昨天夜里下了一场大雪,你会预期白茫茫的一片,你没推门看,就知道白茫茫一片。小学生在作文里说下了一场大雪,天地间黑压压的一片,老师给他减十分。你知道鲍里斯·约翰逊是英国首相,从“首相”这个词就能推论出一大堆东西,你可以推论出他是多数党领袖,或者推论出他是个大官或者他是代表英国这个国家说话的,他签字就管用,你签字就不管用,这些你都能推论出来。

我们能够从“首相”这个词推出这个那个,这当然是因为,首相这个概念一开始就包含着这个那个,正是这些东西营造了首相这个概念。事物一旦被命名——我说的是一旦被归属于某个概念,就有了它的是,有了它的存在,你就可以立足于它来推理了。在维特根斯坦的《逻辑哲学论》里,一边是实在,一边是语言,语言摹画实在,两者的共同之处是逻辑形式,要我说,我会说:语言就是实在的逻辑形式,或者说,语言把事物带入了一种逻辑体系之中。不过我这里还是不去谈这个问题吧,都讲完了,下次来上课讲什么啊。

所谓“推论”,意思是说,你不用去看实际情况,就可以从一事推出另一事。你知道他是个鳏夫,你就知道他是男人。但是,你不知道他几岁,这个几岁推论不出,你要去查户口本才知道他几岁,这个你要去查具体的事实。你不用去看世界,你可以从这一点知道另一点。掌握了一个形式系统,你就可以不看具体的事往前走了。你学会了算数,看见2+2就得出4。有个学生问:“老师,你还没告诉我那是两个鸡蛋还是两个梨呢,我怎么知道结果啊?”老师糊涂掉了。你管它是梨还是鸡蛋呢,你直接加就完了。

我们此前为一件事情感到遗憾:我们的亲身感受总是表达不尽,总觉得言有尽而意无穷,但语言有它的能耐,有了语言,我们就可以推理。要能够推理,就不能完全粘在感受上,所以,没办法,语言不是专门用来抒情的,你要有理知,就别没完没了感叹你的心意表达不尽。

这种推理就是我们说的理知。推理,靠什么推?靠道理推,不是靠了解更多的实际情况,而是靠道理知道。“不出户,知天下”,这话夸张了点儿,但有那么个意思。凭道理知道就是理知。而我们的语言里包含着、凝结着很多道理,形形色色大大小小的道理。实际上,语言就是人类理知的源头,语言是推理的基础,人学会了说话,从而拥有理知,就能推理。不少哲学家关注语言和推理的关系,我阅读有限,我所知道的最突出的是匹兹堡大学的罗伯特·布兰顿(Robert Brandom),人们本来从各种各样的角度探讨什么是语义,布兰顿主要从推理入手,他的语义学就叫推理语义学,inferentialism,推论主义。[2]

一般事实

我说,我们可以从雪推论出白色,哲学学生可能不同意,你这是瞎说:雪和白是经验上的联系、事实上的联系,不是逻辑上的联系。的确,你可以说这是个事实,但这个事实,不同于昨天晚上延庆北部降雪3毫米这个事实。后面这个是个具体事实,这个事实,如果你不在当地,你不去查看记录,你就不知道。跟这样的具体事实相对,我愿把雪是白的叫作“一般事实”。个殊事实和形式逻辑两者之间隔着一般事实。

我觉得“一般事实”这个概念很重要。“雪是白的”,一般情况如此,但这并不是普遍的,它是general但不是universal。在一般情况下,一个孩子写作文,说,“昨天晚上下了一场雪,我推开门,外面黑压压的一片”,老师读到会觉得不对头。然而,在一个强污染环境中,说雪是黑的,这话不矛盾。这个孩子也许接下来要讲环境污染。我们有一个正常的或者一般的环境,我们在这个环境中言说,如果依赖的是特殊的环境,我们就得加脚注说明一下。

我从下雪了推论出白茫茫一片真干净,这是因为“雪是白的”这个一般事实被吸收到(embody)了我们的语言之中。语言中沉淀了大批一般事实,比如雪是白的这样的事实。但语言没有吸收昨天延庆下雪这个事实。事实太多,没办法都吸收到语言里,否则我们的语言就太繁重了,一辈子都学不下来。如果事无巨细都塞到我们的语言里,我们推论起来倒是方便了,我们真的就会像罗素说的那样,你学会了这门语言,就能把全世界都推论出来——罗素这话是说来取笑黑格尔的,你要有理知,就可以通过理知把全世界的事情都推出来。当然,真要把世上所有事实都收进我们的语言,推论也就没有用武之地了。

从一般事实着眼,你会看到,逻辑跟事实之间其实没有一条明确的界线。为什么呢?一般事实是凝结到语言之中的经验,它把经验到的世界embody在一个形式系统中,纳入了经验里的关节点,使得我们可以利用这个形式系统来推理。经验当然跟特定的社会、特定的人群有关,在一个地方是一般经验的,在另外一个地方不一定是一般经验,在一个时代是一般经验的,在另一个时代不一定是一般经验。换句话说,一般事实和具体事实也没有一条先验的界线。刘擎在《奇葩说》走红了,这是个具体事实,你从刘擎推论不出他有好多粉丝,但现在人人都知道刘擎是个网络巨星,这个事实可能被吸收到语言里面,就像说到诸葛亮,等于说足智多谋。

包含在一般经验里的东西,你要是不愿叫它逻辑,我们可以叫它“道理”。[3]道理不是纯粹形式的,它包含在一般事实里。一方面,我们可以按道理说,就是说,依照道理来推论;另一方面,这个道理依赖于我们对一般事实的了解。在这个课程里,我们可以说,一般事实是感知与理知的交汇之处。

系统的形式化程度高低不一

一个系统的形式化程度有高有低,有的系统形式化程度特别高,欧几里得几何肯定是一个,你们学过的数理逻辑、符号逻辑也是。我们现在讲的,是语义推论。逻辑和事实,语义知识和事实知识,分析命题和综合命题,还有道理和实际情况,它们是相似的对子,这些对子不尽相同,我们可以从很多方面上讲讲怎么个不同。眼下我要说的是,如果一厢是纯形式的逻辑,一厢是一次性的事实,像昨天晚上延庆下了场雪这样的事实,那么,这边是逻辑,那边是事实,分得很开。但是语义和事实不是这样截然分开的,雪是白的是个事实,但它同时也包含逻辑——能从雪推出是白的。

总的来说,数学的形式化程度当然高,不过数学里面也分。比起算术系统,代数的形式化程度更高,a=m+n,b=p+q。有些学生,学算术的时候还明白,到了学代数的时候,怎么都弄不明白。毕竟,1、2、3这些数字,坐落在我们的经验里,所有孩子都明白,比较大的数字,可以从这些小数字延伸出来。可是a啊b啊,我们平常不用这种方式来思考,他就要问:a到底是几啊?老师说,你别管a是几,你知道a=m+n就行了,他就要问:那m是几啊?掌握了一个形式化很高的系统,即使你不知道一个符号是什么意思,你也可以进行推论,希尔伯特就是这个意思,最后,到了图灵机那里,它啥都不用知道,它照样推论,比咱们人类推论得还快、还可靠。

人们常常只把这类形式化程度很高的系统称为形式系统。这没问题,但只要是个系统,就有形式联系,在这个宽泛的意义上,系统都是形式系统。生理学是这样一个系统,经济学也是这样一个系统。反正在所有这些系统中,我们最熟悉的就是语言系统。当然了,跟算术、代数比,语言系统的形式化程度没那么高:一方面,语词之间有形式联系;另一方面,语词还需要感知支持,需要同语族人的共同经验支持,没有这种共同经验,人与人之间是无法交流的。

如果你说的逻辑是形式化程度很高的逻辑,那么不能说雪跟白有逻辑联系。不过我要说,我们不是在数学课上、逻辑课上开始学习逻辑的,我们在语文课上开始学习逻辑,不,还要早,一开始学习语言就开始学习逻辑。我们学大小、多少、上下、来去,我们就在学习逻辑,学“雪”这个词,学“白”这个词,就在学习逻辑。家长和老师教给你哪句话说得通、哪句话说不通,哪个搭配是合适的、哪个搭配是不合适的,他们教给你主谓宾,他们在教这些的时候,无论是在教语词还是在教语法,他们都已经在教给你逻辑。大家都记得逻辑这个词Logik,Logik来自logos,logos来自λόγος、λέγειν,λέγειν就是说话。你会说话了你就掌握了一套逻辑,而这套逻辑要细密得多,比你在形式逻辑课上学到的逻辑微妙得多。比如,在弗雷格逻辑里面,and和but被认为是同一个符号,我很丑但我很温柔,弗雷格说,这等于说我很丑而且很温柔,任何一个说汉语的都会觉得第二句话不成话,但是在某一种逻辑系统中,它们是等价的。像but和and这样的区别,我们三言两语就说清楚了,但是,很多很多语词的微妙联系和区别,只有说母语的人才能掌握,你对母语有感觉,你在每天的生活和实践中体会这种逻辑,练习这种逻辑。这是广义上的逻辑,是说母语的人——假设你不是说得特别烂的话——了解的逻辑。当然,你了解了不一定能说清楚,在语文课上老师把它说得更清楚。

有人说,中国人的思维不怎么有逻辑——现在没人这么说了,现在中国强大了,谁强大谁就有逻辑——一个理据是,亚里士多德在2500年前就给人上逻辑课,中国2000多年来也没有逻辑课。当然,墨子有逻辑学,但这正好是一个反证,墨子好好的逻辑就没传下来。中国没有发展出形式逻辑学科,这的确是中国学术的一个缺陷,但是直接跳到中国人不讲逻辑就过头了,因为中国人还是学语文的,而且特别讲究语文,事实上可能比谁都讲究语文。

A大于B,B大于C,然后A大于C,这是你学汉语的时候学会的,只不过在逻辑学课本里它用更严格的方式表示出来。说严格不太对,不如费点劲说用更形式化的方式表示出来。形式逻辑教我们的严格是一种严格,语文课教我们的严格是另一种严格。我语文没学好,讲什么都邋邋遢遢的,说不到点子上,班上语文好的同学,说什么都那么到位,切中肯綮,这也是一种严格,这种严格性,你从逻辑书上学不来。形式逻辑的严格性则是要把事情尽可能带到明确的是或者否。

语义推理和数学推理各有千秋

依赖自然语言的推理和数学推理各有千秋。基于感知的推理厚实,像移动一块大石头,推动一步,很多东西连带移动了,但这种拖泥带水的立体推理走不远,而且,这种推理不保证百分百——本来,下了雪你看到白茫茫一片,可是污染太重了,雪可能变成黑的。这两点是连在一起的:因为不能保证百分百,所以走一两步还可以,你根据周边环境知道推理在什么范围内成立,但走远了就不行了,误差指数增长,结论跟前提差出去太多了。在语言里,理知是跟感知混在一起的,你用自然语言推理,你受到感知的约束。好处是你在推理的时候有感知,厚实,坏处是你的推理走不远。

我们平常倒也用不着达到百分百,我们把这个任务留给数学家。数学推理百分百,一路向前,哪怕推出去一万步仍然能够保持真值。但它的缺点是感性内容单薄,我们只能用纯形式的方法来验证推理是否成立,失去了直观。数理推理可以走很远,不像立体推进,像是沿着一条线在推进。

推论有的厚重,但走不远,有的轻灵,但比较单薄。跟感知相比,推论总是比较单薄的,太厚重就一步都推不动了,那就成了感知了。在这一点上,可以跟闻知连着看。前面说过,推知和闻知很不一样,罗素把两者揽到一起,都算作描述之知,因为他要做一个形而上学理论,一切都以亲知为起点,凡不是亲知的,都可以归成一类,这么一来,推知和闻知从不是亲知这个否定的视角都被归成了一类。至于两者正面说来有什么共同之处,罗素不那么在意。现在我们可以想到,跟感知相比,闻知和推知一样,都是线性的,比较单薄。梨子是酸的,这可以感知,也可以听别人告诉我,但闻知梨子酸,你不知道梨子怎么个酸法,听别人讲坐牢的故事,你可以说自己感同身受,但毕竟隔了一层。这跟推知地体是圆的有相似之处,能推理知道地体是圆的,当然是理知的重大成就,但宇航员看到我们蔚蓝的地球,还是会很惊艳。闻知和推知所知道的,总不如感知来得厚重。

我顺便说一句,哲学里常见的论证,比日常推理形式化程度要高一些,但它们离数理推论还很远。有一次有个学生答辩,答辩时他说,哲学书里老在论证,1、2、3、4、5,好像论证得挺严密的,也都挺对的,挑不出什么错,唯一的问题是你不知道它在说什么。这个的确很常见,模仿数学来做哲学论证。要我说,哲学论证跟数理论证很不一样,只说一点吧,哲学里几乎没有长程推理,都是短程推理,不是沿着一条线推下去,而是通过好多短程论证,方方面面,营建一个gestalt,营建一个形象,让一些深层观念从深处浮现出来,成为可感的观念。数学推论到了最后不需要这个东西,不需要可感性。当然,数学思想需要可感性,数学科普通常从数学思想来谈论数学。

不管了,我们只要知道:第一,凡说到一个系统,其中的元素就有形式联系。第二,有了形式联系,你不用每次都去看世界是什么样子的,就可以从一个单元推向另一个单元。第三,各种系统的形式化程度不同。第四,数学推理和自然语言推理各有千秋。当然,我们总是先要学会自然语言,才能学会数学推理,我们把语言里的形式关系抽象出来,形成形式化更高的系统。自然语言是我们最熟悉的形式系统,也是我们所说的感知和理知的交汇之处,是理知的萌生之处。现在AI正在尝试做自然语言之间的翻译,它的路径跟我们理解语言的路径完全不一样,它不是从感知和理知的混合物里剥离出理知,把感知映射到理知系统之上,它始终没有感知,它是把理知的因素对应到我们的感知上。这个话题我们在这儿没法展开,我就讲这么几句,就当我不经论证扔出一个结论吧。

狐狸会推理吗?

语言是推理的基础,也就是说,从语言开始才有理知,只有人有语言,所以,只有人能理知,动物不能理知。

这是传统说法,今天不少论者不再接受这个结论,认为这属于人类中心论。不少动物学家主张,很多动物都会推理,德瓦尔写了一本《万智有灵》,[4]举出好多实例,说明黑猩猩啊甚至乌鸦啊什么的,都会推理。这牵涉到我们应该怎样界定推理这个概念,这个我做不了,你们要问郁振华老师。我在这里倒是想讨论一下我们在第一课抛出来的一个问题:狐狸看见兔子的脚印,它是推论出有一只兔子跑过去还是感觉到有一只兔子跑过去?我们的课谈论感知和理知,对这个课来说,你不妨把它当作一个主导问题。那天下了课,我跟几个老师一起去吃晚餐,路上就讨论这个,每个人都有一个不同观点——讨论这种事情差不多都是这样的。当然,我的想法跟别人也不一样,这个想法有点儿古怪,你听了一乐就行了。

首先,这不是一个所谓字面之争,不是说,事情本身很清楚,你只不过是叫它感知,或者叫它推论。无论你叫不叫它玫瑰,它是什么花已经很清楚。这不是个字面的争论。如果你说狐狸是在推理,我就要追问,蚊子是不是在推理——狐狸经常出现在寓言里面,狐狸精着呢,它可能会推理,但说蚊子会推理我们都会觉得过了,蚊子触到了二氧化碳它就知道往这儿来找你。感知还是推理?这是个实质问题。

那么,该怎么来思考这个问题呢?当时提出这个问题,你可能不知道怎么去思考这个问题,现在,我们已经有比较多的资源来思考这个问题。我现在也许仍然给不出答案,Yes or No,但我们已经有了一些线索,现在可以把它们集中到这个问题下来考虑。

面对这个问题,我首先问自己:狐狸看到的是兔子的脚印吗?雪地上有两行小小的洼陷,我们说,那是兔子的脚印,那是我们这么说。我们在前面说过,因为我们有语言,在我们的语言里,它们就是脚印。我们不能这样来想:那就是脚印,谁来看那都是脚印。我们来设想一只甲虫。甲虫爬过兔子的脚印,它感知不到那是兔子的脚印,兔子不兔子不相关。洼陷它是感知得到的,因为洼陷相关——它拖一只金龟子回窝,地面的高高低低跟它有关系,它就会感觉到高高低低。

当然,甲虫太笨了,那我们来设想是一只麋鹿,它知道那是兔子的脚印吗?它不知道。为什么不知道?因为它不关心。它看到的是两行洼陷,我是说,它没有把两行洼陷看成兔子的脚印。为什么呢?当然是因为麋鹿不想追兔子,是兔子不是兔子不关它的事。这事儿不相关,它就感知不到。麋鹿没有看到兔子的脚印,当然,它也就不会推论出有兔子跑过去。对于什么动物来说,那是一串兔子的脚印呢?只有对于特定的动物,对于那种一看见就要去追它的动物,对于要吃兔子的动物,那才是一串兔子的脚印。我要说的是,狐狸要吃兔子,对它来说,是不是兔子的脚印相关,它才会看到兔子的脚印,把这些洼陷视作兔子的脚印。狐狸不想吃兔子的话,它就感觉不到那是兔子的脚印。只有有欲求者才能感知,没有欲求者什么都不能感知。感知不是感官的事情,而是整个有机体的事情,整个有机体还包括欲望等。

你看,我好像是在为欲望正名呢。还真是。通常想来,欲望那么低级,理性那么高尚,人们总把欲望视作理性认知的障碍,是的,有时欲望会构成障碍,但首先,它是理性认知的基础,没有欲望,就不可能感知,更别说发展出理知了。

我们太容易被自己的认知领着走,那明明就是兔子的脚印,你就以为怎么说也是兔子的脚印,不是的。需要好多的条件,它才是兔子的脚印。所以,你说狐狸从兔子的脚印推论有兔子刚刚从这里跑过,你完全是身为一个人在思维,你好像在谈狐狸,但是你没有设身处地地去替狐狸想想,你更没有把狐狸想象成一只麋鹿。你看,常有人夸我说我能把复杂的事情讲简单,其实我也挺善于把简单的事情讲复杂的。

好,狐狸想吃兔子,它看到的不只是两行洼陷,是兔子的脚印。狐狸看到的真的是“兔子的脚印”吗?我们不清楚。但鲁滨孙看到了星期五的脚印,这很清楚。你问他看到了什么,他说“我看到了陌生人的脚印”。我们知道他看到了什么,那是因为鲁滨孙会说话,把他看到的混沌映射到语言系统里了,在这个语言系统里,把那叫作脚印是最好的映射。你去问狐狸看到的是脚印吗,它怎么回答?就像你去问蝙蝠看到或听到的,它没办法回答,因为它没有语言。

狐狸不能回答,但若我们替它回答,我们会说狐狸看到了兔子的脚印——虽然我们不能说麋鹿看到了兔子的脚印。但我们说“兔子的脚印”,兔子和脚印是两个词,可以分开——脚印就是脚印,兔子就是兔子,分开来,就可以谈论兔子的气味,或者麋鹿的脚印。这里我可能需要插一句解释一下,我们用句子来谈论事情,这个句子是由一些语词构成的,一个语词必须不仅能够用在这个句子里,也可以用在别的句子里,“脚印”这个词,不能永远跟兔子连在一起,我们必须也能说麋鹿的脚印、人的脚印。如果它只能跟兔子连在一起,它就不是一个独立的语词了。我贸贸然这么一讲,你们可能跟不上,但也只能先讲这么两句,我在讨论维特根斯坦早期的思想时写过这个,[5]你们可以去读一下,读的时候要稍微动动脑筋,不是那么容易理解。

我们通过语言看事情,可以把兔子和脚印分开来看,可以在只看见脚印没看见兔子的时候谈论“兔子”的脚印。可是对狐狸来说呢?也许根本没有分开,兔子的脚印直接就连在兔子身上,另一面又跟它对兔子的欲望、预期连在一起。如果是这样,我们就不能说狐狸看到了一串脚印,推论那是兔子的脚印,推论刚刚有兔子跑过。

感知是整体的,推论是分步骤的

只有把脚印和兔子分开,才谈得上从脚印推论出有只兔子。在推理之知中,推理的步骤跟结论是可以分开的,我是说,必须分开。比如,如果A大于B,B大于C,那么A大于C,这是一个最简单的推理,这里,A大于B是一回事,B大于C是另一回事,一码是一码,它分成一个一个环节,然后得出结论A大于C。推论是所谓discursive thinking,这个西语词不好翻译,通常译作推论的;康德说,人类的理知,即经由概念的认知,都不是直观的,而是推论的。[6]不过,这么说也要谨慎,我们讨论一般事实的时候说到过,逻辑和事实不是完全分开的,或者这么说,纯形式的推理和语义推理有区别,脚印这个概念连着某动物跑过,或者反过来说,有动物跑过这一点多多少少隐含在脚印这个概念里,所以你能推论出来有动物跑过。

A大于B,B大于C,这是两个独立的事实,但感觉不是这样。推论是分步骤的,感知是整体的,我们讲过,我们首先感知到的是一个gestalt,是一个整体,因为只有作为整体它才有意义。在推论中,前面的一步一步好像是给结论提供证据,但在感知中不分证据和结论,感跟知连着,你感你就知了,你直接感觉到那个结论。这个结论不需要证据,或者说,你那个感觉就是证据。

所以,你就知道最好不说狐狸从脚印推论出刚刚有只兔子跑过去。这些事情在狐狸那里也许是连成一片的。所谓连成一片,我的意思是说,在狐狸那里,兔子的脚印只跟兔子刚刚跑过连着,不跟其他别的事情连着。

兔子的脚印跟兔子永远连在一起吗?狐狸看到兔子的脚印,就一定直愣愣地去追兔子?像一条直线似的?狐狸看到脚印的时候有可能犹豫。这个脚印可能新鲜,可能不新鲜,如果那是挺长时辰之前的脚印,狐狸会犹豫,追呢还是不追?它看见脚印跟看见兔子是不一样的,反应不一样。我这么说你们能跟上吗?我是说,要区分这些反应,动物学家可不可以说,狐狸看见兔子的时候,它直接看见兔子,它看见脚印的时候,这只狐狸推论出有一只兔子?不这么说,这位动物学家该怎么说呢?他可能真的就没有好的说法。于是他就把这个说成推论。这里我们遇到的不是一条鲜明的界线:这边是感知,那边是推理。这里有一系列过渡,需要更为细致的考察,但我们至少要提醒自己,这里说到推理,跟语义推理不是一回事。

我们这个课讲感知和理知,我们一上来没有做定义,但讲到这里,我希望,我们对感知和理知区分得更具体些、更清楚些了。但我们也看到,两者之间的界线并不是那么鲜明。感知中不一定包含理知,这一点应该比较清楚,草履虫感知,蚊子也感知,但我们很难说它们有理知。但也许,说到狐狸,说到黑猩猩,它们的感知里面已经包含了某种理知。

美元与密码,以及用法

课程一开始,我讲到三种情况:感知,理知,既可以感知也可以理知;感知有时候已经包含了理知,反过来呢?理知中是否一定包含感知?理知能不能转回来变成感知?——这些问法挺笨拙的,不过你们大致能明白我的意思。

我还是用折算美元这个例子开头。初到美国,美元值多少我要折算成人民币,我知道美元值多少,先是一种理知,但后来,我慢慢对美元有感知了。当然反过来,一个美国人正好相反,这是一个对称的关系。初学英语跟这个有类似之处。我一开始读Sein und Zeit的时候,一边读一边翻译,不是为别人翻译,是为自己翻译,我懂德文,但不那么熟悉,一点一点琢磨,我们不像对母语那样对德文直接有感觉(make immediate sense)——如果能那么说的话。德语和汉语也是互逆的。当然,学会德语跟折算美元有一个很不一样的地方,那就是德语和汉语是翻译,不是折算。这背后有很多可说的,但这不是我眼下要说的,我现在的问题是,是不是所有理知最后都可以转回来变成感知?

好,我们现在来想想密码。密码有好多种,有一种密码很简单,电视上看来的那种——一本《圣经》,他写8个数字,你按这8个数字在《圣经》里是多少页多少行第几个字,你把它挑出来。爱伦·坡写到过一个类似的,但比这复杂。我这里再引一段维特根斯坦:

你给我一个用我不熟悉的符号写成的句子,同时给我破译它的密码钥匙,那么从某种意义上来讲,你也就给了我与理解这句话有关的所有东西。不过,问我是否理解了这句话,我仍然会说:“我必须首先破译它。”直到这句话译成了德语,摆在我眼前,我才会说:“现在我理解它了。”……

我说一句话:“我看到那儿有一个黑斑”;而这些词不过是随意的:于是我把这些词依次替换为字母表中的头6个字母。现在这句话就变成了“abcdef”。但我马上会注意到,我无法——人们会说——直接用这一新的表达式来想前一句话的意思。或者我也可以这么说:我还没有习惯不说“我”而说“a”,不说“看到”而说“b”,不说“那儿”而说“c”,等等。而我的意思并不是:我还没有习惯见到“a”这个符号就联想到“我”;而是:我还没有习惯在“我”的位置上使用“a”。

(维特根斯坦,《哲学语法》,第1卷第6节)

abcdef,相当于给你6个数字。他给了你一串密码,你把它翻译成一个汉语句子。当然,一到汉语句子你就理解了是吧。看起来有点儿像你初学英语,但接下来就有了区别,我在美国待的时间长了,慢慢地,我就对英语或者美元直接有感觉了;我对abcdef却永远没有感觉,只有等到它翻译成了一句汉语,我才对它有感觉(make sense)。

是什么造成了这种区别呢?我们说,英语和汉语是互逆的,看你最先熟悉的是哪一种,这无非是说,有的人对英语本来就直接有感觉,比如,英语圈的人,他们对英语就直接有感觉,一开始你对英语没有感觉,那是因为你是从外面进入这个圈子的,你需要理知帮助你进入这个圈子,你真进来了,就像英国人一样就对英语直接有感觉了。我们讲的这种密码,abcdef这样的一个密码,它不是这样的,它不仅对你是陌生的,而且,没有任何一个圈子的人已经在那里用abcdef说话。

这个区别重要吗?重要。我们还来讲维特根斯坦,他喜欢讲语言的用法,我进一步讲,由于有用法,因此有逻辑。我们把山底下那块叫作山脚,把山中间那块叫作山腰,山腰和人的腰有联系。这个明显。你说醋是酸的,你胳膊举久了你说胳膊酸了,这两个酸的联系也许没那么明显,但也是有联系的。你胳膊举久了你说胳膊甜了,或者说,胳膊蓝了,胳膊蓝跟天蓝就没有逻辑联系,我想没有哪种语言里会说胳膊蓝了。英语里辣的、热的是一个词——hot,汉语里是两个词,不过,我们也说热辣辣的。

是有了用法才有逻辑呢还是有了逻辑才有用法?这是个值得一说的事情,但我们眼下不去管它,不妨说,这两方面其实是一件事的两面,反正,用法里包含逻辑,或者说,只有包含逻辑的才叫有用法,否则就叫瞎用。这里说的是自然语言里的逻辑,不是先有一套先验逻辑,然后我们根据这套逻辑来确定语词之间的联系。用法跟逻辑互动。

用法不是说,我就这么用了,你怎么着?没道理的用法不是用法。当然,这个道理可能是我们一开始谁都不知道的道理,你是个诗人,你的用法可以是簇新的用法,但这个簇新的用法也有道理在其中。这可以从演化论来想,人家长五根指头,我六指,你拦不住我长六指,但这不合乎道理,我长了,传不下去。可谁知道,结果六指是有道理的,更有道理,以后人都变成六指了。你会说,五指更有道理还是六指更有道理,这要看环境是什么样的。完全正确,加十分,道理本来就跟环境连在一起。我们刚刚说到先验逻辑,道理不是从先验逻辑里推衍出来的。所以我说,实际用法跟道理互相纠缠,那些有道理的用法才是用法。

abcdef转写成“我看到那儿有一个黑斑”不是翻译

这样我们就清楚了,abcdef,跟英语不一样,它没有用法,它不编织在生活里。这也相当于说,abcdef这些符号之间没有逻辑联系,或者说,a指这个,b指那个,这两个指法之间没有逻辑联系。

你可能坚持说,abcdef也有用法,例如,a必须对应我,b必须对应看到。但一个语词的用法说的是它根据某种道理可以这样用不可以那样用,这个道理内在于语言系统,a对应于我,这个规则是外加在a上的,不是a的用法,不依赖于a在abcdef里的逻辑。这串符号内部没有逻辑联系。这跟把I翻译成我是不一样的,那只是对应,不是翻译。a和我对应,这是点对点的对应。初看起来,I和我也是点对点的对应,不是的,I首先在英语里有用法,有它的位置,它在英语里的位置相当于我在汉语里的位置。英语语词之间有一套逻辑,汉语语词之间有一套逻辑,abcdef之间没有一套逻辑。至少我举的这种最简单的密码是这样,密码跟明码是一对一的联系。在这个意义上,这系统本身不是一个系统。你说,它们有逻辑,这6个字母是按字母表顺序排列的,这是一种逻辑,但这个排列顺序跟“我看到那儿有一个黑斑”里面的6个词的排列顺序没关系,谈不上把abcdef的逻辑映射到“我看到那儿有一个黑斑”的结构里来。所以,把abcdef破译成“我看到那儿有一个黑斑”是解码,不是翻译。当然,我们也说“翻译密码”,这是在很宽的意义上说翻译,跟两种语言之间的翻译不是一回事。解码也需要一套规则,但这套规则跟密码和明码这两个系统内部的逻辑没关系。这跟我把“I see a black speckle there”翻译成“我看到那儿有一个黑斑”不同,翻译里也有一点儿解码的工作要做,但总体上,英语的逻辑跟汉语的逻辑虽然不尽相同,但两者的道理有很多重叠或相通之处。

关于规则和用法还可以说很多,但我们就停在这里吧。维特根斯坦自己有时也把规则和用法混为一谈。《哲学研究》里包含一大片规则的讨论,这是从较早的稿子里直接移到这本书里的,在我看,其实跟《哲学研究》里的主导思想不怎么适配。

假设我是个译密码的、一特工,假设我记忆力特别好,而且我成天干这个,你一说abcdef,我不用翻书,马上就知道是哪几个字,知道你在说“我看到那儿有一个黑斑”。我们很容易把这混同于我好多年前用美元买东西的那种经验,混同于有感之知。但不是那么回事儿,这个源于我折算的熟练,而不是那些密码本身有了用法或者逻辑。我最后懂得的或者感知到的仍然是那句汉语,而不是密码之间的联系,这些密码之间是没有逻辑联系的,这是我要强调的。一套复杂的密码,也可能自己就是个系统,各个密码之间有逻辑联系,这个我不懂,但是abcdef这个不是这样的系统。

当然,你可以设想有一批人一开始就用abcdef这种表述方式说话,这个可以,不是你说黑斑,他脑子里先翻译成f,他直接说f,那abcdef就不再以现在这种方式连着,它们像单词那样互相联系,就像我们编出一种世界语,大家都用它说话,最后它演变成一种自然语言。

我是切汇的,对兑换率特别熟悉,我在美国生活了好多年,对美元值多少特别熟悉,这两种都可以从不熟悉变得熟悉,但它们的性质不一样。一种是熟练掌握折算规则、转换规则,一种是把数字公式什么的跟日常经验连起来。都是变得熟悉了,但仍然应当区分这两类。最好只把后一类叫作直接可感。后者有点儿像我们理解一句格言,一句格言,小时候听到,只是字面上懂得,后来人生经验多了,说现在我真正懂得什么叫向上的路和向下的路是同一条路了,这不是因为你对一套转换规则熟练了,而是你有个更广泛的经验的支持。这种理解像个无底洞,有的格言你毕生会不断加深领会。

理解数学公式

我们再来想一想另外一种——数学公式,比如二项式啊、指数的四则运算啊,我们能不能对它们直接有感觉?那些复杂的物理学公式,还有那些很抽象的物理学概念,物理学家能不能对它们直接有感觉?

我们给小学一年级的孩子讲四分之一这个概念,说一除以四之后,它的结果是四分之一,这个你要举例,一块蛋糕切成四块,先切成两半,你拿到了一半,再切一刀,你拿到了四分之一,四分之一跟蛋糕连在一起,他就比较容易明白这个四分之一是什么意思了。他的明白有他的经验托着。但过两年你给他讲同底数幂的加减乘除,就很难找到适当的经验来启发他,你把幂的四则运算还原到指数的基本概念来给他讲解,教给他为什么同底数幂相乘,底数不变,指数相加。随着孩子长大,你的教学法老在变。一开始你讲那些最最基本的东西,用日常经验的例子,一次花五块钱,把五块钱摆在那儿,花了三次,你摆上三张五块钱的票子,这样教他5×3等于15。不妨说,5×3等于15是有感性内容的。但你不用这种方式讲幂的四则运算。

相当明显的是,2+3=5,这个编织在我们的日常经验里,就像我们说他登山时间长了,所以累了,经验告诉我们,做吃力的事情,时间长了人会累。那么,350兆呢?我一直认为,大数字跟2、3、5性质不尽相同,并非好像都是数字,只是大小不同,大数字,2的10次方、10的20次方,我们对这些没有感知,它们只有通过逻辑规则跟2、3、5联系在一起。在这个意义上,它们有点儿像密码。

大数字这个例子不太好,我们至少对大小有个感觉。最好用一个遥远而复杂的公式来举例,比如说一个微分方程,我不懂微积分啊,就是举个例子——这时候用一个我不懂的公式来举例恰恰好。你给我讲一个微分公式,这个符号代表的是什么,那个符号代表的是什么,我记住了,然后你给我一道特别简单的例题,我把其中各项对应到这个公式的各个符号,按照你刚刚教给我的程序一步步演算,哇,我解出来了,微分我弄懂了。且慢,我弄懂了吗?换一道题,给我一道稍微变形或者稍微复杂一点儿的题,我又蒙了。比如说a2-b2=(a+b)(a-b),你教一个3岁的孩子,把一个一个数字代入,然后按什么程序做下一步,他照猫画虎做下来了,这算他懂得这个公式了吗?

好,他不懂;后来他长大了,学代数,学霸,a2-b2小菜一碟,这时候他懂了吗?我的意思是,是他变得越来越熟练了,还是他现在对这个公式有感知了——就是说,像密码专家那样变得极其熟练了,还是这个公式融入了他的生活经验?都不很像。的确,在我看,都不是,是另外一种。

数学家对一个复杂公式直接有感觉,或者说,他有感觉,有直觉,我们没有直觉。一个公式,他一看就大致知道这个公式用得上用不上,应该改用另外哪个公式,一个公式指向哪个方向,他有感觉,马上就能看出来。那是不是这个复杂公式对他来说已经编织在日常经验里面了呢——就像1、2、3、4、5对我们来说是融在生活经验里面那样?我个人觉得不是。但也不是像密码专家那样变得越来越熟练了。把密码转成明码的一套规则是外在的,但数学公式之间的转换依赖的却是数学内部本来就有的一套逻辑,数学内部有个结构,分出不同层次等,层次之间也都有逻辑相连。在这个意义上,数学符号、数学公式也有用法,这说的不是一道应用题可以选用这个公式或那个公式,而是说,一个公式在系统中有它的用法。

所以我想说,数学行家对复杂的公式有了直观,既不同于熟悉了美元,也不同于熟练的密码解码。这两种在数学里都有,小学生刚开始学数学,要把数字、公式什么的跟日常经验连起来,也要学习数字、公式之间的折算规则、转换规则。但这两种都不是数学家的直观。数学家的直观指的是掌握了符号公式在数学系统内部的用法,懂得它们在系统内部的逻辑。

我这种不懂数学的,在一个意义上能掌握一些数学公式,在特定场合能使用,计算992-882,我不懂乘方,但我可以套用一个公式把它变成四则运算,我查一下公式,照猫画虎,算出来了,就像图灵机那样工作。可是数学家不止于此,他能感知这个公式的意义,举一反三,你看他,嘿,这个公式还能这样用,还能这样延伸、转换;就像你读诗,哇,诗人这样用这个词。就像初学外语的人,我那时候背单词,一个一个写成汉语,最后出来一个汉语句子,像解密码似的。

经验理解与专业领域内的理解

一个抽象的数学符号,一个公式,它怎么可以变成一种可理解的、在可领会的意义上的可理解的东西?逻辑之知怎么会有感?这事儿还是很费琢磨的,我的想法是,一个公式,它在数学系统内部是有用法的,它不只被规定了必须这样用;或者说,这些规定是有道理的,有道理就超出了规定,于是可能举一反三。只不过,这个道理是数学内部的道理。我可能不理解这个道理,但能够照猫画虎那样应用一个公式,但弄通了数学的人明白这个道理。卢瑟福说,如果他不能给大一的学生讲清楚,那就是他自己没弄懂。我最近刚看了一本书,那个作者在导言里说的是一模一样的话,他说要是我不能对普通读者写清楚,我就会怀疑是我自己没弄懂。我相信他们说这个话不是矫情,在一个意义上,只有把一个物理学概念、一个数学概念融通到我们的整体经验里,才算是彻底弄懂,但除此之外,还有一种理解,那就是在一个理论系统内部的理解和不理解。几乎所有物理学家都说,量子物理学还没有获得彻底理解,可是说到物理学内部的理解,当然,卢瑟福有卓越的理解,而我们傻乎乎的啥都不理解。

我从前想得比较粗糙,区分自然理解和数理理解,不区分数理理解和按照规则转换符号的理解,把两者都称为技术性理解。这是不对的。对于“技术性理解”这个用语,我就一直觉得很不舒服。

归结下来,我觉得应该区分几种情况:第一种是维特根斯坦所说的用法,以自然语言为范本,通过用法,词语沉浸在经验世界里,所谓语言游戏,用法使得词语有意义,我们感知这种意义。第二种是数学中公式的用法,有点儿像词语,但它不是沉浸在经验世界里,是沉浸在数学世界里。第三种是解密码,专家熟能生巧,你一说abcdef,他就知道是“我看到那儿有一个黑斑”,但abcdef仍然没有意义,没有用法。

感性—知性—理性

我们谈感知和理知,现在看起来,理知跟感知的关系不是一式的,有的理知含有感知,有的理知不含有感知。语言之知是一种理知,但它总是要有感知。数学是个理知系统,但这个系统的开端之处有感知,在这个系统的内部,你可以有感知。从密码到明码,依循规则转换过来就可以了,不需要感知,也没有感知。如果它没有道理,没有内部的逻辑联系,你就无法感知它。

这种带有感知的理知,我经常称之为有感之知。感知作为知,当然是有感之知,不过,我说到有感之知指的不是感知,因为感知当然是有感之知,我主要指的是内含感知的理知。

本来人们只区分理知和感知,但随着近代科学的发展,就多出了一种区分:有感的理知和无感的理知。理知从语言发端,语言里的语词是一些符号,但这些符号有感性内容,语词带着这些感性内容推理,比较笨重,走不远,减少感性内容,推理就可以走很远。数学推理是个范例。但最初,数字也是带有感性内容的,在最早的数理学家毕达哥拉斯那里,1是直接有意义的,4也直接有意义。这个我们不多说。

有了希尔伯特,有了图灵机,我们今天相当清楚什么叫作无感的推理。从前没有这么清楚,但敏感的哲人已经感觉到,新哲学,也就是现在所说的科学,有一种倾向,要向无感的理知发展。最早觉察到这个的应该是意大利哲学家维科,但我们也可以套用德国古典哲学的Vernunft和Verstand来说这个,翻译成汉语是理性和知性。“知性”这个词一面跟感性捉对,一面跟理性捉对。这个词现在有了日常用法,知性女主播,不光靠颜值,还挺有知识的,有理解力。我们这里说的知性没那么生动,说的是认知的一个层级,知性比理性低一等,因为知性是抽象的,而理性是感性和知性的统一。德国古典哲学家对这些有很复杂的说法,黑格尔甚至把康德的理性看成其实没有超出知性。黑格尔是要回到绝对,回到直接性,只讲理知,只讲推理,这个直接性就丧失掉了。这个我们不管它,只说感性—知性—理性这么一个三段式,感性最低,知性比感性高,最高的是理性。这三者的高低顺序应该怎么排,你们自己去决定,但在我们这个课里,从思想发展顺序来说,我们一开始有感知,后来发展出了理知,这个理知不分成带感知的还是不带感知的,它的体现就是希腊人不分哲学和科学,不分Vernunft和Verstand,更不分有感之知和无感之知。不带感知的纯粹理知是后来发展出来的,是图灵机逼着我们去区分这两者。我就这么空口说说,你们当我个人意见就这么一听。

希腊人讲nous、讲理性,那就是哲学了,笼统说起来,哲学的这种理知是有感的理知。希腊人自己认为他们追求的是纯粹理性,要摆脱感性,而我们今天回过头来看,他们从来没有摆脱过感性。所以,海德格尔不把nous翻译成Vernunft,而翻译成Vernehmung,Vernehmung翻译成汉语,我们一般译成感知。你看,希腊这个nous,我们都翻译成理性,但要途经海德格尔的Vernehmung来翻译,却成了感知。我不是在讨论怎么翻译更好,我只是想说,感性、知性和理性它们有这样一个纠缠。我不知道你们能不能跟上,能跟上吗?其实也无所谓跟上没跟上,我并不是在做一个大型的推理,从前提开始,经过很多论证,最后要达到一个结论。你就把我讲的当成一些散点来听就行,觉得哪个地方有意思,你就多想想。这些点是互相联系的,就此而言,也可以算是个系统,但你们就在课堂上这么一听,肯定听不出多少前呼后应,你能听到多系统就听多少,听不到也没关系。

反正,我们不能一讲希腊人的理性,就想成我们现在所讲的理性。我总让学生们多读一点希腊的东西,哪怕多听说一点也好。缘故也蛮简单的,我们在有了理性的东西之后,经过2500年,我们已经在脑子里积淀了无数的理论,而且这些理论可能是完全互不相容的。但是,因为我们很忙,没有时间把它们都弄清楚,所以,我们的脑子是分裂在各种理论里面的,然后一层又一层的意识形态在左右我们怎么看这个世界、看人与人的关系,这肯定是有好处的。但是,我现在讲一个坏处。你去看希腊人的时候,你会发现希腊人的眼光特别清楚,这话不是我说的,你去读互不相干的书都能发现,我前段时间读薇依的《伦敦文稿》[7]——在座的也许有一两个人也读过——她关心的事情跟我们讲的完全不相干,但她有一处提到,说希腊人不会像现代人这么糊涂。所以,我们总要多去琢磨希腊,如果你真想把世界想清楚的话。

无感的推理

希腊人的理知是欧几里得式的,我们对图形是有感知的,希腊人想不出四维空间。不妨说,哲学是三维空间的理知,而科学是四维空间的理知。科学是从哲学开出来的,就是说,科学是从有感的理知开始的,但若科学结束在图灵机这里,那它最后就结束在完全无感的理知那里。这背后有一个长长的历史,从哲学到科学,从科学理性到技术理性,我在这里只说结果,这个结果就是:“感”和“知”逐渐变成了两个不相干的事。图灵机不用感知就能推理,比我们谁都推得快、推得好,这是无感的推理。

图灵机会推理,但它啥都不理解,不过,设计者还知道它是怎么工作的,为什么你输进去这样的一些数值它会得出那样一些数值。到了深度学习,计算机或者是人工智能,连设计者也不知道它怎么就得出了那些结果。我们普通老百姓都知道的一个例子就是AlphaGo Zero,横扫所有的围棋世界冠军。现在世界上最好的棋手是一个韩国孩子,特别小,十几岁,AlphaGo Zero可以授他两个子。但是AlphaGo Zero是怎么赢的呢?它为什么下这步棋?没人知道。包括它的设计者。他们设计了一个程序——当然,事实上,是设计了一大堆程序——设计完之后,电脑自己就可以去学习,“深度学习”,然后发展出了它自己的推论方式,它是怎么推论的,我们不知道,顶尖的AI专家也不知道。用AI界的行话说:失去了可解释性。什么叫可解释性?我不太懂,咱们这里马上要举办一次意识问题会议,有一位中国顶尖的AI专家陈小平会来,你们可以请他讲讲非解释性。我简单讲讲还可以,解释这个词或者这个概念是把我们连回到感性世界的一个主要途径。一个公式,我们看不懂,专家解释给我听,把这个公式连到我已有的知识上,最后连到我能够感知的经验上。非解释性大致就是我说的那个没有感知的理知,我们看得到它的结论,但不知道这个结论是怎么推出来的,你甚至看到它的推论,每步推论都合乎规则,但我们不知道它为什么这么推论,我们不知道怎么把它连到我们的经验上。

我们还记得,“感知”,sense,就是意义。图灵机可以把我们带到很远很远,但我们失去了感知,意义好像流失了。

外部之知与内部之知

上面说的,也可以说成外部之知与内部之知。在某种意义上,理知偏向外部之知,在你的脑子里转,没有融化在你的心里,甚至你可以把它外化到词典里面、密码本里面、兑换表里面,最后交给计算机去处理。但是感知就不大行,我们怎么把感知放到机器里面?AI能帮我们解决哪一类的问题,不能做哪些,这个你们可以去想,我也会去想,也许下一个大课程就做这个。

归纳下来,我们对整个世界的理解,有可能是理知的,有可能偏重理知,有可能偏重感知。世界可能有点宽了,举个例子吧,我在别处举过这个例子:欧洲人到了北美洲,跟印第安人打交道,他们要去了解印第安人,无论跟印第安人做买卖还是跟印第安人打仗,他们都需要知道印第安人的作息,印第安人吃什么、用什么武器,这些都要去了解。这是一种知己知彼。这是一种知,但还有另外一种知。跟印第安人打交道多了之后,有一些欧洲人不愿意把印第安人看作外在于自己的,只是被利用的或敌对的,在他们看来,印第安人也是人,他们想要去了解印第安人的信仰和世界观,想要去了解印第安人是怎么想问题的,是怎么感受这个世界的,他们为什么以他们这种方式行为处事,举行各种仪式。换句话说,他们想要了解印第安人是怎么感知世界的,这就必须动用自己的感知。

外部之知与内部之知是个常见的提法,我自己也常这么说。不过,像所有两分一样,这个两分只是开个头,我们上面讲的要稍微细一点儿,理知当然不能等同于外部之知,但的确可以从理知发展出纯粹外部的知。

[1]参见:《简明语言哲学》,2013。另见:《约定用法和“词”的定义》,《外语学刊》,2007年第5期;《约定用法和“词”的定义(续)》,《外语学刊》,2007年第6期;《言意新辨》,《云南大学学报》(社会科学版),2013年第6期;《关于查尔默斯“语词之争”的评论》,《世界哲学》,2009年第3期。其他刊登在期刊上的语言哲学论文基本都收录于《简明语言哲学》,这里不再一一列出。——编者注

[2]参见陈亚军主持翻译的“实用主义与美国思想文化译丛”,其中包括布兰顿的著述《阐明理由:推论主义导论》,陈亚军译,复旦大学出版社,2020。译本品质可靠。——编者注

[3]关于道理与逻辑,参见:陈嘉映,《说理》,第9章第19节“概念联系就是事物的一般联系”,以及第3章第17节“约定与道理相交织”,2020。——编者注

[4]弗兰斯·德瓦尔,《万智有灵:超出想象的动物智慧》,严青译,湖南科学技术出版社,2019。——编者注

[5]参见:陈嘉映,《简明语言哲学》,第7章第2节“事实与物”,2013。

[6]参见:康德,《康德著作全集(第3卷):纯粹理性批判》(第2版),李秋零译,中国人民大学出版社,2004,第80页。

[7]西蒙娜·薇依,《伦敦文稿》,吴雅凌译,华夏出版社,2020。——编者注

上一章 封面 书架 下一章