半个世纪前,在美国贝尔实验室工作的数学家申农(C.Shannon)和魏弗(W.Weaver)在《通讯的数学理论》(Mathematical theory of communication Claude E. Shannon & Warren Weaver 1949)一文中提出了通讯工程中信息运动的模式以及信息的量度。这篇论文虽然只是针对通讯工程中的问题,然而其影响很快超出工程技术领域,渗透到系统工程、生物工程、信息工程和大众传播等方面的研究,为这些正在谋求突破僵局的学科提供了一种新的观点与理论框架,有力推动了不同领域中各个有关学科的建立与发展,成为一切涉及信息运动现象研究的起点。
申农理论的主要内容是提出了信息运动模式和信息量的度量。尽管这一理论当时是针对通讯工程中需要解决的问题,但是半个世纪之后重新审视这一理论发现,其意义远远超越出通讯工程这一特定的范围,而成为研究信息运动的普遍理论基础。针对通讯工程的研究无非是研究普遍信息运动问题的突破口或切入点而已。科学史中的事实已然表明,对任何科学原理普遍性的认识从来不是一蹴而就,都有一个从具体问题切入,逐步展开最后才能获取一般的普遍的认识的过程。基于这种认识,我们需要对申农理论依次进行介绍和阐述,并在这一过程中明确我们对信息及其运动的认识。当然,我们在这里明确申农理论的基本精神,并不是要求以掌握通讯工程中的信息理论为先决条件,实际上,通过思辩的努力照样可以取得满意的结果,无需高等数学的基础。
1.对申农信息运动模式的解释 这里,我们主要依据原北京邮电学院(现为北京邮电大学)周炯槃教授编著的《信息理论基础》[6] 一书中对该模式阐述的基本精神对申农信息传播模式做出诠释。
周炯槃教授所撰写的《信息理论基础》是为通讯工程的主要目标——信息运动提供一个以数学形式陈述的概念体系。对通讯工程而言,这种做法是必要的,而且也是成功的。因为,数学形态能以明确直捷的方式显示并厘清概念间的联系和关系。此外,周炯槃教授作为长期从事信息理论研究开发工作的科技工作者,对信息及其运动却具有他人难以企及的感觉和认识,这些认识必然以一种自然自在的状态反映在他的阐述之中,只是没有提出专门论述而已。
在谈到信息这一概念时,周炯槃提出:“信息是一个常用的词,它代表着某一抽象的有待传送、交换、存贮以及提取的内容。”[7] “信息是一种抽象的东西,不易掌握。”[8] 在对信息特点的阐述上周炯槃教授两度提出其“抽象”的特点。这里的所谓抽象是指由于信息概念的外延太大,问题也过于复杂很难用语言对其进行较为全面的阐述,所以就使用抽象一词予以陈述。因此,这里使用“抽象”二字不是哲学概念的抽象。
周炯槃指出“其实信息是一个含义相当深刻的概念,它涉及到生命现象本身。从远古的生物进化直到当代形形色色的科学和社会活动中,无处不涉及到信息的交换和利用。然而信息这个概念迄今尚未被人们充分掌握。”[9] 这表明信息不局限于人际间的通讯行为还涉及生命现象和社会现象。这里所谓的“迄今尚未被人们充分掌握”我们理解包括两个方面。一方面是指至今尚未得到一致或取得大部分人的认同的信息定义,另一方面则是指生物体中的信息编码问题还不完全清楚。比如我们尚且没有获得或完全获得人体各个信息通道的符号编码,虽然在这方面已然进行大量的,跨学科的基础研究工作。
关于信息运动问题,周炯槃指出,“语言只是代表信息的符号。同样的事情可以用不同的语言表达,也就是同样的信息可以用不同的编码方式转换成符号。这些符号有时就称为消息。消息是具体的,但还不是物理性的,当然也不是信息本身。而说出来的语言却已成为物理性信号,可以在自然界传播,或者说在实际信道中传送。”[10] 这里他已然提出信息是独立于语言之外的一种being ,再次明确确有、实有信息。周炯槃指出:“用书信传递信息是一种古老的通信方式,这里所用的符号仍是语言符号。在用文字的形式书写在纸上后,纸上的字就是一种语言信号,它可以通过邮路送到对方去,而收信人须用眼睛看,来完成译码过程,从而获得信息。这时信道实际上起了存贮信息的作用,发信者把信息存在纸上,收信者利用光信号由人眼来接收。……用电通信就最大限度地缩短了时间。它与书信的差异仅在于用电信号来传送。因而编译码过程将包含把声音信号(或其它符号如电报电码,传真图象或电视信号)换成电信号(由话筒完成);而译码时再把电信号换成声信号(由听筒完成),而传送时可用电缆或无线收发信系统的信道,其它与面对面谈话相仿。”[11] 他用这个实例对符号和信号的区别做出了阐述,明确指出信息、符号和信号是三个不同的概念,进而明确了信息是一个单独的概念。
他接着指出:“所谓编码,就是用符号来表达信息,这通常称为信源编码部分;然后将符号转换成信道所要求的信号,这通常称为信道编码部分。总之,所谓编码不过是把信息变换成信号的措施,译码就是编码的反变换,而信道就是传送物理信号的物理设施。我们碰到的信道总是具体的、物理性的,而信息则是抽象的,信号只是信息的载荷子。符号或消息也是具体的,但它并不是物理性的,它是代表信息的具体方式。”[12] 对这一情况他强调指出,“这里应分辨信息、符号或消息、信号这三者的不同含义,以便正确地理解通讯系统的实质问题。”[13]
我们认为,周炯槃虽然是针对通讯工程这个特定的领域提出信息、符号(包括编码系统)和信号是三个不同的概念,然而,这三个概念的提出对认识信息运动(决不限于通讯工程等人际间信息运动,而是普遍的信息运动)具有关键性的作用。因为这三个不同概念的提出就将为构建普遍的信息运动概念体系提供了基本概念框架。从这个意义上看,怎么估计提出这三个概念的建设性作用也不为过分。为此,需要对周炯槃的论述深入分析。
周炯槃指出:“符号或消息也是具体的,但它并不是物理性的,它是代表信息的具体方式。”这里所谓的“具体”不是与“抽象”对立的“具象”,而是表示代表了信息。比如单个英语字母只是编码符号,只有组成语句,也就是编码之后才能成为代表信息的消息,即message 。如果不把这句话语说出来或书写出来,使之成为信号,那么这个消息就只能保持在消息的状态无法实现各类信息运动。由此可知,只有把信息用符号予以编码,然后用与符号相对应的信号予以承载才能够实现诸如信息的发送、接收、存贮、提取以及处理等信息的实际运动。至于信息具体运动过程的性质将因具体系统的差别而不同。比如,人体内信息运动的信号就不完全是物理信号,其中还包含复杂的生物化学、生物物理信号,其信号运动则是生物化学、生物物理过程。
从周炯槃论述多次提到“物理性”,再结合当代神经生理学、神经解剖学的成果,即生物信号具有生物物理、生物化学特性来看,我们把编码信号的性质从物理范围加以拓展,从而提出编码信号实体性概念。因为信号就是以某个实际系统的物理或生物化学、生物物理状态变化而呈现出来的。比如个人计算机(PC)中的编码信号就是在电路中运动的电脉冲,而电脉冲则是电路中物理状态间歇变化。由此可知,在出现信息运动时必然伴随系统状态变化,至于这个变化的性质,则因系统的性质不同而不同。但是,无论具体信息系统性状差别多大,信息的发送、接收、存贮、提取以及处理等信息运动都是依靠编码信号的operate完成的。至于具体operate过程则因所论系统不同而不同,我们使用operate便于排除把operate只解读为加、减、乘、除等算术运算的干扰。
由于周炯槃明确提出信息、符号或消息、信号这三个概念以及信号的实体性这一基本特性这就为我们更进一步研究考察信息运动建立了坚实的基础。在以后的研究中,我们将越来越清晰地认识到其作用和意义。下面通过具体事例阐述信息、符号和信号的概念,进而明确其区分。
信源编码是人际间信息运动的重要组成部分, 周炯槃 教授指出“信源是信息的来源,它一般以符号的形式发出信息。我们对其内部结构往往不十分了解,例如人发出信息是通过大脑组织指挥嘴说话或其它动作,这是一个相当复杂的过程,我们只能研究它的输出,即所说的话或动作。” [14] 就目前的知识水准看,神经生理学尚未从信息及其运动的角度给我们提供大脑如何“组织指挥嘴说话或其它动作”的生理机制,并对这种行为给予生理学的解释。面对这一困境,我们把人是由大脑指挥嘴说话作为既定事实接受下来而对其生理机制予以“悬置”,也就是存而不论,只从“能研究它的输出,即所说的话或动作”并在唯象层面上逆向追溯进而推测(猜测、揣测)其宏观运作机制。幸好,心理学的研究成果对我们这种逆向推测多少增添了一些可靠性。从我们研究人际间信息运动的角度看,心理学对感知觉、思维、意识和表象以及对能力、意志和情绪、情感等研究成果相当于对人脑中极其复杂的信息运动提供了一种可实证的宏观表象。这样,就使我们有可能绕开或避开现在尚且不清楚或不十分清楚的人脑中信息运动的具体运作过程进而从宏观效果上,唯象地处置人际间信息运动问题。下面我们就以 周炯槃 教授的观念为导向阐述申农理论的基本精神。
申农理论的信息传播模式如下:[15]
信源→→→→→→编码→→→→信道→→→→解码→→→→信宿
Information source Encode Channel Decode Destination
Message signal
↑
干扰
Noise
申农信息传播模式原本针对通讯工程的实际问题提出的。所谓通讯(communicate)就是传递信息(Information),从通讯工程的观点来看,信息自身不能运动,所以首先要求对信息按照一定规则使用符号(Symbol)加以编码(coding),从而构成一个符号集合,这一编码之后所构成的符号集合我们称作消息或讯息(Message),它不是信息,只是确定了信息的承载方式,所以,它是信息的代表,自身也不能运动。为了实现信息运动必须以某种实体形式存在的(至少是物理的,如声振动或电磁振动、电脉冲等),与符号相对应的信号(Signal)对其加以承载方能实现信息的传递、接收、存贮、提取和处理等各项信息运动。
2.通过实例进一步解释申农信息运动模式
现以声音的数字化传输为例对应用于通讯工程中的申农信息运动模式进行解释,以便明确对该模式基本精神的认识。
在这种情况下,信源是诸如说话、音乐等声音。对声音通过取样编码,把声振动转换成数字编码。这一编码方式可以借助于相应电路予以落实。当前,取样编码以及转换成电脉冲都通过一个集成电路模块,也就是模数转换器(analog-digital adapter A/D)一次性总体处置。通过这种转换装置,声音转换成相应的数字脉冲编码信号,这个信号经过适当转换或者刻录在光盘(现在的CD)上,或者通过电缆传到用户,也就是接收端。此时,电缆(有时使用光缆)或者是光盘就是信道,它实现信号的传输和存贮功能。在接收一方,将接收到的电脉冲通过相应的解调电路(同样借助于一个集成电路模块,用于实现编码的逆向变换过程—解码decoding),也就是数模转换器(digital-analog adapter D/A)和其它功能电路使声音复原。要传输的声音和接收到的声音都可以从物理上予以检测,检测显示的二者差异就是失真。我们把造成失真的原因笼统叫做干扰(Noise)。
所谓数字编码的数字,通常使用二进制记数法,因为二进制记数法最便于使用电脉冲予以显示,也就是用电路的接通和断开能够方便迅捷地代表二进制中的数字0和1。所谓数字的意思就在于此。在数字电路中广泛使用的二进制编码的原因决非出于我们对这种记数法情有独锺,根本原因就是将就现有的电子技术设施。
这里简要叙述把说话声波施行编码的过程。首先,需要对声波进行采样(sampling),采样频率可达到44.1kHz 。所谓采样,就是把这种在10万分之2秒时间内的声振动转化为相应的电压(工程技术上叫做电平),然后再把这个电压使用16位二进制数字(也就是两个字节,8位二进制数字为一个字节)予以表示,这就是编码。如果一个16位二进制记数表示一种电平大小,那么16位二进制数值可以表示出的代表声振动的不同电平数为65536。这是很容易计算出来的。因为这相当于216。这就是说,全体16位二进制数值可以代表65536种电平的差别,也就是65536种不同的声音。单就声音振动频率而论,人的听觉最低可感受到15Hz ,最高是20kHz 。要是使用数值表示,那么只需要19985个数值就足够了。所以,对声音使用16位二进制数字编码是相当细腻了,何况我们每隔10万分之2秒进行一次取样编码,所以,对听觉而言,可是说达到了高保真度要求。就解码而言,在接收到这些数字之后,将数字转化成相应的电平,这就是数模转换器的功能,此后,通过相应的设备将电平转化成声音。在这里,全体16位二进制数值就是编码符号,而且是人编制的,并非天然形成的。选择16位二进制方式的理由同样也是将就数字电路的运行机制。
下面从阐述图象编码的事例再次明确这一问题。这里以数码照相机为例展开说明。在数码相机里代替感光胶片的是图象传感器。这是一个有效面积是15.1×22.7(毫米2)的互补金属氧化物半导体(CMOS)传感器。在它上面如同镶嵌砖(masaic马赛克)一样分布着3110400(2160×1440)个有效像素。在拍摄时,呈现在传感器上的图象就被分割成311万个同等大小的像素,对每一个像素的色调、饱和度和明度使用二进制数字予以编码。由于图象编码系统和设备以及有关数字处理软件有关,目前尚且没有形成统一的工业标准。不过在使用二进制数字编码上面是共同的。此时呈现在传感器上(也就是所拍摄到)的一帧画面就转化成数字和代表数字的电脉冲,这样以便于传递和存贮。此后,在将代表该图象的数字还原为像素,这样就能在监视器的屏幕上看到这一图象,也可以借助于彩色印制设备作成和彩色照片视觉效果相同的照片,或者将编码数字刻录在光盘上,以便于保存的提取
从编码机制上看,图象和声音是类似的,只是图象转化为对马赛克编码而已。作为数字相机来说,对一帧图象的完成编码时间相当于摄影胶片的曝光时间。如果变更电路功能,使设备每秒钟可以完成 28 帧图象,这就是数字式电视摄像了。当前,数码相机和数字化电视摄象机已经成为批量生产的商品。
从上述情况可知,在通讯设备上,编码,解码都借助于相应的技术手段(电子线路)予以处置。所以,在针对通讯工程的申农模式中,声音和图象相当于有待运输的货物。就象运送货物那样,对声音或图象进行编码和解码只相当于装卸货物,而不关注装卸的是什么货物,在这种情况下,通讯相当于货物的运输装卸,信道就是这一货物的运输通道。在通讯工程中,编码解码系统都是电子线路,一经设计成型,并投入批量生产使用,这一系统的功能就确定下来,不再出现任何变动了。这是通讯设备的特点,也是通讯工程中信息运动的特点。所以,在通讯产业里,只依据通讯符号的多少计算费用,不考虑信息内容,就如同运输货物时只依照重量计算费用一样。
从这些情况可以看出,信息自身不能运动,首先要借助于符号系统施行编码,然后,将这一编码符号再转换成相应的,具有实体意义的信号,从而实现信息的各种运动。为此有必要明确符号、信号的意义以及它们之间的关系。
3.信息编码符号和信号
为了明确符号、信号概念的内容和它们之间的关系,我们需要缩小研究范围,仅就汉语为例展开阐述,通过对现象更进一步考察分析以便突显问题,达到实现明确符号、信号概念的内容和它们之间的关系的要求。这里需要指出,此时我们把语言符号和语言符号编码规则只是作为既定事实看待,不讨论不同语言的起源和相互影响。
首先让我们用前面提出的信息、编码符号和信号概念考虑显示在此处的“ 汉语 ”两个字以及从某个人口中说出来的“ 汉语 ”这个语词到底是信息、编码符号、还是信号?也就是说用实际现象对其做出检测和鉴别。
从上面的阐述中可以看出,显示在这里的“ 汉语 ”两个字以及说出来的语词“ 汉语 ”都应该是信号,而且是物理的,前者是光波,后者是声波。可是其他人用同一字体书写出来的“ 汉语 ” 两个字和其他不同年龄,不同性别,不同地域人们的口中所说出来的“ 汉语 ”这两个字又算是什么呢?这些信号之间可以说千差万别,究竟是什么因素可以让我们把它们都认同“ 汉语 ”这个语词呢?信号到底具有什么样的共同属性才能构成人际间信息运动时予以认同的基础呢?这是一个看上去清楚然而不易陈述的问题,现以书写文字为例对其做出说明。
我们仅就汉字楷体而论,不同的人书写同一个楷体文字,从书写结果上来看形状都有一定差异,即使同一个人书写同一个楷体文字若干次,每次书写的结果都有差异。然而,无论是不同的人书写的同一个文字,还是同一个人把同一个字书写若干次,尽管看上去有千差万别,但是书写的结果必定具有某个共同的,保持不变的东西(应该说是特征或特性),这个必须保持不变的东西应该就是我们对这个书写结果认同的基础。就汉字而言,这个不变的东西应该是对线条的某种空间结构的规范。当然,这种规范可以是约定的,而且也决非一成不变(如汉字字体的演变),不过需要具有相对稳定性。再比如,使用同一语言(同一地域的方言)的不同人,讲同一句话,声音是不同的,然而我们都能认定这是同一句话。那么这些不同声音中共同的因素又是什么呢?这个因素就是使用这一语言人群共有的发音规则,这和汉语中笔划线条的结构规范是一样的。
从对信号的分析使我们明确了符号的内涵。从上面阐述中可以看出,就汉语而言,所谓符号在文字上是汉字笔划的共同规范;在言语上是共同的发音规则。就人际间信息运动而论,这个笔划结构的规范和发音规则是存贮在人体大脑里面的,这就是信息编码符号,也就是信息的代表。这个信息编码符号自身无法实现向外界的运动,必须把这个存贮在大脑中的符号变成具有实体性的信号,信息的运动才能够实现。正如周炯槃所说“语言只是代表信息的符号。同样的事情可以用不同的语言表达,也就是同样的信息可以用不同的编码方式转换成符号。这些符号有时就称为消息。消息是具体的,但还不是物理性的,当然也不是信息本身。而说出来的语言却已成为物理性信号,可以在自然界传播,或者说在实际信道中传送。”这里说的“具体”是指符号已然代表一定的,意欲传递的信息。至于符号如何充当了信息的代表,也就是二者间有什么关系使得符号可以充当信息的代表,以及如何把符号转化成信号等问题,我们将在第三、四章中做出系统阐述。
从这一事例中可以看到,所谓符号(确切地说,应该是编了码的符号集合)就是用于代表信息的规则、规定或是一种范式。这一规则、规定或范式可以是约定的(人造的),也可以是固有的(天然的,如生物遗传编码)。从上述事例可知,符号只能用于编码,它自身不能运动,为了实现信息运动(传送、接收、存贮、提取和处理)必须使用实体信号(物理的、化学的、生物化学或生物物理的等等)承载符号,因此,一个符号原则上可以有无数个承载它的信号。至于如何实现这种承载功能,我们将在以后阐述。
由此可以得出结论:在人际间信息运动中符号具有相对稳定的不变性,而信号在形式和形态上既具有多样性,同时必须具有某种不变的规范性,否则就无法实现信息交流功能了。从上述情况看,符号就是信息的代表,信号就是符号的实体运动形式,或者说是负载符号的实体。这就是我们对符号、信号的界定。同时也表明信息、符号、信号是三个不同的概念。
从分析通讯工程和人际间语言形态的信息运动中可以把申农理论的基本精神概括为以下几个方面。
[1]在通讯工程和人际间语言形态的信息运动中表明实有、确有信息。
[2]只有对信息施行信源和信道编码才能实现信息的各项运动。信息、符号和信号是三个不同概念。
信息运动涉及的范围很大,决不局限于通讯工程和人际间语言形态领域。下面将通过对实际情况分析阐明信息运动范围广泛性的特征。
|