第五节 申农理论的基本精神
 

  以上通过罗列事实并结合申农信息传播模式从本体论意义上明确信息确实是being ,而不是虚构,同时也对信息运动的条件进行了分析,提出信息、编码符号以及编码信号这三个概念。

  申农信息理论虽然是针对通讯工程的特定需求提出的,可是其基本精神所揭示的问题却远远超出这一领域,特别是申农理论揭示出信息概念丰富的内涵。耐人寻味的是,揭示出的这些问题却是在申农提出信息传播模式时始料不及的。

  我们前面只是阐述申农理论的基本内容,下面将揭示申农理论的基本精神。为此,需要关注那些申农认为不言而喻,无庸赘述的问题,而这些恰恰是明确申农理论基本精神,显示其具有普遍意义的重要内容。

  申农只关注通讯工程中信源信宿之间的信号运动,通讯工程中的信号就是电信号。这就是说,申农已然不言而喻地确定了信号和信道属性的关系,申农所面对的是物理系统。此外,为了研究信源和信宿之间的信号运动,申农着意从众多实际通讯系统中抽取出信源、信宿之间的信息运动部分单独考察,并且有意置信源、信宿在实际信息运动中的关系于不顾,只有这样做才不会在形形色色的通讯行为中目迷五色,从而失去洞察底里的可能,也才能够提出信息量(信息熵)的度量途径和信息运动模式。从研究信息运动方法看,这种研究途径是完全必要的。

  申农信息运动模式只是从大量现实信息运动中不考虑实际系统各个部分之间具体关系情况下所抽象出来的信息运动共有的结构框架。因此,在用申农信息运动模式考察分析实际信息运动的时候,必须将申农在阐述其理论时认为是不言自明,不言而喻的条件一并考虑在内。只有这样,我们才能充分开发使用申农理论的功效。



1.信息的接收

  在申农信息运动模式中只是把信宿得到了来自信源的信号后叫做接收到了信息。在讨论信源、信宿间的信号运动时可以这样陈述。不过怎么才算是信宿接收到了(即加以解码)信源传送过来的信息呢?信宿接收到信息的标志是什么?而且,信源将信息通过信道编码发送出去之后就一定表明信宿已然接收到信息了吗?下面我们将要对这些申农理论中那些无庸赘述,不言而喻的情况给予明确的陈述。
  现在通过对实例进行分析研究揭示信息接收的特征。首先看电视信号的情况。这里取电视发送装置和电视机作为信息传输系统。电视信号发送装置是为信源,电视机是为信宿。不打开电视机电源开关,即使此时有电视信号放送,依旧没有信号传输到电视机里面来,所以此时无所谓信息接收。打开电视机后,如果没有信号传输过来,此时电视屏幕上呈现分布均匀的,闪烁不定的光斑,这也就是电子学里所说的“白噪音”信号。一旦电视图象信号发送过来,这样的光斑消失,代之以明确的图象。因此,图象的出现标志着信宿接收到了信息。

  我们从信息运动的角度看这一现象。在没有信号输入时,电视机上所显示的闪烁不定的光斑,在我们观察时刻之前或之后的混乱情况没有什么差异,在电视机的屏幕上不同位置的混乱也没有显著差别,借用物理学上的术语可以说这种混乱在时间和空间上处于对称(symmetry)状态。可是一旦有信号输入,也就是有信息输入,这种对称立即被打破(物理学上叫做对称破缺symmetry broken),原来的混乱无序被时间、空间有序所取代。所以,信源接收到信息的标志也可以说原来那种时空对称状态因信息的输入而被打破,并且以有序状态所取代。

  第二个实例是电视广告。此时的信息系统是代表某种商品经销商的广告与消费者,代表经销商的广告节目是信源,消费者是信宿,该商品的广告则是信息,此时电视系统就是传递信息的信道。在接收到该商品广告后,消费者的状态是购买、拒绝购买以及没有确定是否购买这三种状态,也就是三种态度。至于没有接收到这个广告时消费者就谈不上什么态度,也就是这三种状态处于混乱无序的状况。对照上面关于电视信号接收情况看,所谓接收到信息的标志依然是信宿,即消费者状态发生变化,从原来混乱无序状态变成有序状态。

  在现实生活当中,电视节目中的广告可以说是鳞次栉比,接踵而至,在这种目不暇接的情况下常常会对这些广告产生一种略有印象但是没有感觉的情况。从信息运动看,这种情况属于信息传递过程中因干扰而导致的信息传递失真,以至所接收到的信息不足以达到改变信宿状态的效果。

  总之,接收到信息的结果必然导致所论信息系统信息运动状态的改变 。而这种状态变更基本是可察的。

2.信息运动过程何以可能的基础——信息编码信号的实体性

  信息运动不限于信息的传递和接收,还包括诸如信息的存贮、提取以及处理等各项信息运动。那么这些信息运动运作何以可能则是我们这里将要研究分析的问题。

  如前所述,信息必须加以编码,然后再以相应的信号予以承载方能实现运动。因此,分析研究信息如何运动就转化为分析研究信息编码信号在某特定信息系统中如何运作问题了。研究这个问题现成的事例就是当前普遍使用的个人计算机(PC)。

  当前使用的计算机都是通过对信息编码信号施行运算(operate)来实现其各项功能的。施行或可施行运算的基本原则就是英国数学家Turing提出的Turing机理论。[21] 此后,美国数学家von.Neuman将Turing的理想计算机落实为可施行实际计算操作的结构模式,并且沿用至今。这些问题在任何一本微机原理教程中都有陈述。[22] 我们所关注的问题只在于operate。从微机原理使我们看到,至少在现在通用的计算机里信息运动的方式是信息编码信号的operate ,而这种operate则是以Turing提出的数学模型,即Turing机理论实施operate 。

  从一般意义上,“抽象地说,所谓计算就是从一个符号行ξ得到另一个符号行η。”而且“所谓从ξ得到η是指能够从ξ出发,在有限步内真正具体求出η。”[23] 从符号运动看,Turing机理论就是从一个符号行得到另外一个符号行的运作规则,对符号实施这种规则就是符号的operate 。在计算机里,即von.Neuman计算机,就是借助于数字电路对承载符号的电信号具体施行这种operate 。因此,在计算机里的operate是实际的物理过程。这里operate的具体情况在任何一本数字电路教程中都有系统阐述,不赘。

  我们这里使用operate而不使用其相近的译文“运算”的主要理由就是在当前的计算机里,这种operate是数字电路中实在的物理过程,而不是加、减、乘、除、乘方、开放、指数、对数等只能施加于抽象符号的数学运算。更形象地说,这种operate决非我们在基础教育中熟知的笔算。只是由于计算机中对编码信号的operate可以实现和数学运算(笔算)完全一致的运算结果,所以我们才把计算机里面的过程叫做运算。这样一种处置方式仅仅是为了使用便利而采取的权宜之计而已,这又叫做“界面友好”。典型的事例就是现在常用的电子计算器。计算器表面上标志出加、减、乘、除、乘方、开放、指数、对数,甚至还可以计算方差等功能键,而且在输入数据并使用上面的功能键之后,就可以得到和人工计算完全相同的计算结果。虽然,在计算器内部所实际运行的信号operate却完全是另外的形态。施行上述运算的基础在于计算器中进行的是实在的物理过程,也是计算器这一物理系统实际状态变化的过程。由此可知,在计算器中信息编码信号表现为该系统物理状态的变化。

  当然,承载信息的信号不局限于物理性质,也可以是化学的,或者是生物物理、生物化学的,但是,无论采取什么性质,信息编码信号都表现为该物质系统状态的改变,这就是信息编码信号的实体性。各种各样的信息运动就是借助于这些实体性信号的各种运动变化而得以实现的。

  因为在计算机里,即使施行上述算术或代数运算其运作机制也不是直接进行这些数学运算,而是对承载符号的信号施行operate,并由此得到相应的数学计算结果的。这种实体性的operate也就表明,此时信息系统因信息运动而导致状态改变。基于这种情况,我们才使用operate表示这个过程。此外,如果使用翻译皮亚杰《发生认识论》所提出的“运演”却又会产生这种operate是抽象推理的感觉,与operate的物理过程的实在性相背离。在这种两难情势之下不如使用operate来得便捷清晰。

  由于明确了信息运动过程是一种实体性的信号operate过程,信息系统在施行operate之前和施行operate之后就不一样。这种情况的差异就可以使我们能够用信息系统的信息运动状态予以陈述。这种状态就是实在的,而非抽象的,同时也为对该系统状态变化使用动力学类比提供了坚实的实证基础。
  在非计算机信息系统,比如生物信息,人体中各种信息都是以信息编码信号实现运动,那么在这些现象里,信息运动方式也应该是信息编码信号的operate ,只是我们没有任何根据断定此处信息编码信号的operate一定就是物理过程,也可能是生物化学过程或生物物理过程,甚至是这两类过程的交混,而且其规则未必一定遵从Turing机理论。当前人工智能神经网络研究所遇到的困难似乎也在暗示这些非计算机信息系统中的信息运动遵从某种非Turing机理论。

  尽管上述这些认识还很不尽如人意,但是毕竟能够给我们提供以动力学观念观察、审视和分析非计算机中信息运动提供了一个比较坚实的基础或叫做“踏脚石”。这样看来,信息运动过程就是信息编码信号的运动,也就是具有实体机制的信号的 operate ,虽然我们还不知道或不完全知道这种operate的具体运作方式,可是知道确有这种实体性的operate就前进了一大步。

3.信息量和信息的意义不能混为一谈

  在冯端、冯步云撰写的《熵》一书的第八章“妖精的启示——熵与信息”中指出:“显而易见,信息既有量上的差别,又有质的不同。一段文字,字数的多少反映了量的差别,而其蕴涵的意义则反映了质的不同。”[24] 此后,他用李白的五言绝句“静夜思”和另外一个也是二十个汉字的文字比照,进而提出“有关信息内容问题,实际上涉及价值的评估,显然超出了自然科学的范围。目前对此尚无法做出具有客观性的、大家都能接受的论断,因而不得已只能舍此求其次:采用电报局的办法,只计字数不问内容,回避了涉及信息内容这一重大而有争议的问题,而单在信息量的问题上下工夫,这正是申农建立信息论这一门科学的出发点。”[25] 尽管我对此有不同认识,但是我欣赏这种把问题阐述明确的风格,这样也便于我就此展开阐述。

  信息内容的意义(也就是信息的价值评估)是由信源信宿所在系统之中的实际关系所决定,而且这个关系又由该系统自身性质所决定,这是和申农信息理论中信息量无关的另外的问题,这也正是申农信息运动模式有意抽掉的内容。正如前面引用魏弗所说的,在他们视野中所研究的编码系统是“与你说的是什么没多大关系,而与你能说什么有关”。因此,提出信息的量和质的区分未必妥当。在实现信息运动中,信息编码的符号系统和信号系统确有量和质的问题,不过只是在通讯工程的意义上讨论。在信息工程中减少编码符号数目,提高信号品质一直是不断改进信息技术产品的努力方向。

4.信息量和信息熵

  从分析信息接收中所提出的实例可以看出,即使对同一个电视信号(广告)来说,如果把系统取为电视信号发送设备和电视机与把系统取为商品经销商和消费者,二者信息运动结果将大相径庭。效果上这种差别完全由系统自身性质所决定。此外,虽然有这种效果上的差别,但是系统在由于信息运动使系统从无序状态进入有序状态这一点上却又是共同的。正如维纳在《控制论》中所指出的:“对于动作来说,重要的不是所发出的信息量,而是能进入到通讯和储存设备之中,并且足以激发动作的信息量”[26] 在更为复杂的系统中,如使生物生命延续,社会有序运转等信息也实现同样的功能。从这个角度看,申农提出的信息量概念的作用和意义就远远超出通讯工程的范围了。

  下面再来考察实际信息运动中申农给出的不确定性函数H的数量变化。在实际通讯过程中由于无法控制的干扰导致某些编码符号消失或难以识别辨认致使该符号无效,此时反映在不确定性函数H上就是该函数将因此而减少,也就是信息量减少,即反映出信息丢失。比如那种“木刻”型的黑白艺术照片就是复制再复制的结果,鲜明地显示了在每一次信息传递过程中信息丢失情况。复制再复制就是有意让信息丢失再丢失,以便取得预期的艺术效果。此外,一句话经过多人转述,最后可能面目全非,也是如此。

  统计热力学中熵函数的增大表示所论系统混乱程度加大,而不确定性函数H的增加也同样表示因信息丢失而导致的接受信息不充足所引起的模糊。不过更让人激动的情况还在另外一个方面。从前面讨论可以看出,在信息运动中,信宿将因获得信息而使得不确定性函数H减少。如果我们把不确定性函数H叫做信息熵,那么。得到信息就是得到负熵。从统计热力学结果看,熵的增大意味着混乱增大,熵的减少意味着混乱减少,也可以说有序增加。前面所说的事例就鲜明地显示信宿得到信息之后改变原来无序情况,出现了宏观有序状况,也可以说得到负熵之后有序增加了。从这种对照可以清楚地看出,在系统有序和无序(或有序、无序程度)变化方面看,热力学熵函数和信息熵的基本精神是完全相通的。

  从信息熵的概念看信息接收则能使我们得到更为重要的认识。信宿接收到信息表明此时信源对信宿在符号编码的不确定性方面发生减少。如果使用信息熵概念,相当于信宿得到了负熵。就物理学中熵的一般意义说来,熵的增加,即得到正熵,系统的混乱增大,有序减少;得到负熵,系统的混乱减少,有序增加。通过这种对照可以发现,信息熵对系统对系统状态变化的作用和物理学中熵函数变化反映系统状态变化的意义相同,因此,我们完全有理由,有根据把信息量叫做信息熵。

  这里需要对不确定性问题进行必要解释。不确定性是对随机实验概率分布总体情况的陈述。可是无论怎么说,归根结底依据是对模态命题某种情况的述说。不过,模态命题是只有人才有条件做出的行为。这种针对人自身特有的行为陈述怎么就能使用到电视发送设备和电视机所构成的非人系统之中呢?这里的根据就是从信息运动过程看,人际间信息运动过程与非人系统中信息运动过程没有差别,基于这种理由才把从人际间信息运动中借助于模态命题研究,即概率论的结果无条件地使用到非人系统里面的信息运动之中。因此,不能认为这么做就是把非人间过程予以“拟人化”。

  从这些实例的分析中可以看出,信息的接收决非纸上谈兵,而是显示在所论系统状态发生变化的现象之中。
  统计力学中熵函数形式为 S=kln叫热力学几率,符号T表示热力学,不是函数的幂。

其中W= 这里N= ;ω= 这里 是相空间中相格的体积,ω是全体相格的体积。这里的是粒子处于相格中的概率。

信息熵的形式是 H(A 1 , A 2 ,… An)= -这里 A1 ,A2 ,… An是n个随机事件, 是随机事件Aj的概率。比较这两个数学表示式就可以看到,其共通之处是都有概率这一项。

  在附录中我们将把热力学熵函数,统计力学熵函数和信息熵并列给出,并且进行简要陈述并比较他们的特点,进而建立起相应的关联。不过因为所论对象不同,热力学熵函数有量纲,即焦耳/K0 ,信息熵没有量纲。

  通过这种对照讨论可以发现,我们把不确定性函数H叫做熵是完全必要和可行的。通过讨论还可以看到,此时所论系统应该是信息接收系统,也就是信宿。信宿状态变化就是由于输入了负熵而造成的。这里需要强调指出,无论什么熵函数都是宏观状态函数,熵函数的改变就表明所论系统宏观状态的改变,而所谓宏观状态的改变必定是能够体察到的状态改变,绝对不是数学分析中给出的那种什么都可以是,但是归根到底什么也不是的抽象函数,如f(x) 。

  如此说来,得到信息就是得到了负熵,这就意味着有序。维纳在《控制论》中指出:“信息量的概念非常自然地从属于统计力学的一个古典概念——熵。正如一个系统中的信息量是它的组织化程度的度量,一个系统的熵就是它的无组织程度的度量;这正好是那一个的负数。这个观点引导我们产生了许多关于热力学第二定律的考虑,引导我们去研究所谓麦克斯韦妖的可能性问题。这些问题也从关于酶和其它催化剂的研究中独立地产生出来,而关于酶和催化剂的研究主要是为了专门了解有生命的物质的新陈代谢和生殖之类的基本现象,…”[27]

   在生命现象中由于信息运动使得生物体得以维持有序地存活恰恰印证了这个情况。物理学家薛定格早就提出过生物体“以负熵为生,即吃进负熵:消化食物,吸收其自由能。”[28] 从这些情况可以看出,申农理论固然是针对通讯工程中的现实需求而提出的,但是也可以说他们是“无意间”切入到信息理论的核心问题,使我们由此得到了认识上的飞跃,不但明确了信息运动模式同时还得到了信息熵并且借助于信息熵的概念可以直接进入系统演化问题。从这个情况看,申农理论的意义已然远远超越了通讯工程领域了。