笔记-综合知识-1.1 信息的定义和属性

1.1 信息的定义和属性

1.1.1 信息的基本概念

信息 (information) 是客观事物状态和运动特征的一种普遍形式,客观世界中大量地存在、产生和传递着以这些方式表示出来的各种各样的信息。

各种文献中有许多对于信息的不同理解和表述,其中最值得注意的是以下几种。

控制论的创始人维纳(Norbert Wiener)认为:信息就是信息,既不是物质也不是能量。这个论述第一次把信息与物质和能量相提并论。

信息论的奠基者香农(Claude E.Shannon) 认为:信息就是能够用来消除不确定性的东西。这个论述第一次阐明了信息的功能和用途。比较流行的另一种说法认为:信息是事先不知道的报导。还有,哲学界认为:信息是事物普遍联系的方式。

重点:信息是能够用来消除不确定性的东西

不难发现,以上这些说法不完全一致。维纳的说法和哲学界的说法是从客观的角度给出的表述,香农的说法和另一种流行说法是从信息接收者主观的角度给出的判断。

总的来说,信息的概念存在两个基本的层次,即本体论层次和认识论层次。前者是纯客观的层次,只与客体本身的因素有关,与主体的因素无关;后者则是从主体立场来考察的信息层次,既与客体因素有关,也与主体因素有关。本体论层次的信息概念因为它的纯客观性而成为最基本的概念,认识论层次的信息概念则因为考虑了主体因素而成为最适用的概念。

1. 本体论信息概念

事物的本体论信息,就是事物的运动状态和状态变化方式的自我表述。按照这个定义,所谓得到了某个事物的本体论信息,就是知道了这个事物处在什么样的运动状态,以及这个运动状态会按照什么方式发生变化。

这里所说的“事物”既可以是外部世界的物质客体,也可以是主观领域的精神现象;“运动”是泛指一切意义上的变化或过程;“状态”是指事物运动过程中呈现出来的相对稳定的形态;“状态变化方式”是指事物运动的动态变化情形。由此可见,哪里有事物和事物的运动,哪里就必然有本体论信息的存在。世间事物无处不在,本体论信息无处不有,本体论信息是取之不尽用之不竭的信息源泉。

2. 认识论信息概念

主体关于某个事物的认识论信息,就是主体对于该事物的运动状态以及状态变化方式的具体描述,包括对于它的“状态和方式”的形式、含义和价值的描述。由于引入了主体的因素,认识论信息的内涵变得比本体论信息更丰富了。按照这个定义,所谓得到了某个事物的认识论信息,就是不仅知道了这个事物的运动状态和状态变化方式的表现形式,而且知道了这种 “状态和方式” 的含义以及它们对主体的价值。

因此,如果获得了足够的认识论信息,就可以根据它的形式、含义和价值做出恰当的判断和决策。反之,没有充分的认识论信息,人们的决策就可能带上盲目性。这就是认识论信息在认识论意义上的巨大作用。

从上面给出的定义可以看出,认识论信息本体论信息是相通的,它们共同的核心都是“事物运动的状态和状态变化的方式”。不仅如此,两者之间还可以相互转化。转化的基本条件就是主体因素:引入主体因素,本体论信息就转化为认识论信息;去除主体因素,认识论信息就转化为本体论信息。人类认识世界的任务和先决条件之一,就是要把本体论信息恰如其分地转化为认识论信息,为其后的决策提供依据。

1.1.2 信息的定量描述

香农被称为是“信息论之父”。人们通常将香农于1948年10月发表的论文《通信的数学理论》(A Mathematical Theory of Communication) 作为现代信息论研究的开端。香农用概率来定量描述信息,给出了如下公式:

公式

H(X)表示事件 X 的信息熵, Pi 是事件出现第 i 种状态的概率,在二进制的情况下,对数的底是2,此时信息熵可以作为信息的度量,称为信息量,单位是比特(bit)。 在没有任何先验知识的基础上,人们对明天是否刮风,风力最大是多少是完全未知的,假如风力定义为从0级一直到7级,那么明天刮风这一事件的信息量是多大呢?由于没有先验知识,所以明天刮风出现最大风力为任何一个风力级别的概率是一样的,都是1/8, 根据上述公式可以计算出明天刮风这一事件的信息量是 3bit。为便于计算机处理,可以用3位二进制数来表示,即可用 000,001,010,011,100,101,110,111 来描述明天的刮风事件。当明天没有来临时,刮风事件具有不确定性,这个不确定性定义为信息,而明天刮风事件一旦发生了,这种不确定性就消除了,因此信息还可以理解为消除不确定性的一种度量。

1.1.3 信息的传输模型

信息是有价值的一种客观存在。信息技术主要为解决信息的采集、加工、存储、传 输、处理、计算、转换、表现等问题而不断繁荣发展。信息只有流动起来,才能体现其价值,因此信息的传输技术(通常指通信、网络等)是信息技术的核心。信息的传输模型如图1.1所示。

图1.1 信息传输模型

(1)信源:产生信息的实体,信息产生后,由这个实体向外传播。如 QQ 使用者,他通过键盘录入的文字(如:你好!)是需要传播的信息。
(2)信宿:信息的归宿或接收者,如使用 QQ 的另一方(当然这一方也是信源),他透过电脑屏幕接收 QQ 使用者发送的文字(如:你好!)。
(3)信道:传送信息的通道,如 TCP/IP 网络。信道可以从逻辑上理解为抽象信道,也可以是具有物理意义的实际传送通道。TCP/IP 网络是一个逻辑上的概念,这个网络的物理通道可以是光纤、铜轴电缆、双绞线,也可以是 4G 网络,甚至是卫星或者微波。
(4)编码器:在信息论中是泛指所有变换信号的设备,实际上就是终端机的发送部分。它包括从信源到信道的所有设备,如量化器、压缩编码器、调制器等,使信源输出的信号转换成适于信道传送的信号。在 QQ 应用中,键盘敲击会使键盘的由不确定状态转换为某种确定状态,此时信息产生了,通过一系列的信号采集、加工、转换、编码, 信息最终被封装为 TCP/IP 包,推入 TCP/IP 网络,开始传播之旅。从信息安全的角度出发,编码器还可以包括加密设备,加密设备利用密码学的知识,对编码信息进行加密再编码。
(5)译码器:译码器是编码器的逆变换设备,把信道上送来的信号(原始信息与噪声的叠加)转换成信宿能接收的信号,可包括解调器、译码器、数模转换器等。在上述 QQ 应用中, TCP/IP 包被解析,信息将显示在信宿的计算机屏幕上,发送者传送信息的不确定性消除了。
(6)噪声:噪声可以理解为干扰,干扰可以来自于信息系统分层结构的任何一层,当噪声携带的信息大到一定程度的时候,在信道中传输的信息可以被噪声淹没导致传输失败。

当信源和信宿已给定、信道也已选定后,决定信息系统性能就在于编码器和译码器。设计一个信息系统时,除了选择信道和设计其附属设施外,主要工作也就是设计编、译 码器。 一般情况下,信息系统的主要性能指标是它的有效性和可靠性有效性就是在系统中传送尽可能多的信息;而可靠性是要求信宿收到的信息尽可能地与信源发出的信息一致,或者说失真尽可能小。为了提高可靠性,在信息编码时,可以增加冗余编码,犹如“重要的话说三遍”,恰当的冗余编码可以在信息受到噪声侵扰时被恢复,而过量的冗余编码将降低信道的有效性和信息传输速率。

概括起来,信息系统的基本规律应包括信息的度量、信源特性和信源编码、信道特性和信道编码、检测理论、估计理论以及密码学。

1.1.4 信息的质量属性

信息反映的是事物或者事件确定的状态,具有客观性、普遍性等特点,由于获取信息满足了人们消除不确定性的需求,因此信息具有价值,而价值的大小决定于信息的质量,这就要求信息满足一定的质量属性,包括:

  • 精确性:对事物状态描述的精准程度;
  • 完整性:对事物状态描述的全面程度,完整信息应包括所有重要事实;
  • 可靠性:指信息的来源、采集方法、传输过程是可以信任的,符合预期;
  • 及时性:指获得信息的时刻与事件发生时刻的间隔长短。昨天的天气信息不论怎样精确、完整,对指导明天的穿衣并无帮助,从这个角度出发,这个信息的价值为零;
  • 经济性:指信息获取、传输带来的成本在可以接受的范围之内;
  • 可验证性:指信息的主要质量属性可以被证实或者证伪的程度;
  • 安全性:指在信息的生命周期中,信息可以被非授权访问的可能性,可能性越低,安全性越高;

信息的属性速记:精完可及经验安

--------------本文结束 感谢您的阅读--------------