随着信息时代的来临,各种数字设备与数字制式逐渐取代传统的模拟设备与模拟制式已是大势所趋。比如视听器材中,CD机淘汰了LP机和模拟磁带录音机,DVD的高音质、高画质更盖过了VHS、8mm等模拟磁带放像机和LD机;
浅谈人的感官特性与信息的数字化
随着信息时代的来临,各种数字设备与数字制式逐渐取代传统的模拟设备与模拟制式已是大势所趋。比如视听器材中,CD机淘汰了LP机和模拟磁带录音机,DVD的高音质、高画质更盖过了VHS、8mm等模拟磁带放像机和LD机;在通讯技术中,GSM、CDMA等数字手机取代了笨拙的模拟“大哥大”,DVB、ATV等数字高清晰度电视也将逐步把现在的模拟电视制式(PAL、NTSC、SECAM)送入历史。显然,数字技术的运用在信息的传输、处理和记录等方面都有模拟技术不可比拟的优越性,它使得人们能轻松地以更低的代价实现信息的高速率、高品质的传播,但从根本意义上说,信息的数字化还与人的感官(主要指视觉和听觉)的生理特性是相适的。
大家都知道,我们身边的环境是一个各种模拟物理量充斥的世界,比如一个温度的变化,一个声音信号的产生持续与消亡,一段赛跑的现场等等,都是一个随时间连续而在时间上无限可分的模拟过程,即任一时刻都有其对应状态或振幅,都有无穷的信息量。而由于人的神经传导有一定的速度(约30米/秒),大脑处理信息也需一定时间等因素导致了人感知外界刺激是一个相对缓慢的过程。我们亦可以这样说,单位时间里人感知的信息量是有限的。由此可见,感官的生理特性决定了人是不可能完全感知一个物体运动变化的绝对过程的。但我们为什么却能在主观上实实在在地感受到这个世界,同样能听到一段乐声,看到一段龟兔赛跑的详细过程呢?原来作为生物的人的耳、目等感官都有趋利性,在感受外界刺激的同时,把对人没有重要意义的“无用”信息都滤除掉了。可见,人的感官就象一个有生命的取样器(SAMPLER),能以一定的频率对外界的模拟刺激“信号”进行采样,只保留和传送其主要特征信息,在这种信息的生理简化基础之上,人们就能感知和认识周围的各种事物了。比如人的视觉暂留特性(约50ms)可以说明为什么电影以25Hz的采样频率就能满足人眼需要了,50Hz、60Hz及更高的电视采样频率只是为了掩盖其单帧取样画面的低清晰度;利用听觉上的掩蔽及哈斯效应,更可对声音进行44.1kHz或更低频率的取样而达到与原信号相近的水平,如PCM、PASC甚至AC-3等编码格式。在此基础之上,如果我们能把目、耳等感官的细节分辨能力与数字技术的量化位数进一步联系起来,以一定的取样频率量化位数来模仿外界刺激信号,是完全能“蒙蔽”我们的感觉器官的。比如,CD以44.1kHz的取样频率,16bit的量化位数,就能满足大多数发烧友的高保真要求了;DVD视频以2×50/60Hz的帧取样频率,10bit量化的亮度、色度信号,同样也给观众带来高画质的享受。综合上述,我们可以认为信息数字化的技术核心是依据人感官的基本生理特征来制定的,人的感官就象各种功能不同的A/D转换器。
让我们继续来看看下面这个例子:在一间有蚊子的房间里,开始时有个人在里面闲耍,他会觉得蚊子特别多,被叮咬的次数多,而且感觉每次咬得也比较痛;后来他找到一本小说,专心致志地读了起来,这时他可能就会觉得蚊子咬的次数少了(即痛觉感官的“取样频率”降低),咬得也不是很痛了(即感官的分辨能力或“量化位数”降低了)。
在这个例子中,可以把人感官基本生理特性与信息的数字化特点作出类比,但我们更应该看到人感官的“取样频率”与“量化位数”(细节分辨力)是受人自身的注意力决定的,即人的目、耳等感官是有掩盖性的。这是因为人瞬间感知的信息量是一个定值,我们不可能同时对视、听、触、痛、味、嗅、体位等各类感觉或同种感觉下的多个目标作出相同程度的关心,而只能以人的意志或主观需要把这些信息“比特”进行按需分配。在这个观点的基础上,我们可以对某些先进数字信息系统的人性化的特点作出解释,如AC-3音频编码的比特流分配系统。AC-3比特流可以按需对前左、前右、中置、后左、后右及重低音通道分配入不同的比特量,而且这个总的AC-3比特流的“流量”大小还会随着听众注意力的变化而变化,即在注意力集中的时候就增大比特“流量”,不注意的时候就减小比特“流量”。可见,AC-3是一种成熟的、智能化的高级数字音频制式,在一定程度上它的编码特点与人的心理、生理听音特性是一致的!事实上,与视听技术的高度保真程度相比,人们对其他感官刺激的模仿还处于一个比较原始的水平,比如近年来兴起的所谓动感影院、香味电影等,只是简单地随剧情画面而摇摇座椅或放出香味,更谈不上体位感、嗅感等的数字化了。
对视听技术而言,我们还可以尽量利用信号的相关性和耳、目的掩盖性,通过数字计算将冗余信息进行压缩,保留主要信息,去掉人们感觉不到的信息,减小传送或存储的容量,比如近年来出现的PASC、ATRAC、AC-3、MP3、MPEG等,都是根据不同的质量要求,采取不同的压缩量(随着心理、生理压缩等算法的深入研究,压缩比仍在不断扩大)。这些数字制式的不断改进,都是朝着“更有效地利用资源”这个终极目标发展的。总之,无论人类的科技如何发达,各种信息的最终受体仍然是人的感官,人们只有通过信息的数字化才能更好地从纷繁复杂的无序世界中提取出有用的信息,总结出各种经验和知识,从而提高人们认识和改造自然界的效率。
本文来自:视听技术网站
网友评论