第八章 信息率失真理论及其应用
8-1 失真函数和平均失真度
8-1-1 失真函数
定义 8.1 对于图示系统, 对应于每一对 , 定义一个非负实值函数 表示信源发出符号 而经信道传输后再现成信道输出符号集合中的 所引起的误差或失真, 称之为 和 之间的失真函数。
失真函数的值可人为规定,一般定义为 时(即 )取 0
失真矩阵
输入符号集 中有 种不同的符号 ; 输出符号集 中有 种不同的符号 ; 失真函数 共有 个具体值, 按 和 的对应关系, 排列 成一个 阶矩阵: 称为信道 的失真矩阵。
汉明失真矩阵(只有主对角线为 0):
把 分类讨论并写出来,再写失真矩阵
8-1-2 平均失真度
定义 8.2:称随机变量 和 的联合概率 对失真函数 进行加权的统计平均值为该通信系统的平均失真度 。
就是加权的失真度
N次扩展信源的情况
将定义8.1进行扩展, 可得 次扩展的信源和信宿符号序列 与 之间的失真函数为
对应的失真矩阵为
平均失真度 为
对无记忆信源和信道有
式中
离散无记忆信源X的N次扩展信源通过无记忆信道传输后的平均失真度是未扩展情况的N倍:
类比扩展信源的信息熵和平均互信息量
8-2 信息率失真函数
8-2-1 保真度准则
定义 8.3 保真度准则 信道每传送一个符号所引起的平均失真,不能超过某一给定的限定值D,即要求 ,称这种对于失真的限制条件为保真度准则。
保真度准则指出,给定的失真限定值D是平均失真度 的上限值
平均失真度取决于如下几个因素
- 信源的统计特性,即
- 信道统计特性,即
- 失真函数,即
8-2-2 失真许可的试验信道
定义 8.4 凡是能满足保真度准则 的信道,称之为D失真许可的试验信道
所有的 D 失真许可的试验信道构成的集合表示为:
感兴趣的是 在同样的保真度准则下,能使信道的信息传输率尽可能小 的试验信道
8-2-3 信息率失真函数
定义 8.5:用给定的失真 为自变量来描述的信息传输速率, 称为信息率失真函数,用 表示
- 信息传输速率 本质上是描述信源输出的信息速率
- 一方面, ,是 的函数,另一方面,信道上的信息传输速率 ,因此,又可以用平均互信息量 来表示
- 是 的凸函数, 故总可以在 集合中找到某 一试验信道, 使 达到最小值 , 故有
信息率失真函数的物理意义
- 信息率失真函数是在 的前提下,信宿必须获得的平均信息量的最小值,是信源必须输出的最小信息率
- 信息传输速率本质上是描述信源特性的,因此R(D)也仅用于描述信源
- 若信源消息经无失真编码后的信息传输速率为R,则在保真度准则下信源编码输出的信息率就是R(D),且
R(D) 与 C
- 信道容量仅与信道有关,是信道的最大传输能力
- 信息率失真函数仅与信源有关,是在给定失真度下,信源至少要给信宿的信息率
N次扩展的信息率失真函数
8-2-4 信息率失真函数的性质
D必须在给定的信源X的概率分布P(X)、信宿Y的概率分布P(Y)和给定的失真函数 条件下所得的平均失真度 D 的最小值 和最大值 之间适当选择
可以求得平均失真度 的最小值, 为
的最小值 就是允许的平均失真度 的最小值, 即
-
当失真矩阵中每行至少有一个零元素时,
-
若某一行没有零元素,则可以让该行所有元素减去该行最小值,这样就有了零元素(毕竟失真度可以自定义)
-
因此,总是可以认为
-
如果失真矩阵每一列至多有一个0,则 对应的试验信道疑义熵 ,即,收到Y以后对X不存在不确定性
-
如果失真矩阵的列有大于1个0,则 对应的试验信道疑义熵 ,即,收到Y以后对X存在不确定性
和
- 是在保真度准则 下平均互信息量 最小值
- 是非负数, 因此 最小值是 0
- 定义最大允许失真度 为使 的最小平均失真度 (平均失真度超过 仍然等于 0 )
- 等价于 , 此时信道的输入随机变量 和 输出随机变量 之间一定统计独立, 即有
R(D)为减函数,D越大,所需要的信息量越少,所以R也越小,直到为0。 就是 R 即便为 0 也满足 D 的要求的那个点
R(D) 函数的凸性
(下凸)
定理 8.1 在定义域内是凸函数, 即对任意 有
R(D)函数的单调递减性
定理 8.2 信息率失真函数R(D)在定义域内是严格单调递减的。
使得平均互信息量最小的试验信道一定在试验集合的边界取到
8-3 信息率失真函数R(D)的计算
8-3-1 几种特殊离散信源的信息率失真函数
Fano不等式 ,式中 是输入符号种数,
扰码器:让输出变为近似等概分布,必须在压缩编码之后(因为等概的时候压缩的概率很低)
8-3-2 离散信源R(D)的参量表述
8-3-3 连续信源的信息率失真函数
连续信源的失真函数一般为
将离散情况中的求和运算改为积分运算
平均失真度:
信息率失真函数:
高斯信源的信息率失真函数
概率密度函数 平方误差失真 利用参量表述结果可得
一般信源的信息率失真函数
均值为 0 , 方差为 的连续信源 , 相对熵为 , 平方 误差失真下的信息率失真函数满足
- 当X为高斯信源时,取到等号
- 在平方误差失真下,相同方差的信源要达到同样平均失真,高斯信源具有最大信息率失真函数,即高斯信源最难压缩
8-4 保真度准则下的信源编码定理
定理 8.3 限失真信源编码定理 或 Shannon第三定理 设 是某离散无记忆信源的信息率失真函数, 并且选定有限的失真函数 。 对于任意允许的平均失真度和任意小的正数 , 以及任意足够长的码字长度 , 则一定存在一种信源编码, 其码字个数为 而编码后码的平均失真度 若码字数为 则一定有
实际上就是
- 也可以将定理8.3作如下的叙述:
- 若R(D)为离散无记忆信源的信息率失真函数,D为允许的失真度,则只要实际的信息率R满足 ,就存在一种编码方法,使其译码的平均失真度 ; 反之,若R < R(D),则无论怎样的编码方法,都不能使
- R(D)是保真度准则下,信源信息率压缩的下限值。无失真信源编码信息率压缩的下限值是信源熵H(X),而
- 若给定信源 ,其信息熵 ,规定了失真函数,选定了允许的失真度 ,即可求得信息率失真函数
- 根据Shannon第三定理,必然存在一种压缩编码方法,使其平均失真度不大于 ,且其输出信息率由 下降到,只要
联合信源信道编码定理(信源信道编码分离定理): 设离散无记忆信道的容量为 比特/秒,离散无记忆信源熵为 比特/秒,则当 时, 则总存在一种编码方案使得译码错误概率任意小;反之,如果 , 则不存在使得译码错误概率任意小的编码方案。