1. 首页 > 星座常识 > 文章页面

预测编码的基本方法是什么(预测编码的基本方法是什么意思)

200710063819.2 帧间预测编码的模式快速选择方法

各位老铁们好,相信很多人对预测编码的基本方法是什么都不是特别的了解,因此呢,今天就来为大家分享下关于预测编码的基本方法是什么以及数字预测算法的问题知识,还望可以帮助大家,解决大家的一些困惑,下面一起来看看吧!

本文目录

预测随机数的最佳方法预测编码的基本方法是什么预测随机数的最佳方法

均匀分布的随机数可以产生任意分布的随机数。主要的方法有反函数法,舍选法,离散逼近法,极限近似法和随机变量函数法等

预测编码的基本方法是什么学界 DeepMind提出对比预测编码,通过预测未来学习高级表征

预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。

脉冲编码调制(PCM,pulse code modulation)是概念上最简单、理论上最完善的编码系统。它是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。

PCM的编码原理比较直观和简单,如(1)所示。它的输入是模拟信号,首先经过时间采样,然后对每一样值都进行量化,作为数字信号的输出,即PCM样本序列x(0),x(1),…,x(n)。图中的“量化,编码”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。

折叠量化

量化有多种方法。最简单的是只应用于数值,称为标量量化,另一种是对矢量(又称为向量)量化。标量量化可归纳成两类:一类称为均匀量化,另一类称为非均匀量化。理论上,标量量化也是矢量量化的一种特殊形式。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法。

折叠标量量化

均匀量化

如果采用相等的量化间隔处理采样得到的信号值,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如(2)所示。量化后的样本值Y和原始值X的差 E=Y-X称为量化误差或量化噪声。

非均匀量化

用均匀量化方法量化输入信号时,无论对大的输入信号还是小的输入信号一律都采用相同的量化间隔。为了适应幅度大的输入信号,同时又要满足精度要求,就需要增加量化间隔,这将导致增加样本的位数。但是,有些信号(例如话音信号),大信号出现的机会并不多,增加的样本位数就没有充分利用。为了克服这个不足,就出现了非均匀量化的方法,这种方法也叫做非线性量化。

非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数来表示。量化数据还原时,采用相同的规则。

在语音信号的非线性量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为m律压扩(m-law companding)算法,另一种称为A律(A-law)压扩算法。

1.m律压扩

G.711标准建议的m律压扩主要用在北美和日本等地区的数字电话通信中,按下面的式子(归一化)确定量化输入和输出的关系:

式中:x为输入信号幅度,规格化成-1≤</SPAN> x≤ 1;

sgn(x)为x的极性,x<0时为-1,否则为1;

m为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100≤ m≤ 500,多取 m=255。

由于m律压扩的输入和输出关系是对数关系,所以这种编码又称为对数PCM。具体计算时,用m=255,可以把对数曲线变成8条折线以简化计算过程。

2.A律压扩

G.711标准建议的A律压扩主要用在中国大陆和欧洲等地区的数字电话通信中,按下面的式子确定量化输入和输出的关系:

0≤| x|≤ 1/A

1/A<|x|≤ 1

式中:x为输入信号幅度,规格化成-1≤</SPAN> x≤ 1;

sgn(x)为x的极性,x<0时为-1,否则为1;

A为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,通常取A=87.6。

A律压扩的前一部分是线性的,其余部分与m律压扩相同。A律压扩具有与m律压扩相同的基本性能(在大信号区信噪比高于m律量化器,但在小信号区不如m律量化器)和实现方面的优点,尤其是还可以用直线段很好地近似,以便于直接压扩或数字压扩,并易于与线性编码格式相互转换。具体计算时,A=87.56,为简化计算,同样把对数曲线部分变成13条折线。

对于采样频率为8 kHz,样本精度为13比特、14比特或者16比特的输入信号,使用m率压扩编码或者使用A率压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64 kbps。这个数据就是CCITT推荐的G.711标准:话音频率脉冲编码调制(Pulse Code Modulation(PCM) of Voice Frequencies)。通常的听觉主观感觉认为8位压扩量化有不低于12位均匀量化A/D的信噪比及动态范围。

折叠

关于本次预测编码的基本方法是什么和数字预测算法的问题分享到这里就结束了,如果解决了您的问题,我们非常高兴。

Deep Learning Based Video Coding A Review and A Case Study

联系我们

Q Q:

微信号:

工作日:9:30-18:30,节假日休息

微信