声音编码技术

声音编码技术
1.g.721 adpcm编码器
adpcm 是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种波形编码技术。
ccitt 为此制定了 g.721 推荐标准 , 这个标准叫做 32kb/s 自适应差分脉冲differential pulse code modulation to 24and 40kb/s for digital circuit multiplication equipment application , 使用该标准的编码器的数据率可降低到 40kb/s 和24kb/s 。
ccitt 推荐的 g.721 adpcm 标准是一个代码转换系统。它使用 adpcm 转换技术 , 实现 64kb/s a 律或μ律 pcm 速率和 32kb/s 速率之间的相互转换。
2.子带编码 (sbc)
子带编码主要过程是:
①使用一组带通滤波器 (band-pass filter ,bpf) 把输入音频信号的频带分成若干个连续的频段 , 每个频段称为子带。
②对每个子带中的音频信号采用单独的编码方案去编码。
③在信道上传送时 , 将每个子带的代码复合起来。
④在接收端译码时 , 将每个子带的代码单独译码 , 然后把它们组合起来 , 还原成原来的音频信号。
采用对每个子带分别编码的好处:
·第一.对每个子带信号分别进行自适应控制,量化阶(quantization step) 的大小可以按照每个子带的能量电平加以调节。具有较高能量电平的子带用大的量化阶去量化 , 以减少总的量化噪声。
·第二,可根据每个子带信号在感觉上的重要性 , 对每个子带分配不同的位数 , 用来表示每个样本值。例如 ,在低频子带中,为了保护音调和共振峰的结构,就要求较小的量化阶、较多的量化级数, 即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数。
3.子带-自适应差分脉冲编码调制(sb-adpcm)
采样率为 8khz 、 8 位 / 样本、数据率为 64kb/s 的 g.711 标准是 ccitt 为话音信号频率为 (300~3400)hz制定的编译码标准, 这属于窄带音频信号编码。现代的话音编码技术已经可以减少数据率 ,而又不至于显著降低音质。 ccitt 推荐的 8khz 采样率、 4 位 / 样本、 32kb/s 的 g.721 标准, 以及 g.721 的扩充标准 g.723, 都说明了话音压缩编码技术的进展。
g.722 是 ccitt 推荐的音频信号编码译码标准。该标准是描述音频信号带宽为 7khz、数据率为 64kb/s 的编译码原理、算法和计算细节。
g.722 的主要目标是保持 64kb/s 的数据率 , 而音频信号的质量要明显高于 g.711 的质量。 g.722 标准把音频信号采样频率由 8khz 提高到 16khz, 是 g.711pcm 采样率的 2 倍 , 因而要被编码的信号频率由原来的 3.4khz 扩展到 7khz 。这就使音频信号的质量有很大改善 , 由数字电话的话音质量提高到调幅 (am) 无线电广播的质量。对话音信号质量来说 , 提高采样率并无多大改善 , 但对音乐一类信号来说 , 其质量却有很大提高。
g.722编译码系统采用自带自适应差分脉冲编码调制技术,把频带分成两个等带宽的子代分别是高频子带和低频子带。在每个等带宽的子带中的信号都用adpcm进行编码。
4.g.722 sb-adpcm编译码器
为了适应可视电话会议日益增长的迫切需要 ,1988年citt 为此制定了g.722 推荐标准, 叫做 数据率为 64kb/s 的 7khz 声音信号编码—— 7khz audio-coding with 64kb/s。这个标准把话音信号的质量由电话质量提高到am 无线电广播质量, 而其数据传输率仍保持为 64kb/s 。
宽带话音是指带宽在 (50~7000)hz的话音 , 这种话音在可懂度和自然度方面都比带宽为 (300~3400)hz 的话音有明显的提高, 也更容易识别对方的说话人。
5.线性预测编码(lpc)
线性预测编码是一种非常重要的编码方法。从原理上讲,lpc 是通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端使用 lpc 分析得到的参数 , 通过话音合成器重构话音。
合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型 。时变线性滤波器既当作预测器使用 , 又当作合成器使用。分析话音波形时, 主要是当作预测器使用。随着话音波形的变化,周期性地使模型地参数和激励条件适合新的要求。

机器人坐标系用法和算法原理
5G为智能生活带来什么新体验?
传统工厂不再使用蓝牙LoRa而选择使用星斗1号之原因详解
英国的AI芯片制造商Graphcore已经筹集了2.22亿美元的E轮新资金
Ambarella推出人工智能图像信号处理器 瑞萨电子打造物联网安全方案
声音编码技术
华为闪存门续:官方称未发现虚假宣传 任正非表态华为不搬离深圳
nginx使用学习之正、反向代理
AMD推出了Ryzen二代处理器产品,和一代相比性能有了进一步的提升
80V浪涌吸收器原理设计
铜端子如何安装,它的安装要求有哪些
人工智能新时代,信息源可靠成关键
一次分页慢查询导致的事故处理过程
中国电信首发5G云手机,一套硬件变两台手机!5G云手机会成为潮流吗?
智能制造装备商耐科装备IPO上市首发获通过 业绩增长稳定
深度解读镓、锗市场
基于双12位DAC的高精度直流电压/电流源设计
继电器的过流过压保护
mybatis是什么_MyBatis的优缺点详解_mybatis框架入门详解
沐渥科技|嵌入式开发未来何去何从?从这几个细节可获悉一二