自动混音技术并不是一项新技术,从上个世纪70年代开始涌现各种类型的自动混音器,以及其中的各种专利到现在转变为dsp设备内的一个功能。自动混音器的形态也正逐渐从一***立的设备到虚拟的编程算法。虽然现在各家的软件算法,并不会公布,但我们可以通过了解自动混音器内的核心技术和原理来更好的理解和使用dsp内的自动混音功能。
一个几十平米的会议室往往需要塞下十几只甚至更多的话筒。音响工程师调试时都会遇到一个现象:一只一只话筒调试到不啸叫,但是开启两只或更多话筒时就莫名其妙的啸叫起来。这也是音响人经常提的一个定律:打开话筒数量增加一倍,系统增益增加3db,即nomg(number of open microphone gain)=10lg(nom)。
自动混音技术
自动根据电平开启或关闭话筒,能够自动平衡因开启话筒数量成倍而增加的系统增益.其实与第一种方式很相似,只不过此时人变成了设备.那此时由于能减少对余量的需求,且话筒采用的是鹅颈话筒的形式,最终出来的声音会比会议系统好很多.但实际上单台的自动混音器其实与会议系统类似,最终也是混音一路到处理设备进行处理。这样的处理形式其实与会议系统一样存在问题。所以我们一般会推荐给客户使用的是带自动混音器功能的dsp设备每只话筒都可以得到相应精准的调试,这样音质最优化,同时某些具备自动混音器直接输出功能,可轻松做到mix-minus,而这一点也是普通自动混音器或会议系统几乎无法实现的。且由于可以结合dsp自身丰富的功能,实现诸多会议系统的功能 如 主席优先,请求发言,摄像跟踪等等。
自动混音器需具2个基本要素:1.何时及如何开启和关闭话筒;2.如何平衡nom增益。从技术上可以分为两类:gating和gainsharing自动混音器。
gating自动混音器顾名思义会有一个门限来控制话筒的开关,声音超过门限则打开话筒,声音低于门限则关闭话筒。那如何来获得最佳的门限(threshold)?
固定阈值:最简单也是最常见的就是采用一个语音触发开关或噪声门,设定一个固定的值,超过这个值则话筒开启,低于则关闭。通常这个值是可以调整的,但无法根据环境噪音自行调整,所以得到的效果往往不尽意。
在很多情况下如果设置的太小,则环境噪音、鼓掌和某些音乐等声音很容易就可以开启话筒。设置的太高则又很容易出现吃字或声音卡壳等现象。当使用噪声门等装置还有另外一个问题就是当全体鼓掌的情况出现时,所有话筒都被打开,系统及其容易产生啸叫。由于固定阈值实现简单,成本低,很多自动混音器和软件化的自动混音器仍旧采用类似的方法来做决策,其最终的效果往往很差。
自适应阈值:由于固定阈值很难得到较好的效果,各家厂商相继推出了自己的自适应阈值电路或算法,可根据环境噪音实时得到新的阈值,最终效果的好坏也各有差异。
那么站在工程师的角度,我们需要了解并知道gating自动混音器有哪些参数可以控制才能很好地去实现它!
last on:last on 可确保即使没有检测到语音,最后发言的那个麦克风将继续保持打开。该功能可确保发言人在断句间隙防止因电平低于阈值时而无法打开话筒,从而避免接着发言时字头丢失的问题。mute:自动混音器整体输出静音。gain:自动混音器整体输出电平增益。hold:hold功能可在发言人停止发言后调整通道保持打开的时间长短。该功能确保发言人在发言时字词句之间的短暂停顿不会导致通道关闭。off gain:断开通道的电平。例如话筒一先打开在讲话中,话筒二打开后讲话,此时话筒二将获得增益,但增益是话筒二讲话电平加上off gain所设置的值。过高的设置值会使没有打开的话筒接收到房间噪音和混响声。过低的设置值会让话筒二无法输出足够的电平。sensitivity:灵敏度控制,当超过通道的适应噪声阈值以上多少就得必须导通该通道。如果增加了该设置的值后,则通道在很安静的噪音下都会轻易导通。根据我的经验,嘈杂的房间比起安静的房间需要一个更低的设置值。因为在安静的房间中,甚至很低电平的声音都会比本底噪声声音高出很多。nom atten:nom衰减推子能影响当更多话筒打开的时候,所有通道被衰减的量值大小。该参数体现了在导通两只麦克风时候的衰减,以及每增加一倍数量的打开麦克风后会增加的额外衰减。例如,设置为3db时,则打开两只话筒则会衰减3db,打开四只时则会衰减6db,打开8只时则会衰减9db。同理,话筒打开数量翻一倍,输出衰减值会增加3db。nom limit:设置了打开麦克风的最大数量。不在auto模式或者已被静音的通道不包含在内。
在了解了每个参数含义之后,实现起来也就简单了很多。 那么唯一的难点还是在自动阈值的获取。
现在的智能家居发展迅速我们的信息被共享,隐私能得到保障?
华为到底有多少核心技术呢?能不能抵抗住美国的封杀和制裁呢?
风电变流器的作用_风电变流器系统构成
N沟道场效应管栅极(G极)电压是否可以大于漏极(D极)电压?
最暖心的测量方法:残余相位噪声测量法
我们为什么要用自动混音技术?
IEEE智慧城市计划 帮助更多城市实现智能化
什么是大数据系统身份认证技术?
wps演示如何内嵌音频?wps内嵌音频方法介绍
基于CPCI总线的脉冲信号检测系统设计
求一种5G语音音频突破ABT的测试方案
破碎机物联网在线监测运维系统解决方案
荣耀畅玩6A和魅蓝E2哪个值得买?种草性价比手机必备功课
智慧高速建设迎来拐点,华为与合作伙伴们共同构建智慧高速解决方案
5G NSA组网要凉?中国移动骁龙X50手机打脸不实炒作
华为荣耀V10明年发布,全面屏+麒麟970,性能强悍价格良心!
中国“制造”变“智造”,紧抓五条切入路径
马斯克对于AI九大预测 AI是最好也最糟糕的发明
铅酸电池龙头骆驼股份2018年年报显示,公司当年实现销售收入92亿元
干燥空气环网柜的原理和特点