语言识别技术的工作原理是一个怎样的过程

(文章来源:cda数据分析师)
亚马逊的 alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 python 程序中实现语音识别非常简单。
语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识别系统已经取得了很大进步,可以识别多个讲话者,并且拥有识别多种语言的庞大词汇表。
语音识别的首要部分当然是语音。通过麦克风,语音便从物理声音被转换为电信号,然后通过模数转换器转换为数据。一旦被数字化,就可适用若干种模型,将音频转录为文本。大多数现代语音识别系统都依赖于隐马尔可夫模型(hmm)。其工作原理为:语音信号在非常短的时间尺度上(比如 10 毫秒)可被近似为静止过程,即一个其统计特性不随时间变化的过程。
许多现代语音识别系统会在 hmm 识别之前使用神经网络,通过特征变换和降维的技术来简化语音信号。也可以使用语音活动检测器(vad)将音频信号减少到可能仅包含语音的部分。幸运的是,对于 python 使用者而言,一些语音识别服务可通过 api 在线使用,且其中大部分也提供了 python sdk。


海尔与上汽携手进军智能汽车领域
晶科能源TOPCON电池片产品获颁TUV南德首张电池片LID认证证书
输出过电压保护电路
三星暂时没有2021年开发新版Galaxy Note的计划
agv小车分类
语言识别技术的工作原理是一个怎样的过程
OPPO公布全球首款“瀑布屏”真机 屏幕弯曲度达到88°
大疆遇挑战,无人机王者杀入企业级市场
新一代雅阁动力系统解析
黑莓为Spark平台区块链分类账提供医疗保健服务
机器人送货上门真的能实现了吗
自制24V节能灯,DC24V Ballast
被OpenAI带火的Agent如何解放人力?
IGBT/FRD/MOSFET功率器件模块材料介绍
X-CUBE-AI v7.1.0的三大更新内容
施耐德电气对于智能家居有一些新的思考和战略实践
应用于光源驱动电路的光纤传感器
触摸控制器IC市场发展巨大 五年将增长两倍
关于音频编解码器EVS及用好要做的准备工作详解
小米9 Pro 5G版将于9月24日推出支持三种充电模式