在 asr 自动语音识别领域,基于 ctc 的声学模型不再需要对训练的音频序列和文本序列进行强制对齐,实际上已经初步具备了端到端的声学模型建模能力。但是 ctc 模型进行声学建模存在着两个严重的瓶颈,一是缺乏语言模型建模能力,不能整合语言模型进行联合优化,二是 ctc 有一个不合理的假设:标签相互独立,这个基本假设与语音识别任务之间存在着一定程度的背离,因为在语言系统中存在语境的上下文关系。因此针对 ctc 的不足,transducer 模型可以弥补这种不合理的假设,解决 ctc 的问题。
3 月 9 日,nvidia 企业开发者社区经理李奕澎将面向有 nlp 和 speech ai 开发需求的开发者,在本次研讨会中重点讨论 transducer 模型,并通过代码来训练和评估 transducer 模型。
transducer 模型在自动语音识别中的应用 – nvidia nemo 代码解析
3 月 9 日,星期四,20:00 - 21:30
主要内容:
本次网络研讨会主要面向有 nlp 和 speech ai 开发需求的开发者。通过本次网络研讨会,您可以获得以下信息:
transducer 介绍
transducer loss 的优势和局限
transducer 的模型架构
contextnet 的模型架构
transducer 模型的训练和评估
演讲嘉宾
李奕澎 | nvidia 企业开发者社区经理
拥有多年数据分析建模、人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、语音合成等对话式 ai 技术领域有丰富的实战经验与见解。曾开发法律、金融、保险文档中基于实体抽取的智能问答系统,曾开发基于 nlp 知识抽取,kg 知识图谱的建立的科研文档智能检索系统。
参与方式
识别二维码注册本次研讨会
相关资料
识别二维码了解 nvidia nemo 更多信息
点击 “阅读原文” 或扫描下方海报二维码,即可免费注册 gtc23,在 3 月 24 日 听 openai 联合创始人与 nvidia 创始人的炉边谈话,将由 nvidia 专家主持,配中文讲解和实时答疑,一起看 ai 的现状和未来!
原文标题:研讨会预告 | 使用 transducer 模型优化语音识别结果
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。
vivox20评测:vivo x20首款全面屏新机告别低价高配,四大亮点值得入手
上游供应链告急 手机、电视掀涨价潮
硬核技术突破,华为新款MateBook X Pro定义PC“源创新”
英特尔傲腾持久内存的两种操作模式介绍
教你如何辨别你的触屏是电阻屏还是电容屏
研讨会预告 | 使用 Transducer 模型优化语音识别结果
浪潮最新成立OpenRMC项目,降低了数据中心运维难度
随着智能和边缘处理添加到汽车组件中,模块故障传播的概率更低
金刚石表面改性技术研究概况
HT-卫生间液体穿透性测试仪的技术指标是什么
指令系统实例分析
新型MPS可燃气体传感器简述
全球年产5亿吨电子垃圾 超7成进入中国
RFID智能制造叉车改装具备什么功能
MEMS业务保持强劲增长
魅族pro7最新消息:魅族旗舰新机曝光:搭载骁龙821处理器?是不是魅族pro7?手机系统成亮点
RISC-V究竟有何不同之处?RISC-V的生态现状
百度人工智能战略加速落地 陆奇寻找人工智能盈利模式
MAX8632 PCB布局优化-MAX8632 PCB La
焊锡丝焊接元器件出现的虚焊怎么处理?