多说话人语音融合任务是 tts 语音合成当中的一个子任务,它是指将两个或者多个说话人的声音进行融合,合成出新的语音的过程,而不需要做任何进一步的微调。多说话人语音融合可以通过插值的方式代替预训练模型中原始说话人的语音。说话人语音融合技术可用于在语音合成系统中对语音进行个性化处理和生成具有特定语音特征的语音。同时允许开发者创建无限数量的说话人语音,合成出多样性的语音,可以丰富用于训练自动语音识别(asr)和语音合成(tts)模型的语音数据集,用于模型的训练,进而实现不同的多方言或多情感的语音 ai 的应用。
nvidia nemo 是一个用于构建先进的对话式 ai 模型的开源工具库,它内置集成了自动语音识别(asr)、自然语言处理(nlp)和语音合成(tts)的模型及方法。nemo 可以快速加载先进的预训练模型 “开箱即用”,使用模型的配置文件 “化繁为简”,进而快速完成包括多说话人语音合成在内的各类对话式 ai 子任务。
本次网络研讨会主要是开发人员 nlp 和语音人工智能发展的需求。
多说话人语音融合
nvidia nemo 代码解析
11 月 24 日 20:00 - 21:30
演讲主题
多说话人语音融合的任务介绍
多说话人语音融合的任务的模型
多说话人语音嵌入的提取与合并
使用 nemo 结合模型进行推理
演讲嘉宾
李奕澎 | nvidia 企业开发者社区经理
拥有多年数据分析建模、人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、语音合成等对话式 ai 技术领域有丰富的实战经验与见解。曾开发法律、金融、保险文档中基于实体抽取的智能问答系统,曾开发基于 nlp 知识抽取,kg 知识图谱的建立的科研文档智能检索系统。
参与方式
扫描上方二维码即刻报名
相关资料
了解 nvidia nemo 的更多信息
原文标题:在线研讨会预告 | 多说话人语音融合——nvidia nemo 代码解析
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。
PCB设计之如何去耦
2019OPPO开发者大会企业合作论坛暨企业业务高峰论坛在京举办
专为5G和AI设计的低功耗DDR5 DRAM
工控交换机和工业交换机的区别
蓝牙车载音频流播放器的设计
在线研讨会预告 | 多说话人语音融合——NVIDIA NeMo 代码解析
特斯拉Model S识别失准撞了!!!
兼容NSR20F30NXT5G的小体积肖特基二极管
关于人机交互最佳解决方案——AIUI的分析和应用
中国联通开通了中山市首个5G基站站点终端下载速率超过800Mbps
华为通知将下修 Mate40 出货 砍单幅度达 30%
广汽本田首款纯电动轿车EA6重磅亮相广州车展
艾迈斯半导体发布业内首个安卓系统后置3D dToF解决方案
动力电池行业集中度的提高,掀起了一场席卷产业链的多骨诺米牌效应
Linux驱动技术之一:访问I/O内存
现代汽车与软银集团正式收购波士顿动力
50000台哪吒汽车被百家城市合伙人签约
如何提高太阳能发电的供电效率
科友提前布局:SiC行业下半场是8吋时代
小米6有一个地方超越了三星S8,CES2017骁龙835首发之争!