Google推出AI语音合成器_试图从亚马逊和微软手里赢得云业务

google正在推出一款新的ai语音合成器,作为其机器学习云工具套件的一部分。名为云文本到语音的服务将适用于任何需要语音合成的开发人员或企业,无论是应用程序,网站还是虚拟助理。有趣的是,cloud text-to-speech由wavenet提供支持,该公司由谷歌在英国的ai子公司deepmind创建。
自google于2014年收购deepmind以来,一直在探索如何将公司的ai人才变为有形产品。现在,使用deepmind的算法将google数据中心的电力成本降低40%,并且deepmind将投入医疗保健领域。但是,将wavenet直接整合到其云服务中可能更为重要,特别是谷歌试图从亚马逊和微软手里赢得云业务。
其次,deepmind的ai语音合成技术是业内最先进和最现实的技术之一。大多数语音合成器(包括苹果的siri)使用所谓的连接合成,其中程序存储单个音节 - 诸如“ba”,“sht”和“oo”的声音 - 并且将它们一起飞起来形成单词和句子。多年来这种方法已经相当不错了,但它仍然听起来很尴尬。
相比之下,wavenet使用机器学习从头开始生成音频。它实际上分析了一个巨大的人类语音数据库中的波形,并以每秒24,000个样本的速率重新创建它们。最终的结果包括唇音和口音等微妙的声音。wavenet于去年10月首次被整合到google智能助理中(尽管只有日语和英语版本),现在可用于cloud text-to-speech中的精选语音。谷歌表示,这项新服务提供32种不同的语音,可以说12种语言,用户可以自定义音调和速度等因素。

自制简易地震报警装置,Earthquake Alarm
电位计完全指南
新型第二代AMD EPYC处理器重新定义数据库、商用HPC和超融合工作负载的性能
威尔电器4G智能执法记录仪的详细介绍
易灵思推Trion Titanium FPGA,采用 “Quantum™ 计算架构”
Google推出AI语音合成器_试图从亚马逊和微软手里赢得云业务
调查发现HPC和人工智能正在逐渐的改变世界
LED开关电源PCB板设计的七步
modbusrtu报文格式详细介绍
一飞智控携新一代集群表演无人机--新型敏捷蜂II型亮相高交会
太赫兹技术:癌症成像的新视角
朗骏智能JL-2系列之JL-224B旋锁式电子式光控开关
川崎机器人已在个个物流上获得大量应用
分析五种Boot自更新方式的优缺点
什么是AI边缘计算,AI边缘计算的特点和优势介绍
物联网核心设计关键之通信协议
当语音无法哄骗AI 声音才能真正展开羽翼
官宣!致钛科技将发布SSD新品,配备长江存储3D闪存
通过STM32的C8t6获取DHT11的温湿度数据
从财务数据看碳酸锂行业竞争格局