互联网巨头AI领域混战,语音技术为何成重头戏?

互联网的下半场,多家巨头公司将目光瞄准了人工智能( ai ),更准确的说法是,人工智能领域的语音识别技术。
锤子 m1 手机发布会上,科大讯飞快速精准的语音转换文字功能,让普通大众对语音识别技术有了直观的深刻印象。
今年的云栖大会杭州主会场与其他一些分会场上,阿里云的“小 ai”机器人即时文字传译功能暗示,机器人要来抢同声传译的饭碗了。
无独有偶,第三届世界互联网大会上,搜狗也推出了实时机器翻译产品,这款产品不仅能很快将搜狗 ceo 王小川的演讲转化为文字,而且还做出英文翻译。或许未来,语音识别技术真的会让现场的同声翻译失业。
▲ 搜狗 ceo 王小川展示语音实时翻译技术(source:搜狗手机输入法微博)
11 月 22 日,百度宣布开放四项全新语音技术接口,分别是情感合成、远场方案、唤醒二期技术与长语音方案。百度指出,这些技术有很大的潜力,旨在解决人们使用语音识别技术时普遍感到困扰的问题。
比如远场方案可将语音识别的范围提高至 3 到 5 米,上海肯德基旗舰店的“小度机器人”使用这项技术后,可远距离随时应答。又比如情感合成,它能给合成语音加入情感,从而达到真人发声的效果。
上述互联网巨头们,尽管发力 ai 的侧重点不同,但都极为倚靠语音识别技术,这是因为语音识别是最方便的人机交互方式,是人工智能的重要入口。百度公司首席科学家吴恩达就在语音识别技术取得新突破后,自信对媒体表示,“我们已经站在人工智能的黎明”。
语音识别技术包含两个层面,一是将语音进行文字传译;二是将语音信号转换为命令,从而操控机器人运行。目前来看,语音文字传译方面已经取得了很好的成绩,有的公司语音输入准确率已经达到 97 %的水平,搜狗的语音翻译方面,准确率也已达到 90 %。
接下来,互联网公司需要提高的是语音指令,比如提高机器识别语音的速度,并作出准确的动作等。

基于80C196KD单片机和RS-422A通信实现双路高速数据通信接口卡设计
2019中国“智能+未来”高峰论坛在杭州举行
台积电将于下月试产20nm芯片
升压电路Boost,深入实战拓扑结构、设计要点、原理图与PCB
滴滴女性联盟公布2018年计划推动业务创新
互联网巨头AI领域混战,语音技术为何成重头戏?
国星光电披露2018年半年度业绩快报,净利润同比增长46.84%
干货分享:如何根据企业需求量身定制LED圆形屏?
MAX2667/MAX2669高增益,低噪声放大器(LNA)
智慧警务二维码报警定位系统有什么作用
ADI实验室电路:16位、100kSPS逐次逼近型ADC系统
如何在vivado创建新工程上使用IP集成器创建块设计
为什么要用Rust进行嵌入式开发
不间断电源怎么使用
荣耀V20评测 称得上是科技标杆
长虹电视机通病[2]
小米6与荣耀v9怎样选择?小米6评测:小米6与荣耀v9对比评测
原创华为手机两千五元档的性价比之王,荣耀V9红蓝图赏
针对智能手机开发的移动音频创新技术应用
家庭网络的设计和设置