“小度小度,拉开窗帘。小度小度,空调调到24摄氏度。“在青岛市北区的一家盲人按摩店里,按摩师熟练地发出一连串的语音指令,店里的窗帘、空调等设备准确无误地完成了上述动作;而在位于上海佘山脚下的世茂洲际酒店里,来宾只需轻唤一声小度,即可与ai互动,享受客房内的智能酒店体验。无论是老百姓身边的盲人按摩店还是高大上的五星酒店里,都充满了浓浓的科技感,这项技术其实是百度的语音识别。
语音识别,通常称为自动语音识别,主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,是人机自然交互技术中的关键环节。截至20世纪90年代,语音识别系统的速度都太慢,无法开发有用的应用程序。追溯到2009年之前70年左右的漫长岁月里,中国在语音识别技术上大多处于边缘角色,直到百度、科大讯飞等中国企业的崛起。2017年,google宣称语音识别准确率达到95%,而早在2016年百度世界大会上,李彦宏就宣布了百度语音识别准确率达到97%的消息,超过人对语音的识别能力。
众所周知,百度多年来一直深耕语音技术,语音识别能力越来越成熟。2013年,百度的语音识别技术还主要基于mel-bank的子带cnn模型,2014年就独立发展出了sequence discriminative training(区分度模型)。此后,一路推出基于lstm –hmm的语音识别、deep peak 2模型,并于2019年发布了流式多级的截断注意力模型。而在不久前结束的ai开发者大会上,百度还推出了针对远场语音交互的鸿鹄芯片,能够实现远场阵列信号实时处理,高精度超低误报语音唤醒以及离线语音识别。
语音专利方面,2015年就开放了上百项智能语音专利,与海尔、京东、中兴通讯、中国普天等组建了智能语音知识产权产业联盟,同时paddlepaddle、warp-ctc、百度大脑的开放和开源,对中文语音识别有着潜移默化的影响,成为了中国语音识别领域标准的制定者。2018年公布的第二十届中国专利评审结果中,百度的语音、机器翻译、无人车相关三项专利获奖,成为人工智能领域至今为止在国内专利界获得的最高级别政府奖项。其中“语音专利”涉及的新语音识别模型——采用深度学习算法在24时内对数以百亿级的大规模数据进行实时分析,高性能计算,令语音识别技术的准确率达97%,解决了语音识别领域关键性、共性的技术难题,被mit 评为“2016年全球十大突破技术”。2017年,百度将技术赋能到硬件产品,小度智能音箱应运而生。如今,身为国内智能音箱行业的先驱者,小度的技术始终走在行业前端。今年百度ai开发者大会上重磅发布的小度助手5.0,上线了全球领先的全双工免唤醒功能,能够识别出用户说的话是不是给它的指令,过滤掉无效干扰信息再做出反应。
正如百度创始人、董事长兼首席执行官李彦宏在今年重庆智博会上所说的:“以前大家比较喜欢传人工智能又战胜了世界围棋冠军,今天我们更关注人工智能给人们的生活带来了什么便利,给工作提升了多少效率。人工智能从酷炫的效果变成了一个社会的共识,变成了一个国家战略,要扎实地去推进人工智能在各个产业领域的渗透,帮助各个领域、各个行业提升效率,提升人们的感受。”
在国内,小度推出第一款带屏智能音箱小度在家。随后,小度在家系列产品不断增加,小度在家1s成为该系列的“明星产品”。小度在家系列不仅开创了国内带屏智能音箱的行业先河,还作为小度涨势迅猛的重要产品线,驱动小度快速完成“后来者居上”的反超。最近,全球知名市场调研公司canalys发布了2019年第二季度全球智能音箱出货量报告。小度在延续q1的高增长趋势下,q2出货量高达450万台,不仅蝉联国内市场第一,更是首次超越了谷歌的430万台,跃升全球第二。据canalys分析师介绍,百度在其q2的智能音箱出货量中,带屏音箱的比例高达45%。
在canalys 发布的数据报告之前,百度公司发布了第二季度财报,从财报中披露的数据中,也可见小度生态成长的迅猛速度:截至今年6 月,搭载小度助手的激活设备数累计超过4 亿台,同比增长4.5 倍,语音交互次数超36 亿次,同比增长7.5 倍。。
李彦宏认为,ai的价值在于如何更好地服务人,而小度就是一个很好的例证:“智能音箱本质上是一个人工智能助理。人的身上是没有屏幕的,所以智能音箱作为智能助理的载体,它的发展方向并不是长得越来越像人,而是越来越能够帮助人、服务人。”
三星开启人工智能新篇章,与AI半导体初创公司合作研发芯片
PLC编程中开关量输入/输出单元的选择方法
你知道区块链的用途有哪些吗
QFN封装工艺讲解
直播预告 |工业照明如何在红利政策支持下,更低成本实现节能低碳?
小度在家1S成为该系列的“明星产品”
对于配电网络中的电源系统,如何提高48V的配电性能
益莱储助您迈向5G商用之旅,5G测试你需要了解的5件事
转速传感器正弦波、锯齿波脉冲信号 隔离变送器
美国军方展示特供版HoloLens 2系统——IVAS
人工智能要以人为本智能向善
axure利用中继器对表格的增删改操作
氧气传感器在隧道中的应用
影像能力地表超强,华为P50系列正式发布,京东火爆预售中
Morpho为Tensilica便携客户提供图像处理支持
认识碱性电池
诺基亚内置经典《贪吃蛇》游戏与外放的FM收音机
请问stdout和stderr有哪些区别呢?
车载摄像头能做监控吗_车载摄像头可以全车监控吗
TE Connectivity 公布2017财年第二季度财报