双11阿里云人工智能ET魔术表演解密:“超能力”口译+语音视频识别

作为双11背后庞大系统的大脑,忙碌的阿里云人工智能et还抽空表演了一个神奇的魔术。
11月10日晚,“天猫双11狂欢夜”在深圳大运中心拉开巨幕。除了汇聚全球半个娱乐圈的明星外,还有一位拥有“超能力”的神秘嘉宾登场——阿里云人工智能et。在全球上亿观众的见证下,et隔空计算出5人手中的扑克牌,震惊全场。
在狂欢夜的压轴环节中,et一出场便秀出强悍的语音识别和交互能力,与主持人华少神同步。众所周知,华少凭借400字/分钟的语速被誉为“中国好舌头”。et竟然可以实时将华少的现场口播翻译成文字,投在电视机屏幕上,达到极高的准确率。好玩的是,一旦出现错误,et还会结合上下文语境进行毫秒级修正。
不但能听懂华少的问题,et还能通过现场观察和思考,模仿人类的声音回答问题。
华少发出挑战:从32张扑克牌中抽出5张,et你能不能猜出是什么?随后主持人邀请五位现场观众上台,并依次切牌打乱顺序后抽出5张。et能算出他们手中的牌吗?
et略略沉思,提了一个小要求,请抽到黑色牌面的观众转身。通过机器视觉识别出转身观众后,et瞬间计算出答案:梅花a……五个居然全中!et的神奇表现让主持人大吃一惊,“实在是太,不,可,思,议了!”
理论上32张扑克牌分到5人手里要全部猜对的概率是2400万分之一。et究竟是如何做到的呢?
“这是一个经典的魔术,不过这次是由人工智能魔术师来表演。32张扑克牌以de bruijn 序列排列,五人洗牌之后,实际上排列可能减少到32种,et将转身观众(黑牌)记作1红牌观众记为0。进一步从32种可能性中算出最终的唯一排列”,阿里云人工智能科学家初敏说,通常这个魔术非常考验魔术师的记忆和推算能力。对et来说,这些都不是难题。
难的是整个过程中需要et要具备高精确度、高实时性的视频识别能力,并用人类的语言和主持人沟通交流。“因直播环境受到场地、灯光、音效的影响,语音识别、视频识别都会受到很大考验”,初敏说。
据了解,无论是语音识别还是图像识别,底层都依赖于深度学习算法以及大规模计算能力。一套复杂算法模型的训练往往需要千亿级别的样本数据,这就对背后的计算能力提出了很高的要求。
et代表的是阿里云语音识别、语音合成、自然语言理解、实时图像识别、机器学习的综合技术,背后是阿里云飞天操作系统强大的计算能力。
值得注意的是,这并非et第一次登上舞台。在今年4月份湖南卫视《我是歌手》的决赛中,et在直播现场成功预测了李玟夺冠。而在其他领域,et已经开始担任法庭书记员、超级交通警察、影视投资经理、客服等角色。

阿里达摩院将GaN列为科技趋势之首 我们来介绍一下晶能光电
友达成功开发可挠式电子纸显示技术
技术资讯 I 通过方程了解瞬时功率
超级电池助推器MFJ-4416C概述
一阶电路的零状态响应
双11阿里云人工智能ET魔术表演解密:“超能力”口译+语音视频识别
面试官谈软件工程师面试技巧
HDB-E手持式变压器变比组别测试仪操作使用说明
投资3.7亿!赣州于都将打造新型智慧城市,拓展智慧交通、智慧路灯、智慧社区等版块
MAX2721直接频率变换上变频器
CPU参数、主板设置里的内存频率有啥区别
小编科普一下ESP8266 MTDI引脚是什么东西
Waymo扩大测试范围 专注于推出自动驾驶出租车服务
数码相机电源使用时间
土壤紧实度仪有哪些功能,它能起到什么作用
OpenAI欲建芯片工厂网络
TI NFC解决方案助力简化物联网无线设置
传导EMI问题为何都是由共模噪声引起
上海开发了MCS-51的单片机开发系统
凌力尔特的SmartMesh IP无线传感器网络扩展至可应对具数千个节点的工业 IoT 网络