北京时间11月14日消息,现在我们已经可以将神经网络放在掌中使用。上周,facebook推出一个新工具,叫作“style transfer”,它可以实时为手机视频添加视觉效果。处理之后,视频的风格与《辛普森一家》、凡高画作有些类似,新工具正是利用ai(人工智能)技术才能做到这点,一般来说,ai需要大理服务器才能运行。去年,谷歌为“谷歌翻译”程序引进了神经网络技术,现在facebook已经开发了一个名为 “caffe2go”的深度学习系统,该系统高度浓缩,可以在ios、android移动app上运行。
最近,facebook cto迈克·斯拉洛普夫(mike schroepfer)接受了《新科学人》的采访,他谈到了公司ai技术的发展,ai对沟通的影响,facebook news feed(信息流)受到了ai的影响,vr也受到了ai的影响。
下面是对话全文:
问:要让神经网络在移动设备上运行,需要足够高的效率,如何才能做到呢?
答:神经网络是一系列步骤的结果,在每一个步骤都会处理信息,为下一个步骤提供内容,站在算法角度看,我们拥有一个目标:得到同样的结果,但是要将步骤的数量降到最小。开发更小的模型,生成相似的结果,这就是算法所面临的挑战。
专门针对移动设备优化算法,这是第二部分。即使拥有更小的神经网络模型,如果直接拿过来植入移动手机,效果也不好。我们必须让科学家配对,一些人寻找办法压缩模型,一些人擅长在芯片层面做优化,一些人尝试了许多不同的技术,优化各个部分,让算法在手机上跑得更快,我们要将这些人配对。
问:修改视频,让它变得更像艺术品,这样做的确有趣,我们还能用ai做其它事情吗?
答:看起来似乎只是为了好玩,甚至有些愚蠢,实际不是的,我们之所以关注这一点有一个重要的原因:当你开发一些新东西,延迟会将有趣的东西变成难以处理的东西。因为时间延迟的不同,产品要么有趣,要么有创造力,或者干脆无法使用。
除此之外还有其它一些原因。我们制作了一些演示样本,在样本中,你可以将应用程序与目标侦测结合起来,如果想为视频的前景和背景添加不同的效果,你完全可以做到。
问:facebook训练的神经网络还用在什么地方?
答:用在许多不同的地方。比如用在翻译中,每天用户上传几十亿张图片,我们用神经网络给图片添加题注,如果你的视力有问题,希望图片可以告诉你它是什么,神经网络可以实现。在信息流排序时,我们也用到了神经网络,你看到的故事可能会有成千上万条,但真正阅读的只有10条、20条或者30条,我们要向你展示最好的故事。我们还用神经网络侦测垃圾邮件,如果有人在facebook分享一个链接,这个链接已经失效,我们可以发现,然后删除它。
问:你之前曾经表示,vr将会在社交互动中扮演重要角色。facebook ai能够帮上忙吗?
答:要让vr实用,ai是一门关键技术。在真实世界中,我们需要搞清头部、手的位置,将它们的位置在vr世界中绘制出来,这就涉及到计算机视觉与vr的问题。如果没有它们,系统无法运行。今天我们已经可以实现,但在10年与20年之前,你很难做到。
我们不妨思考一个更深入的问题:如何将真实的替身放进vr世界。举个例子,我们与某个人呆在vr世界,他在笑,我必须侦测到他的笑,vr中的替身也应该笑。当某人讲话时,我们应该分析语言表情,让vr替身的嘴看起来跟真的一样,和真人讲话一样,而不是毫无反应,没有动作。如果在整个过程中vr替身很冷漠,我们就会缺少“存在感”。
从长远来看,未来所有的系统都会建立在智能代理之上,它们就是信息机器人,或者是家中可以交流的东西。将这些功能放在vr环境中再合适不过,因为它们可以为你导航,让你穿过众多的虚拟世界。你可以说:“嗨,带我去火星。”或者说:“带我去看看我的朋友joe。”虚拟代理听到命令就会带你去,不需要点击菜单,不需要移动按钮。对于虚拟助手来说,vr是一个很适合的存在地,只是要实现有些遥远。
问:怎样才能实现这一目标?
答:在ai领域,语音识别的问题已经得到了很好的解决,该技术已经很不错了,但是在ai领域还有一个更大的挑战:提高自然语言理解能力,消除歧义。当我下达命令说:“带我去火星。”到底是什么意思?它是某一款游戏吗?是不是《火星救援》中的拖车?我说的到底是什么意思?对于ai来说这是一个难题。
如果系统很实用,知道我想要的到底是什么,那就显得相当强大,像魔法一样。如果给出的答案是错误的,就会让人很沮丧。正因如此,我们要开发一套系统,让它更实用,否则人们就不想要它。对于ai而言,这是一个问题:开发一套系统,让它可以按人类的方式理解语言。
问:等到某一天如果我们可以将神经网络装进口袋,那时会怎样呢?你能描绘一下吗?
答:有一种资源很宝贵,一但失去无法再获得,它就是时间。日复一日,年复一年,时间不断流逝,再也无法回来。有了ai,我们可以将时间用在自己更关注的事情上。我可以花时间多学3种语言,从而与家人更好沟通;如果有一套系统,它可以自动翻译,我就没有必要学习,我会有更多的时间与家人相处,我也可以将时间利用起来创作音乐,追求个人爱好,或者工作,做什么事情都行。
我有一个希望,让人们不再将时间浪费在无关重要的事情上,因为我们拥有一套系统,它可以照看我们,让我们专注于自己最关心的事情。(编译/虎涛)
DTU心跳包是什么,如何设置
光峰科技云端光影激光文字秀 助力潮州工夫茶飘香世界
水塔自动供水保护电路
PowerVR光线追踪在Unity 5中提供交互式光照贴图编辑
报告感受中国电子信息制造业发展情况如何
Facebook CTO:人工智能对VR发展至关重要
苹果供应商风光背后的故事
关于彩色滤光片(CF)你了解多少?
可编程逻辑控制器(PLC)和主要系统模块的功能
宝能汽车与AeroMobil签署协议 双方合作研发多功能飞行汽车
储能市场也许不是退役锂电池的江湖
投影光源的未来是主流光源LED吗?
5G芯片未来会如何发展和应用
中国电信手机下载业务介绍
福音Type-C分线器定制厂商搞定一切扩展麻烦
华为麦芒8即将开售搭载麒麟710处理器最大支持512GB内存扩展
浪潮帮助中铁工业建设的钢桥梁智能制造示范工厂,建设5G智能车间
TE推出电动汽车充电用电缆
让车灯「说话」,汽车的下一个交互入口?
宏景智驾助力安徽省打造世界级万亿汽车产业集群目标