在视频应用的新领域,CPU和FPGA或将胜过GPU

(文章来源:翔snowman)
在视频行业繁荣发展的背后,离不开互联网技术的日新月异。其中,视频行业的创新更是其中的佼佼者:从商业模式上看,在短短几年中视频喊个也就进行了三次迭代——搜狐视频、优酷为代表的点播平台;’花椒、斗鱼为代表的直播平台;快手、抖音为代表的短视频平台。从内容上看,从网剧的日渐精良、到网络综艺的“奇葩”纷呈,甚至是用户原创内容ugc的全民火爆,视频行业大有取代传统娱乐的发展之势。
前端应用的精彩纷呈,体现的是业务的变化,也导致了视频行业对数据中心底层技术需求的变化。这种变化与云、大数据和ai的发展息息相关——工作负载的多样化,云原生应用模型的兴起都让数据中心从统一平台向着多样化平台转变。
第一批进入视频行业的搜狐视频,经历过天价购买国外头部网剧版权的时代,如今将更多精力放在自制网剧的精良制作上,其中“法医秦明”,“无心法师”等口碑与流量俱佳的网剧作品奠定了搜狐视频的业界地位。
随着视频行业逐渐进入全平台、全媒体化后,视频行业在数据中心的底层技术上不要不断投入,更要求快速创新。这也促使搜狐和英特尔早在2011年就创建了联合实验室,英特尔最新技术会早于上市之前数月就率先引入搜狐;搜狐也会将新的业务场景迁移到英特尔的最新技术和产品,以新场景+新技术的方式确保视频用户的视听体验。
值得一提的是,云转码是搜狐视频的强项,可以实现实时转码,即用户在上传的时候就已经实现转码,上传完成时转码也基本完成,可以立即分发。此外,一键实现添加滤镜,人脸识别,也是ai提升用户体验的用武之地。
此外,搜狐视频和英特尔展开了多项联合创新,除了硬件在软件和人工智能等方面也一同合作,比如搜狐视频与英特尔在软件定义存储的性能优化、语音识别应用和推荐系统的加速与优化、dpdk网络负载均衡加速等方面也有很多探索,这对加速搜狐视频在深度学习领域的应用发挥了重要的作用。
大数据和ai融入工作负载已经是大势所趋,它们在最火爆的短视频领域应用更是如火如荼。快手的 崛起首先让业界看到了视频行业还可以迅速切分出短视频这个潜力巨大的细分领域。
诞生于2013年7月,彼时4g网络和智能手机开始普及,快手也算自带科技基因。在后续的发展中,快手逐步证明自己“应科技而生”——使用包括大数据、机器学习、深度学习等技术用机器代替人力完成内容审核,并在内容生产、理解、分发、消费、互动等业务闭环的各个环节优化用户体验。
如果你是短视频app深度用户,“娃娃脸”模板你肯定玩过。别小看这么一个看似简单快捷的功能,它实际上是在移动端实时实现的gan技术,类似于iphone手机上的emoji功能。最大的不同是只有在iphone x以上的机型才能实现的emoji功能,到了快手这里,哪怕用户使用的是一千元以下的机型依旧可以变换自如。
现在,快手数据总量超过eb级,每天的请求数超过2亿,已经俨然成为一家ai+大数据驱动的公司。它对数据中心在存储、网络、计算三个方面的需求很明确:日均新增超过1500万个短视频,带来内容数据、行为数据以及随之而来的要对数据进行特征提取对存储的挑战;在训练和推理中因为特征参数越来越多,深度学习模型越来越深,模型越来越大,对传输网络带来挑战;千亿级的展示给计算和内存带来挑战。
这也使得快手成为第一批采用cpu+fpga异构计算的企业。与gpu相比,fpga因低功耗、低延迟、高性能、可编程等特点,已成为线上ai推理平台的重要选项;而gpu并不擅长推理应用场景,而被广泛应用在ai训练平台。此外,fpga相对gpu还有一个独特的优势——具备网卡口,这也源于它最早应用在通信领域。而针对fpga相对劣势——软件开发难,英特尔推出了opencl的开发语言,从而降低了开发难度和开发周期。
为此,快手基于英特尔fpga提供的pac a10、e3s10和pac s10板卡,已经构建出了三大类型的异构计算平台,并将在数据中心部署fpga的创新应用归结为既要“上天”,又要“入地”。
“上天”指的是fpga是部署在云上的,首要问题是需要在数据中心找到合适的业务场景,能够提供有价值的解决方案,它需有一定的通用性和规模化。具体体现为提高业务的服务容量,这需要充分利用fpga的优势之一:确定性的低延时,来降低线上服务的延时。另外也需要采用一些高层次的开发语言(如opencl,甚至openvino这种推理应用框架)来加速硬件交付,以匹配软件开发的速度。
此外,在数据处理方面,为了优化视频检索的时间,提升高并发下的检索效率,快手抛弃了受限于内存价格和单台服务器上内存容量的kv数据库,转投英特尔傲腾数据中心级持久内存构建了异构存储,在redis和推荐系统中都所有应用。通过实践,快手发现在满足业务性能需求的前提下,用傲腾持久内存代替dram内存,使得快手该存储系统整体tco大幅降低,ai算法效率大幅提升。
从搜狐视频和快手的最新实践中可以发现,它们在创新应用场景下都大量采用了cpu和fpga技术,虽然gpu因为ai的兴起成为第一批异构计算的受益者,但是fpga真正崛起,而cpu也随着新一代技术的更新向多元化应用进一步拓展。


2020年11月我国HEV乘用车销量合计约为4.4万辆,同比增长54%
关于芯片量产工程师需要掌握的知识概览
如何利用树莓派zero实现AirPlay扬声器的设计
曝E3 2020已决定取消 或采取线上直播形式
AT32讲堂046 | 雅特力AT32 MCU USB设备库的架构和使用方法
在视频应用的新领域,CPU和FPGA或将胜过GPU
业内首个小程序AR导航上线
消防器材的管理怎样利用好rfid技术
笔记本电脑散热器DIY图解
高瓴资本已占美的,再瞄格力;厚朴投资携“联合体”进击
iPhone8全新设计,售价达6900元
智能制造发展过程中仍需破除的一系列难题
浅析DCDC电路设计技巧和调制方式
模式识别技术有哪些_模式识别技术的应用
pcb中的泪滴指的是什么 pcb泪滴怎么设计出来的
华为是5G电信设备领域的领导者美国限制华为只会伤害美国的利益
升级ios10.3正式版后出现商店乱码怎么办?苹果神速放出ios10.3.3测试版,值得更新吗?
华为P40系列原型机曝光 配备潜望式长焦镜头并拥有一颗超广角镜头
集成无线收发器和 8 位 RISC MCU 的 SOC 芯片CI2454/CI2451参数-遥控玩具汽车方案
摄像头凸透镜成像原理 摄像的原理是小孔成像吗