昇腾910和含光800性能对比

有网友问昇腾910和含光800性能对比;华为推出的昇腾910性能强大,而含光800则是阿里巴巴发布的含光800ai芯片。
2019年9月25日,阿里巴巴发布含光800ai芯片;含光800是高性能的ai推理芯片。该芯片推理性能达到78563 ips,能效比500 ips/w。
含光800ai芯片基于risc-v和阿里自有算法,含光800芯片性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对cnn及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗npu上完成计算。
含光800ai芯片相比传统gpu算力,性价比提升100%。根据云栖大会的现场演示结果显示,比如拍立淘商品库每天新增10亿商品图片,使用传统gpu算力识别需要1小时,使用含光800后可缩减至5分钟。
据阿里介绍含光npu采用tsmc 12nm工艺制程,可提供全球最高单芯片ai推理性能。 在hgai模型的推理应用中,含光npu每秒钟可处理高达78000 ips的图片,是同类处理器的数十倍性能。
目前含光800目前已被应用到阿里巴巴旗下的的多个业务场景,比如图像视频分析、城市大脑、搜索优化等等。
2019年8月23日,华为发布ai芯片ascend 910(昇腾910)。
据华为官方介绍,昇腾910ai处理器,基于自研华为达芬奇架构3d cube技术,实现业界最佳ai性能与能效,架构灵活伸缩,支持云边端全栈全场景应用。
除了基于达芬奇架构的ai核外,昇腾910还集成了多个cpu、dvpp和任务调度器(task scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。
昇腾910集成了hccs、pcie 4.0和roce v2接口,为构建横向扩展(scale out)和纵向扩展(scale up)系统提供了灵活高效的方法。hccs是华为自研的高速互联接口,片内roce可用于节点间直接互联。最新的pcie 4.0的吞吐量比上一代提升一倍。
昇腾910算力是国际顶尖ai芯片的2倍,相当50个当前最新最强的cpu;其训练速度,也比当前最新最强的芯片提升了50%-100%。同时华为还发布了配套的新一代ai开源计算框架mindspore。两者搭配性能最大化利用芯片算力。
新一代的ai开源计算框架mindspore创新编程范式,使得工程师更容易使用;该计算框架可满足终端、边缘计算、云全场景需求,能更好保护数据隐私;可开源,形成广阔应用生态。
昇腾910半精度(fp16)算力达256 tflops。(还有一个说法是昇腾910的半精度(fp16)算力达到320 tflops);而整数精度(int8)算力达到 640 tops,(还有一个说法是整数精度(int8)算力达到512 tera-ops;小编认为一个数值可能是设计参数值,一个可能是极值)功耗 310w,采用 7nm 先进工艺。此外,昇腾 910 集成了 hccs、pcie 4.0 和 roce v2 接口,为构建横向扩展 (scale out)和纵向扩展(scale up)系统提供了灵活高效的方法。
比如华为的atlas 900 ai训练集群,算力达到了256 pflops。要实现这样的算力,如果采用通用cpu需要6195个机柜,用gpu需要208个机柜,而npu如昇腾只要128个机柜,这归功于昇腾架构对深度学习业务的优化。而且最终,华为只用了16个机柜来实现。
此外,昇腾910为国产ai芯片助力,华为盘古大模型从算力(昇腾算力,昇腾的底层架构也是华为自创的)、芯片使能、ai框架(mindspore ai计算框架)到ai平台(ai开发生产线modelarts)实现了全栈自主创新。

天文学家利用人工智能收集的数据发现两个隐藏的刨床
小米6或在延期,大屏版5.7寸屏,蔡司双摄,或取消Home键
Android内存管理机制与分析工具
逐点比较法
华为智能手机应选择什么样的快充便携充电宝?
昇腾910和含光800性能对比
交换机与路由器二三层转发原理
直布罗陀金融服务委员会计划为区块链企业创建一个新的许可证制度
膏状导热硅脂可提升电子元器件的散热效果
三星2018款QLED量子点电视获不烧屏认证,图像质量和损耗测试满分
Mouser备货Analog Devices ADSP-CM40x 240MHz混合信号开发板
超声波采集技术 指纹采集技术
QorIQ Layerscape技术易于软件移植和使用
剩余电流动作继电器在电动伸缩门的应用
“可交互空中成像”技术车内应用详解
同茂线性马达分享新闻之澳洲将拍卖机器人打造的建筑
什么是DTC快照信息
放大电路的基础—单级放大器(2)
汽车电子EMI诊断系统-传导发射诊断系统
关于Python巧妙而强大的内置函数