nvidia tensorrt 8 概述
nvidia tensorrt 是一个高性能推理平台,对于利用 nvidia tensor core gpu 的强大功能至关重要。tensorrt 8 是一个软件开发套件,其增强功能旨在提高性能和准确性,以应对在边缘和嵌入式设备中发生的越来越多的 ai 推理。它允许对 tensorflow 和 pytorch 神经网络进行广泛的计算推理。
与纯 cpu 平台相比,tensorrt 可提供高达 40 倍的吞吐量,同时最大限度地减少延迟。它允许您从任何框架开始,并在生产中快速优化、验证和部署经过训练的神经网络。
新版本在 nvidia ampere gpu 上加入了稀疏性,可以修剪对网络整体计算没有贡献的弱连接。此外,tensorrt 8 支持变压器优化和 bert-large。transformer 优化提高了性能,而量化感知训练提高了准确性。
nvidia 的 tensorrt 8 有哪些新功能?
推理的目的是从训练阶段尽可能多地保留准确性。训练后的模型可以在硬件设备上运行,以获得客户最低的响应时间和最大的吞吐量。但是,尽可能精确的必要性有时可能会与边缘可用的内存量和吞吐量发生冲突。训练有素、高度准确的模型可能运行速度太慢。
因此,tensorrt 版本 8 结合了深度学习推理应用或经过训练的神经网络模型的最新进展,以了解数据如何影响响应。它使用两个主要功能将语言查询推理时间减少一半:
nvidia 安培架构的稀疏性
深度神经网络擅长各种任务,例如计算机视觉、语音识别和自然语言处理。随着处理这些神经网络所需的计算能力增加,有效的建模和计算变得越来越重要。
sparse 是一种适用于具有 nvidia ampere 架构的 gpu 的新性能方法,可通过减少计算过程来提高开发人员的效率。深度学习模型的其他方面不如其他方面重要,有些甚至可以为零。因此,神经网络不需要对特定的权重或参数进行计算。因此,nvidia 可以通过使用稀疏性将模型的权重减少近一半来提高性能、吞吐量和延迟。
通过变压器优化减少推理计算
在 tensorrt 8 中,性能增强是通过变压器优化实现的。量化开发人员可以利用经过训练的模型通过 8 位计算 (int8) 执行推理。这大大减少了 tensor 核心中的推理计算和存储。int8 越来越多地用于优化机器学习框架,例如 tensorflow 和 nvidia 的 tensorrt,以减少内存和计算需求。因此,nvidia 可以在保持准确性的同时在 tensor rt 8 上提供非常高的性能。
例如,量化感知训练 (qat) 有可能使准确率翻倍。因此,与旧版本 tensorrt 7 相比,tensorrt 8 可以将许多模型的性能提高一倍。
tensorrt 部署在众多行业中
tensorrt 更好的性能和准确性使其成为医疗保健、汽车、互联网/电信服务、金融服务和零售等行业的热门选择。例如,tensor rt 用于为 ge healthcare 的心血管超声系统供电。这家数字诊断解决方案提供商使用该技术在其 vivid e95 扫描仪上加速自动心脏视图检测。通过使用改进的视图检测算法,心脏病专家可以在早期阶段做出更准确的诊断和检测疾病。此外,tensorrt 还被 verizon、福特、美国邮政服务、美国运通等知名公司使用。
随着 tensor rt 8 的发布,nvidia 还公布了谷歌使用 tensor rt 在 bert-large 推理方面的突破。transformers 的双向编码器表示 (bert) 是一种基于 transformer 的机器学习技术,用于预训练自然语言处理。bert-large 模型的分析时间仅为 1.2 毫秒,可以实时响应自然语言查询。这意味着公司可以将其模型的大小增加一倍或三倍,以获得更高的准确性。
许多推理服务在幕后使用诸如 bert-large 之类的语言模型。另一方面,基于语言的应用程序通常无法识别细微差别或情感,从而导致整体体验不佳。现在,公司可以使用 tensorrt 8 在几毫秒内部署整个工作流程。这些突破可以为新一代对话式 ai 应用程序铺平道路,为用户提供更智能和低延迟的体验。
FreeRTOS的事件标志组
关于EMC问题的测试
使用IP平台开发FPGA并进行应用设计
Cortex-A8处理器:AM335x的特点及应用介绍
三星无线充电器创造及发展变迁史详解
通过稀疏支持和Transformer优化增强AI推理
spad502叶绿素仪简介,它的功能特点有哪些
液晶显示器,液晶显示器色彩饱和度
声控集成块SK-5构成的光控玩具电路
传感器避免了人们被自动车窗夹伤事故的发生
双离合的种类以及优缺点
关于提升射频功率放大器的效率方法介绍
异步电机中的转子条数的定义、影响
变压器差动保护中电流互感器TA及其联接组的若干问题探讨
看到这个,你还把钱放到余额宝吗?你们有人放余额宝没?放多少呢
如何使用程序分析技术缓解漏洞修复的过拟合问题
VR技术与垂直行业的应用结合度将不断提升
你真的需要放弃4G套餐,来个消费升级吗
华为彭中阳发表了“构建数字新范式,共创行业新价值”的主题演讲
华为目前推迟了Mate系列的量产计划?