nvidia 发布的 cuda 开发环境 cuda 11.6 的最新版本。本版本的重点是增强 cuda 应用程序的编程模型和性能。 cuda 继续推动 gpu 加速度的边界,并为 hpc 、可视化、 ai 、 ml 和 dl 和数据科学中的新应用奠定基础。
cuda 11.6 有几个重要特性。这篇文章概述了关键功能:
gsp 驱动程序架构现在默认为图灵和安培 gpu
新 api 允许禁用实例化图中的节点
完全支持 128 位整数类型
协作组命名空间更新
cuda 编译器更新
nsight compute 2022.1 版本
cuda 11.6 附带 r510 驱动程序,这是一个更新分支。 cuda 11.6 工具包可供下载 。
gsp 驱动程序体系结构
gsp 驱动程序体系结构现在是所有列出的图灵和安培 gpu 的默认驱动程序模式。较旧的驱动程序体系结构作为后备支持。有关更多信息,请参阅 r510 驱动程序自述 。
实例化的图形节点 api 添加
我们添加了一个新的 api cudagraphnodesetenabled,以允许禁用实例化图中的节点。在此版本中,支持仅限于内核节点。相应的 api cudagraphnodegetenabled允许查询节点的启用状态。我们还添加了禁用空内核图节点启动的功能。
128 位整数支持
cuda 11.6 包括 128 位整数(__int128)数据类型的完整版本,包括编译器和开发工具支持。主机端编译器必须支持__int128类型才能使用此功能。
协作组名称空间
协作组名称空间已更新为新函数,以提高命名、函数范围以及单元维度和大小的一致性。
cuda 编译器
在编译过程中向目标安装的 gpu 添加了-arch=native编译选项。这扩展了现有的-gencode=arch=compute_xx,code=sm_xx体系结构规范
添加从nvlink创建 ptx 文件的功能
不推荐的功能
不推荐使用用于设备上 fork 和 join 并行的cudadevicesynchronize(),以便为具有更高性能的替换编程模型做准备。这些函数在本版本中继续工作,但这些工具会发出有关即将发生的更改的警告。
centos linux 8 已经到了生命的尽头 在 2021 年 12 月 31 日,对这个操作系统的支持现在在 cuda 工具包中被弃用。 centos linux 8 支持将在未来版本中完全取消。
关于作者
rob armstrong 是 cuda 工具包的主要技术产品经理。 20 多年来,他一直专注于使用异构硬件平台加速软件,并对计算机体系结构和硬件/软件交互特别感兴趣。
arthy sundaram 是 cuda 平台的技术产品经理。她拥有哥伦比亚大学计算机科学硕士学位。她感兴趣的领域是操作系统、编译器和计算机体系结构。
fred oh 是 cuda 、 cuda on wsl 和 cuda python 的高级产品营销经理。弗雷德拥有加州大学戴维斯分校计算机科学和数学学士学位。他的职业生涯开始于一名 unix 软件工程师,负责将内核服务和设备驱动程序移植到 x86 体系结构。他喜欢《星球大战》、《星际迷航》和 nba 勇士队。
华为发布入门级手机--荣耀7S,搭载单摄像头及5.45英寸2.5D弧形屏幕,售价约801人民币
烽火通信光纤技术获“第二十三届中国专利奖”银奖
中环股份与天合光能签订单晶硅片销售框架合同
网球迷福音!巴克莱ATP世界巡回赛总决赛将用VR进行直播
联通和电信的5G SA共建共享商用站点,带来更好的用户体验
新版本CUDA 11.6工具包的功能
任天堂Switch成功运行《赛博朋克2077》
电信运营业一味地追求发展速度和用户规模,是跑得越快就离成功越近吗?
城市内涝监测预警一体机-道桥积水监测预警系统-旭华智能
联发科P23舰级芯片来袭,似乎可以和高通骁龙660一决高下
如何解决LED散热的问题
蚂蚁集团暂缓上市市值大缩水
联盛新能源:成为全球运营规模最大的新能源领军企业之一
泰克示波器常见故障原因及维修方法
Altium Designer导出Cadence网表的步骤
AlwayStone AS9375不同于传统银烧结产品
如何制造用于LED的荧光粉照明
高清智能电视诞生:世界分辨率最低的显示屏
Linux驱动开发高精度定时器的精度测量评测
电子元件和电子元器件的区别 电子元件之间用什么连接