一、前言:性价比爆棚的geforce rtx 40 super系列显卡
新一代的ada lovelace架构带来了令人咋舌的能效比,rtx 40系列显卡在性能相同的情况下,功耗只有上代一半甚至更低,只是价格并不是那么亲民。
2024年1月9日,nvidia发布了geforce rtx 40 super系列显卡,包括rtx 4070 super、rtx 4070 ti super和rtx 4080 super三款型号。
其中rtx 4070 super以4899元的售价提供了接近于rtx 4070 ti的性能;
而rtx 4070 ti super售价与rtx 4070 ti同为6499元,但性能与9499元的rtx 4080相差无几;
至于rtx 4080 super,它在规格大幅度提升的情况下,将售价降到了8099元,比起rtx 4080足足便宜了1400元。
新一代rtx 40系列super gpu的到来,瞬间让nvidia显卡性价比爆棚!
完整的ad104核心
rtx 4070 super使用了与rtx 4070(ti)相同的ad104核心。
完整的ad104核心共有7680个cuda核心(分为5组gpc/30组tpc/60组sm)、240个第四代tensor core张量核心、60个第三代rt core光追核心、240个纹理单元、80个rop单元、3mb一级缓存、48mb二级缓存。
ad104-350核心(rtx 4070 super)
rtx 4070 super做了部分精简,依然是5组gpc,只是将其中2组中的6个tpc减到了5个,也就是5组gpc、28个tpc、7168个流处理器、228个tensor core、56个rt core、80个rop单元、36mb二级缓存。
除了二级缓存之外,其他规格削减不到7%,而显存规格维持不变,可以想象,它的性能会非常接近rtx 4070 ti。
rtx 4070 super的详细规格参数如下:
二、图赏:与rtx 4070长一样 6+3相供电电路
包装盒和rtx 4070公版差不多,区别在于原来是白字,现在改成了黑色字体。
开箱。
附赠一条2x8pin转16pin的电源线。
上面是rtx 4070 super,下面是rtx 4070,长相也几乎一模一样,差别在于4070的金属条是银灰色,4070 super是深黑色,而且还能反光。
背面。
依然是16pin供电接口,不过功耗很低,完全不用担心烧化接口的情况。
3个dp1.4和1个hdmi 2.1接口。
没有用均热板,和rtx 4070一样,都是铜底+热管的散热设计。
依旧是rtx 4070的pcb版,非常mini,改造成itx版型也不难。
6+3相供电电路设计,虽然简单,但也足够应付220w的tgp。
这是rtx 4070的pcb板,对比一下,二者区别在于rtx 4070多一个空焊位,也就是少一相供电。
pcb板背面。
rtx 4070 super采用的是ad104-350核心,芯片面积295mm2,拥有358亿晶体管。
gpu旁边是6颗美光gddr6x显存,单颗2gb,总容量12gb,等效频率21ghz,带宽504gb/s。
三、理论性能测试:3dmark运行频率可达2805mhz
测试平台如下:
1、3dmark fire strike
在2k分辨率3dmark fire strike extreme测试中,rtx 4070 super图形分数达到了24185分,核心温度最高68℃,热点温度最高85℃,核心运行最高频率为2805mhz,最高风扇转速1397pm,整卡最高功耗222w。
在4k分辨率3dmark fire strike ultra测试中,rtx 4070 super图形分数达到了12112分,核心温度最高69℃,核心运行最高频率为2805mhz,最高风扇转速1397rpm,最高功耗222w。
2、3dmark time spy
在2k分辨率3dmark time spy测试中,rtx 4070 super图形分数达到了20649分,核心温度最高753℃,核心运行最高频率为2790hz,最高风扇转速2028rpm,最高功耗223w。
在4k分辨率3dmark time spy extreme测试中,rtx 4070 super图形分数达到了9948分,核心温度最高74℃,核心运行最高频率为2790hz,最高风扇转速13990rpm,最高功耗224w。
四、1080p游戏性能测试:与rtx 3090 ti旗鼓相当
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试结果汇总如下:
在1080p分辨率下,rtx 4070 super的性能与rtx 3090 ti不相上下,差距仅有1%。比起rtx 4070强了13%,和rtx 4070 ti相比就差了3%。
六、2k性能测试:强于rtx 3080 ti
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试数据汇总如下:
2k分辨率下,rtx 4070 super依然比rtx 3080 ti强2%,与rtx 4070相比,也有14%的优势,但是比rtx 4070 ti则有5%的差距。
此外我们还测试了4k分辨率下的成绩,汇总如下:
由于192bit显存位宽的关系,rtx 4070 super在4k分辨率下的性能会明年不如rtx 3080 ti,但大多数游戏依旧能保持60fps以上的帧率。
我们测试的12款3a大作,有3款帧率低于60fps,但这几款游戏都支持dlss 3,开启之后帧率会有翻倍提升。
六、stable diffusion体验:tensorrt加持 生图速度提升350%
2023年9月,nvidia推出了用于stable diffusion web ui 的tensorrt 加速插件,能让具备tensor单元的geforce显卡在stable diffusion web ui 中获得翻倍的性能。
本次我们将对比sdxl加速方法与pytorch xformers(常规加速方法)的性能差异。
我们生成10张太空大战图像,分辨率1024*1024,使用pytorch xformers加速时,耗时9分17秒。
使用sdxl加速之后,耗时仅为2分02秒,性能提升350%。
从终端中也可以看到,rtx 4070 super使用默认加速器时,生图速度只有1.1it/s,而在tensorrt加持下,生图速度猛然提升到了4.50it/s。
七、dlss 3游戏测试之一:3款dlss 3游戏
此次我们一共测试了6款游戏,包括3款支持dlss 3的游戏:《3dmark》、《毁灭全人类》、《燕云十六声》。
另外还有3款同时支持dlss与光追的游戏:《光明记忆》:《生死轮回》、《赛博朋克2077》。
所有dlss 3以及光追测试都是在2k分辨率下进行。
1、dlss3 测试--燕云十六声
《燕云十六声》是一款开放世界中国风武侠动作游戏,画质精良,号称国产3a破阵制作。目前这款游戏还处于内测阶段。
这款游戏于日前推送了对于dlss 3支持的更新,下面我们来看看rtx 4070 super super的表现,测试分辨率为2560*1440,画质选项为“超高”。
默认超高画质下,游戏帧率为91fps。
开启dlss 2(性能模式)之后,帧率达到了146fps,提升了60%。
打开dlss 3(插帧)之后,帧率来到了198fps,相比默认画质帧率提升了117%。
2、3dmark
dlss 2模式下帧率为140fps,比默认的65fps提升了133%。
dlss 3的成绩为150fps,相比默认提升了150%。
3、毁灭全人类2:重新探测
最高画质下,rtx 4070 ti的帧率为131fps。
开启dlss 3之后,帧率来到了242fps,近乎翻倍。
八、dlss 3游戏测试之二:3款支持dlss 3的光追游戏
1、光明记忆:无限
开启rtx时,游戏的帧率为109fps。
开启dlss 3之后,帧率提升到了235fps,提升了116%。
2、生死轮回
开启光追之后,游戏的帧率仅有65fps。
打开dlss 3之后,帧率提升到了195fps,提升幅度为195%。
3、赛博朋克2077
开启光追时,帧率为40fps。
这是dlss 3的画面,与原生画面的差距难以分辨,但是帧率提升到了155fps。
九、功耗测试:2k游戏平均功耗仅为3080 ti的62%
将furmark的参数设定为1920*1200分辨率、0aa。
运行13分钟之后,rtx 4070 super的温度稳定在74度附近,功耗稳定在220w,烤机时gpu频率为1620mhz,cpu风扇转速只有2153rpm。
2)、真实游戏功耗测试
1、gta v
这是1080p分辨率。rtx 4070 super功耗126w,温度53度。
2k分辨率下,rtx 4070 super功耗164w。
2、绝地求生
1080p分辨率下,rtx 4070 super功耗203w,温度689度,运行频率2760mhz。
2k分辨率下,rtx 4070 super0功耗212w。
3、古墓丽影:暗影
1080p分辨率下,rtx 4070 super的功耗为207w。
2k分辨率下,rtx 4070 super功耗是212w,运行频率2745mhz,温度64度。
测试数据汇总如下:
在1080p分辨率下,rtx 4070 super在3a游戏中的平均功耗不到200w,2k分辨率也只有207w;就算是到了4k分辨率,平均功耗也只有214w,仅相当于rtx 3080 ti的62%。
十、总结:堪称业界良心
本次测试小结如下:
1、ai性能
即使没有tensorrt 加速插件,rtx 40系列gpu也是stable diffusion画图首选,而今在tensorrt加持下,rtx 4070 super的生图速度在原有基础上提升了350%,这样的表现相信是不会再有任何竞争对手了。
2、1080p游戏性能
我们所测的12款游戏,除了《星空》之外 ,剩余11款游戏rtx 4070 super的帧率全部都超过了160fps,就连显卡杀手《赛博朋克2077》也有169fps。
就性能而言,1080p分辨率下,rtx 4070 super几乎能与rtx 3090 ti并驾齐驱,相比rtx 3080 ti强了6%,比rtx 4070则强了13%,和4070 ti的差距只有3%。
3、2k游戏性能
2k分辨率下,同样是除了《星空》之外,rtx 4070 super在其他11款游戏中都能保持120fps以上的帧率。
在2k分辨率下,rtx 4070 super依旧能比rtx 3080 ti强2%,不过和rtx 4070 ti的差距也拉大到了5%,比起rtx 4070则强了15%左右。
另外,我们也测试了4k,rtx 4070 super在此分辨率下帧率会有较大损失,不过在绝大部分游戏中依旧能够跑出60fps以上的帧率。
少数几款显卡杀手游戏虽然帧率只有50pfs左右,但好在这些游戏都支持dlss 3,开启之后帧率甚至能突破100fps。
4、功耗
我们测试了6款3a大作的真实游戏功耗,在1080p分辨率下,rtx 4070 super的平均功耗是192w,而rtx 3080 ti是312w。
2k分辨率下,rtx 4070 super在6款游戏中的平均功耗是207w,rtx 3080 ti则是332w。
4k分辨率下,rtx 4070 super在6款游戏中的平均功耗为214w,rtx 3080 ti则已经跑到了350w的tgp上限。
5、dlss 3和光追
目前能玩的dlss 3游戏多达数十款,我们测试了6款。
在开启dlss 2之后,游戏帧率平均提升幅度为107%。打开dlss 3,游戏帧率平均提升幅度达到了159%。
如今的nvidia gpu早已不是单纯的游戏显卡,特别是在ai应用方面,有了sdxl,能将stable diffusion生图速度提升4倍左右,让原本已经大幅度领先对手的n卡彻底无敌。
至于价格,4899元就能买到一块1080p性能堪比rtx 3090 ti、2k性能强于rtx 3080 ti的显卡,同时游戏功耗仅有200w左右,堪称业界良心。
rtx 4070 super只是开始,接下来的rtx 4070 ti super和rtx 4080 super将会带来更多的惊喜。
nvidia geforce rtx 40 siuper系列现已上市,请到京东diy super超能年货节上选购geforce rtx 4070 super/4080 super 公版和合作伙伴显卡。
无刷电机电流控制方法
简析ARP欺骗
中国芯,国之重器!***崛起路上
直线电机的结构
诺基亚领衔2017年最值得期待手机排名 将有4100万像素?
RTX 4070 SUPER首发评测
全息透明oled显示屏怎么用
联发科正式发布Helio P95,主频最高可达2.2Ghz
我也来玩玩,高通宣布进军无人机芯片市场
高通公司计划在2021年推出兼容5G的处理器
为什么都用西门子PLC
基于Jenkins远程执行shell命令
倒顺开关的使用条件及注意事项
全球首个基于GPT的无人机物流算法控制系统问世
校园外语电台自动播控系统设计方案
RFID未来哪些优势是别人替代不了的
我国分子生物传感器研究方面已取得重大突破
Windows 8 潜在致命错误
全栈技术分享 | 芯来RISC-V技术交流会@珠海&@深圳
热传感器的电路组成和工作