kwok kong在idt白皮书中描述了使用基于标准的pci express(pcie)多端口交换机作为系统互连的多对等系统。自该白皮书发布以来,idt设计并实现了一个多对等系统,该系统使用基于x86的系统作为根处理器(rp)和端点处理器(ep),通过idt的pes16nt8非透明网桥(ntb)端口和idt的pes64h16设备用作系统互连的多端口pcie交换机。有关软件体系结构的详细说明,请参见应用笔记an-571。本文介绍了这种系统的实测系统数据传输性能。
系统描述
多对等系统拓扑如图1所示。一个x4 pcie接口用于将每个根处理器和端点处理器连接到pes64h16系统互连pcie交换机。这是用于衡量系统数据传输性能的拓扑。
pes16nt2用于提供ntb功能,以便将基于x86的端点处理器连接到pes64h16 pcie交换机的下游端口。系统互连软件提供了基于pcie接口的虚拟以太网。linux操作系统(os)检测网络接口并“看到”以太网接口。linux os将以太网数据包发送到pcie接口,就好像它是以太网接口一样。就数据传输而言,linux os中的pcie接口是隐藏的。所有当前的网络协议堆栈(例如tcp / ip协议堆栈)以及能够在tcip / ip堆栈顶部运行的用户应用程序都可以正常运行,而无需进行任何修改。
系统互连拓扑
本应用笔记介绍了pcie systeminterconnect的系统数据传输性能。网络性能基准测试软件netperf用于测量性能。将性能与环回测试和10 ge的性能进行比较。
对于amd系统,有效数据传输速率在1k到16k字节之间的数据大小为3到3.5 gbps之间。对于512字节的数据大小,数据速率约为2.5 gbps。
对于bensley系统,对于16k至2k字节的数据大小,有效的数据传输速率约为5 gbps。对于1k和512字节的数据大小,有效数据传输速率分别约为4 gbps和3 gbps。数据传输速率与10ge接口相似。bensley的性能比amd好得多,因为bensley支持dma引擎来传输数据。dma引擎可以更有效地传输数据,并使cpu周期从复制数据中释放出来,以进行更多的数据传输处理。
预期对于大量数据传输,数据大小可能会很大,例如4k到8k字节。实际上,可以预期的是,bensley的pcie系统互连的有效数据传输速率约为5 gbps,amd的有效数据传输速率约为3.5 gbps。
通常,协议封装开销会降低有效带宽。但是,已经表明,对于大数据大小,带宽的减少约为1-2%。通过减少协议封装开销而增加的带宽可以忽略不计。但是,在数据传输中删除tcp / ip协议栈会导致cpu周期显着减少,并使cpu能够进行更多的数据传输处理。
uC/OS-II—邮箱介绍
本振泄露是什么_本振泄露的原因和影响
局域网ip地址不够用的解决办法
IBM研制最强大计算机 有望揭晓宇宙起源之谜
PCB抄板之PROTEL到ALLEGRO的转换技术2
PCI Express交换机实测系统数据传输性能
5G时代,网速和覆盖范围更快更广
TI宣布9亿美元收购美光12寸晶圆厂
滚珠丝杆高效测量方案:SJ5780双向轮廓测量仪
另辟蹊径,奇虎360开发柔性屏智能音箱冲击高端市场
微型减速电机的原理
深度学习框架不能“包治百病”什么样的深度学习框架才是适合自己的呢?
RS备货Skipper场地管理和安全系统
简单实用的同轴连接器要点总结
OPPOR11、OPPOR11Plus最新消息:OPPOR11真机谍照曝光,外观工艺升级网友求发布
屏下指纹技术成下一个新热点 2018年指纹芯片厂商路在何方?
半导体/高端设备行业亏损也能上市:帝尔/锐科激光启动IPO
Cadence 数字全流程解决方案通过三星5LPE工艺认证
电池管理系统BMS知识汇总
物联兴起,电动车也能装进“口袋”充电