作者:awanish verma,赛灵思首席架构师兼技术营销总监
(赛灵思现在是 amd 的一部分)
第一部分 打造面向新一代通信的全新芯片架构
5g 新无线电 (nr) 网络规范需要新的无线电和接入网架构。虽然 5g nr 架构包括新的频谱和大规模 (mmimo) 天线,但相应的接入网架构也必须演进发展才能实现5g 定义的服务, 其中包括增强型移动宽带、超可靠低时延通信与大规模机器类通信。实施这些服务需要在不同级别的网络聚合节点上进行网络切片。由于纯软件解决方案无法满足不断攀升的时延和吞吐量需求,导致网络加速成为巨大需求,而这个问题则可以通过可编程硬件得到良好解决。在本部分,我们专门讨论采用自适应射频 (rf) soc 加速的第一级 5g 接入网聚合。
为了满足这些新要求,3gpp 标准组织在 5g 无线电单元 (ru) 和 5g 基站之间定义了不同的分割架构。不同的分割架构在决定 gnodeb 架构方面起着决定性的作用。上层分割定义了集中式单元 (cu) 和分布式单元 (du) 之间的功能划分,而下层分割则定义了 ru 和 du 之间的功能分区。下层 (ru-du) 分割在时序和时延方面更为关键和敏感,并且没有标准化。
图 1:下层分割有多种选择
虽然split-8 在传统的 4g-lte 网络中更为常见,但在 5g 网络中 则更多采用的是split-7.2。分割选项 7.2 具有多种变体,因此也被称为选项 7-2x,因为它可以根据部署场景向左或向右移动,如上图所示。由于分割选项很灵活,并且 du 和 ru 之间的接口在接口协议、带宽、时延和时序方面也没有严格定义,因此为实现接口与功能而在 ru 和 du 处部署可编程处理器,通常是较为理想的选择。
商用网络接口卡 (nic) 可用于终止 5g 基站在 du 的前传。然而,基于 asic 的网卡只能处理 l2-l3 流量,并且依赖于软件进行 o-ran 处理,而且大多数通用网卡都没有定时同步功能。由于 du 需要与无线电单元和相邻基站实现严格的时间同步,因此它们需要支持来自中央gps时钟源的主、从和边界时钟操作模式。另一个重要的定时功能,是在基站硬件上实现的时钟保持电路,以便在丢失参考时钟的情况下保持时钟的同步。
一旦来自 ru 的无线电 iq 数据可用于处理,就需要对其进行处理,以便在上行链路和下行链路方向上识别为用户平面、控制平面、管理平面和同步平面数据。同步和管理平面协议消息的吞吐量明显低于 u 平面和 c 平面消息,因此,大部分时间消息的同步和管理在软件中处理,而应用则在用户空间中运行。
3gpp 分割选项 7-2 split 还定义了 high-phy 和 low-phy 功能之间的明确划分,其中 low-phy 功能(如预编码、fft/ifft)与资源元素 (re) 映射/解映射功能,要么在远程无线电单元 (rru) 实现,要么在 ru 和 du 之间的前传网关网络节点实现。high-phy 功能(主要包括编码/解码、加扰和调制/解调制)在 du 中执行。
图 2:采用赛灵思自适应 rfsoc 的 5g 分割选项 7-2 split 实现方案
gnodeb (du) 中的 high-phy 功能可以完全通过软件实现,也可以通过将软件与可编程硬件相结合来实现。软硬件之间的 high-phy 功能划分取决于众多因素,例如:
软件(或硬件)对整体性能的性能限制,即软件不应限制硬件的性能,反之亦然。 时延考虑因素:由于 5g 规范对不同类别的服务提出了严格的时延要求,因此该划分不应对时延产生负面影响。 与行业标准软件 api 的兼容性:一些 high-phy 功能具有用户空间 api 的标准定义,因此任何硬件实现方案都应保持与标准 api 的兼容性,以实现无缝过渡。 上述标准概述了赛灵思等公司基于可编程硬件的加速器所需的功能。理想的加速器架构可能需要在硬件中实现完整的 5g high-phy,这将实现最高性能和最低时延,同时还可以跨多个基于 mmimo 的 rru 配置进行扩展。随着 5g 和 o-ran 标准与功能的演进发展,赛灵思已开始在可编程加速器卡上实现 o-ran 处理和后备通道编码/解码。通道编码是 high-phy 功能之一,由于其计算密集型特性,最适用于可编程硬件。此外,它还可以与混合自动重传请求 (harq) 功能相结合,以提高性能并降低时延。
加速 5g l1 high-phy 功能的一种方法,是基于自适应和可编程的赛灵思 t 系列电信加速器卡。这些卡带有自适应 rfsoc,可强化基于软决策的前向纠错 (sd-fec) 模块,并通过板载 dram 实现 harq 功能,以便获得更优异且可扩展的性能。
在下一篇文章中,我们将深入探讨有关电信加速器卡的一些细节,同时还将探讨 5g 基带加速的下一步发展。
第二部分 5g 基站前传和 l1 high-phy 的实现
在文章第一部分中,我们讨论了 5g 分割架构,重点介绍了广泛采用的分割选项 7-2 split。在第二部分中,我们将介绍 5g 基站前传和 l1 high-phy 的实现。5g 分布式单元 (du) 可用于通过 o-ran 处理与部分卸载处理前传数据,以进行 high-phy 处理,其中包括 ldpc 编码器、ldpc 解码器以及编码器与解码器逻辑的包装器功能。
前传处理:下面的示例架构假设有两个网络接口连接至 5g 无线电单元 (ru),如图 3 所示。5g du 必须能够在 5g 和 5g 基站之间进行全容量的网络连接数据传输。网络接口模块包括连接至工业标准接口光学模块的以太网 mac 接口,用于发送和接收增强型通用公共无线电接口 (ecpri)、以太网无线电 (roe) 或来自 5g ru 的时间敏感型网络 (tsn) 以太网数据。主机接口通常是 pcie,包括采用直接存储器访问 (dma) 的高速数据传输机制。
前传处理可以分为以下主要子模块,接下来我们将进一步介绍每个模块。
图 3:5g 基站节点上的前传处理。
1. 精确时间协议 (ptp) 功能:通过利用亚纳秒粒度的流量时间戳,使本地时钟(充当从节点时钟)与系统主时钟实现同步。du 将接收到的 1588v2 ptp 数据包作为流量的一部分,并将其标识为同步平面数据包。然后,在将时间戳字段替换为由参考时钟生成的时间戳字段后,它们将被发送到在 x86 上运行的 s 平面应用。该模块的其他功能包括延迟请求的处理、从软件更新一天时间的主时钟定时器值以及在主模式下产生 1pps(每秒脉冲)。
2. 流量分类器/聚合器:该模块的功能支持控制、用户、同步和管理(c、u、s 和 m 平面)消息的路由。流量分类器模块可以执行流量规则,用于丢弃或处理来自传入网络端口的传入前传流量。该模块可以在上行链路和下行链路方向上接收 ecpri 数据包(c 和 u 平面)和以太网数据包(s 和 m 平面)。
对于上行链路处理,ecpri 数据包由数据包报头中的 ecpri 消息类型字段进行识别。这包括根据配置规则检查源 mac 地址、目标 mac 地址和虚拟局域网 (vlan) id,以及在规则不匹配时丢弃数据包。对于上行链路方向的 s 和 m 平面以太网数据包,它可以实现一个简单的仲裁器,以进行调度并将其传输到主机接口队列。
对于下行链路,它可以根据 ecpri 报头中的消息类型字段配置不同 ecpri 消息的优先级。此外,它还可以根据 c 和 u 平面配置添加 vlan 标签,而且 vlan 标签中的优先级字段可用于为 c/u 平面消息分配优先级。也可以对 s 和 m 平面进行 vlan 标记并分配优先级。与此同时,该模块还可以实施优先级调度程序,以便根据分配的优先级将数据包发送到已连接的前传端口之一。
3. ecpri 成帧器和解帧器:ecpri 成帧器/解帧器处理负责上行链路和下行链路 c/u 平面消息的 ecpri 协议处理。ecpri 处理需要包括单独的上行链路和下行链路数据路径处理。由于 ecpri 处理必须支持基站中的多天线载波 (axc) 配置,因此该模块的灵活应变能力使其能够根据部署场景进行放大和缩小。ecpri-over-ethernet 消息的数据包格式如图 4 所示。添加填充(零填充)字段是为了使短消息的 ecpri 最大传输单元 (mtu) 的大小为 64b。
图 4:以太网数据包中的 ecpri-over-ethernet 消息。
由于下行链路的 c 平面消息也在 5g du 处生成,因此 ecpri 成帧器同时处理上行链路和下行链路 c 平面消息以及下行链路 u 平面消息。通过使用分层调度程序和多路复用方案,ecpri 消息的多个流/层可以由单个 ecpri 成帧器数据路径共享。ecpri 成帧器生成 ecpri 消息的不同字段并进行填充,以创建 ecpri-over-ethernet 数据包,通过前传接口进行传输。
ecpri 解帧器模块具有以下功能:
以太网报头的处理与删除 ecpri 报头的解析与删除 删除 ecpri 填充,其中包括基于报头字段的流标识和序列号 删除 ecpri 数据中的零填充(对于短消息) 检查长度和其他协议错误 每个 ecpri 流的统计信息 4. o-ran 处理器:o-ran 模块与 ecpri 模块一起工作,通常与主机接口连接以提供以下功能:
从 e-cpri 解帧器接收上行链路 u 平面消息,以提取 iq 数据并将其传送到主机 提取 c 平面 iq 数据的包装信息,并将其相应地用于上行链路 u 平面消息 延迟管理并将 c 平面消息转发到 ecpri 模块 从主机到 o-ran 消息的 u 平面 iq 数据成帧,并传送到 ecpri 成帧器 o-ran 模块接口如图 5 所示。
图 5:上行链路和下行链路数据的 o-ran 模块接口。
o-ran 上行链路和下行链路模块均设计为与四个独立的 axc 接口连接。在上行链路方向上,o-ran 模块根据 o-ran 报头中的参数将 u 平面消息分为物理随机接入信道 (prach) 或物理上行链路共享信道 (pusch)。然后对这些消息进行解帧,以提取相应的 iq(用于无线电信号的数据格式)样本。在下行链路模块中,对 c 平面消息进行解析,以提取 u 平面成帧所需的信息。
5. iq 数据主机接口:主机接口模块向 cpu 发送并从其接收 iq 数据样本,处理 u 平面和 c 平面消息的延迟管理。对于 iq 样本的缓存,可以使用外部存储器来确保数据包无损传输到前传接口。主机接口模块读取存储在存储器中的数据以及自适应片上系统 (asoc) 生成的定时信号,以确保 asoc 和主机 cpu 之间的插槽同步。
如上所述,前传处理和 l1 high-phy 加速需要能够适应各种大规模多输入多输出 (mmimo) 天线配置,以实现前传连接和吞吐量。数据路径处理应该能够提供具有 ecpri 和 o-ran 处理的线路速率接口,同时满足 5g 规范的时延和同步要求。
赛灵思在其 t1 电信加速器卡中实现了前传参考设计,可处理的总吞吐量为 50gbps,这大约相当于 8 层 4t4r 100mhz 的主备配置。该卡使用自适应 mpsoc 和 rfsoc 器件保持功能的灵活性。在大多数 du 实现方案中,在自适应器件上使用 o-ran 处理器,x86 软件可实现完整的无线 l1 堆栈,并且可以提供显著的吞吐量和时延优势。
中国5G智能电网全球标准占42%,美国被踢出局
什么是EOS原力主网,为什么一定要用区块链重塑未来
CISCO与华为3COM路由器的比较分析
感光器件工作原理
利用石墨烯电导率变化实现太赫兹调制
借助自适应 SoC 加速 5G 基带
停不下来!Facebook收购面部识别技术公司FacioMetrics
海尔签约5大战略伙伴 拿下全球首颗12纳米芯片
STM32定时器单脉冲模式的一个应用示例
基于H.323和SIP协议的视频会议网关设计
工业触控一体机在电磁兼容方面具有更高的要求
MEMS惯性传感器的分类及应用解析
首款车型现身工信部产品公告 恒大汽车还能否翻身
如何判定语音芯片管脚是否氧化?
单相异步电机的原理 浅谈单相异步电机故障分析
CAM350 8.0快捷键
最新消息!高通宣布整合5G基频行动处理器
建设新型智慧城市到了哪一步了
PCB产业景气 5G市场有望超600亿元
高通骁龙888平台机型大盘点