使FPGA进军ASIC级设计领域的方法步骤

不久前发生在asic上的问题现又在fpga上重演。到底是什么问题?那就是布线延迟对于设计性能的主导作用。多年以来,登纳德缩放比例定律(dennard scaling)增加了晶体管速度,同时摩尔定律的扩展增加了每平方毫米的晶体管密度。糟糕的是对于互联来说其效果正好相反。电线因摩尔定律扩展而变得更细更扁,但速度却变得更慢。最终,晶体管延迟降低到无足轻重的程度,而布线延迟却成为主导。随着fpga密度的增加以及赛灵思ultrascale™ all programmable器件进军asic级设计领域,相同的问题又出现了。ultrascale器件经过重新设计后能够克服这种问题,但解决方案却并不方便简单。以下来介绍一下解决方案的各个步骤。
步骤1:压缩模块,以使信号无需传送太远。
听起来很明确是不是?必要性是新发明的原动力,是时候在ultrascale密度方面采取行动了。ultrascale架构中的clb已经过重新设计,这样vivado®设计套件就能更高效地将逻辑排列到clb中。逻辑模块设计使排列变得更加紧密,因此clb间的布线资源需求量就会变得更少。布线路径也变得更短。ultrascale架构中clb的变化包括:为clb中的每个触发器增加专用输入与输出(这样触发器就能单独使用从而实现更高利用率);添加更多触发器时钟使能;为clb的移位寄存器和分布式ram组件添加独立时钟。从概念上讲,改进后的clb使用和排列情况如图1中的框图所示。
该实例显示,之前采用16个clb的电路模块现在用9个改进后的ultrascale clb即可实现。图中蓝色小方块和三角形的分布情况表明clb的利用率已提高,红线的减少说明对布线数量的需求也在降低。
步骤2:添加更多布线资源。
这种情况下的收效会快速递减,除非采取措施解决该问题。对于ultrascale架构来说,解决方案涉及添加更多的本地布线资源,从而使可布线性能够随clb密度的增加更快速地提高。图2显示了该结果。
但是,仅仅增加硬件布线资源是不够的。您还必须加强设计工具的布局布线算法,以便其能够利用这些新资源。赛灵思vivado设计套件已相应地进行了升级。
步骤3:处理不断增加的时钟歪斜。
您可能不知道,过去的fpga时钟分配过于简单了。早期几代的fpga依靠一个由ic几何中心成扇形散开的中央时钟分配中枢为所有片上逻辑提供时钟。这种全局时钟方案在诸如virtex ultrascale和kintex ultrascale all programmable器件系列的asic级fpga中行不通。不断提高的clb密度和持续增加的时钟速率不允许这样做。因此,ultrascale器件采用了一种经过彻底改进的时钟方案,如图3所示。
ultrascale架构的时钟分配网络包含一个区域化的分段时钟基础架构(segmented clocking infrastructure),该结构可将多个时钟分配节点放在众多片上时钟域的几何中心。再由独立的时钟分配节点驱动从适当大小的基础架构分段(infrastructure segment)中构建的独立时钟树。这种方案至少有三个主要优势:
1. 时钟歪斜快速减小;
2. 可用的时钟资源显著增多;
3. 时序收敛立刻变得更加简单。
然而,这样不足以改善时钟基础架构,除非设计工具也能支持新的时钟方案。为此,vivado设计套件相应地进行了升级,因为该套件针对的是步骤2中讨论的改良型clb间布线。
赛灵思必须针对以上三大步骤的每个步骤进行硬件架构和设计工具方面的重大更改。这就是赛灵思所指的可对ultrascale架构和vivado设计套件进行协同优化。这需要做出很大的努力,并且也绝对是实现asic级all programmable器件组合必须要做的工作。

毫米波雷达发射波的调制方式
步进驱动器的常见故障有哪些?步进电机驱动器的原理
自制空调扇
限流式保护器在地下车库充电设施电气设计中的应用
芯片加工中涉及的7nnm到底是怎么定义的
使FPGA进军ASIC级设计领域的方法步骤
富镍三元正极材料的改性策略
借力虚拟仪表控件 手机、平板实现远程量测/控制
巨鼎医疗布局影像AI生态,打造轻量级区域影像云平台
新一期超算排名AMD和英伟达霸榜
激光传感器的激光三角测量法
前置微小信号放大器在光声技术的血管识别研究中的应用
建设绿色工地,噪声扬尘在线监测处理解决方案
单片机的片内存储器跟片外存储器的内和外是相对于什么啊?
半导体产业迈入后摩尔定律时代 复杂制程迫使终端设备必须愈趋智慧化
人脸识别的应用包含了哪些领域
脉冲电源如何设置参数_脉冲电源主要参数
润和软件HopeStage与超图软件 GIS平台完成产品兼容性互认证
51 单片机编程:双路计数器详解
Q61F一体式全焊接球阀:在同类产品中流体阻力最小