按照摩尔定律,随着工艺尺寸的降低,性能和密度在不断提高,但是却很难控制好功耗,难以跟上摩尔定律的预期。为了能够使系统级功耗保持在最低水平上,65nm Altera Stratix III FPGA采用了多种工艺技术,包括Altera专有的可编程功耗技术。Stratix III FPGA的核心结构建立在创新的逻辑单元之上——自适应逻辑模块(ALM)。这种核心结构与MultiTrack互联体系结构相结合,以很少的跳转实现高性能互联,使Stratix III器件能够以非常低的功耗,高效实现高速逻辑、算法和寄存器功能。
尽管基本6-LUT能够实现两个更小的功能,但通常还是只用作一个6-LUT。由于LUT只有6个输入,所需的共享输入数量严格限制了可组合的功能类型。这一限制使得很难将基本6-LUT用作两个5-LUT。作为对比,Stratix III ALM的两个附加输入使其能够用作两个全功能5-LUT,在面积上有很大的优势。
Altera在65个真实设计(针对最小面积进行了优化)基础上进行了新的性能基准测试,以比较Stratix III和Virtex-5的性能。性能基准测试提供了Altera ALM和Xilinx LUT触发器对的相对性能平均测量结果。由于具有高效的分段式能力,Stratix III ALM性能平均要比Virtex-5 LUT触发器对高1.8倍。在某些设计中,甚至达到2.3倍,如图4所示。“1”处的水平黑线表示在这一点,Virtex-5 (LUT触发器对)和Stratix III (ALM)的逻辑单元数量相同。
此外,Stratix III FPGA比竞争65nm器件(例如Virtex-5,参见图12)快出一个速率等级。这一平均性能优势基于业界认可的基准测试方法,在一组真实客户设计中使用了带有DSE和Xplorer的最新版Quartus II和Xilinx ISE设计软件,以获得最佳性能结果。
图12. Stratix III和Virtex-5基准测试
更好的系统级性能,并有余量
某些供应商任意规定速率,使用户不得不在实际中对规范进行调整,很难获得最佳性能,而Altera在规范上采取了保守的方法。设计人员使用Altera FPGA,可确保轻松实现时序逼近。例如,当Altera说明能够达到333MHz DDR2性能(例如采用Stratix II FPGA)时,实际在所有情况下,设计人员都能保证系统工作在333MHz上。事实上,用户的产品性能甚至可以达到400MHz DDR2。在另一个例子中,Stratix II FPGA在LVDS和DDR2规范上有足够的余量,超过1.25Gbps和400MHz。按照这一趋势,Stratix III FPGA将继续顺利实现系统级时序要求。
要实现更高的系统性能,不但需要很好的内核性能、片内RAM、数字信号处理(DSP)模块,而且还需要对I/O进行优化。Stratix III FPGA的DSP模块和片内RAM (TriMatrix存储器)针对最佳DSP性能进行了全面优化,能够运行在600MHz上。此外,Stratix III FPGA比目前所有的单片DSP处理器的性能高出几个数量级,每秒乘累加运算次数(GMAC)达到537吉。
为完善高性能内核,Stratix III FPGA采用了高性能I/O进行设计,能够与外部器件进行宽带连接。例如,Stratix III I/O外部存储器接口采用专用存储器接口电路,能够实现DDR3和QDR II+等最新的高性能存储器接口。Stratix III FPGA是目前唯一支持400MHz DDR3和QDR II+的FPGA。而且,DDR2、QDR2 II和RLDRAM II的性能在Stratix II器件基础上进一步得到了提高(表8中进行了总结)。Altera与一流供应商合作,确保用户的Stratix III FPGA能够连接最新的存储器。
表8. Stratix III FPGA I/O性能
使用这些高级特性和可定制知识产权(IP),设计人员能够迅速轻松的将多种应用集成到复杂系统中,而不用降低Stratix III FPGA的性能。
与1.2V的Stratix II FPGA和1.0V的Virtex-5相比,利用低功耗技术,Stratix III FPGA在0.9V时静态功耗降低了64%,动态功耗降低了55%(参见表9)。表9中的数值针对Stratix II进行了归一化处理,来自供应商功耗估算器工具的公开数据。计算结果基于每个ALM或者Virtex-5等价ALM的静态功耗。
由于很难控制好功耗,现在越来越难以跟上摩尔定律的预期——工艺尺寸不断降低,性能和密度不断提高。但是,经过多年的研究,Stratix III FPGA取得了多项创新,例如ALM和布线体系结构、嵌入式功能(DSP和RAM)、高级I/O标准以及外部存储器接口等。这些创新特性集成在业界领先的Quartus II软件中,能够以极低的功耗提供优异的性能,在尽可能小的FPGA中实现大型设计。