FPGA MAKER XILINX在数据中心的新软件可编程芯片
随着数据中心被要求处理馈送到各种尖端应用的非结构化数据的爆炸,FPGA的未来看起来很明亮。
这是因为FPGA或现场可编程门阵列基本上是可以编程的芯片,该芯片可以在制造之后被编程,以充当工作负载的自定义加速器,包括机器学习,复杂数据分析,视频编码和基因组学 - 具有深远后果的应用程序用于通信,网络,医疗保健,娱乐业和许多其他企业。
这种应用借助并行处理,是FPGA的一个重要特征,也可以在飞行中重新计算以处理新功能,因为这些工作负载的性质也在演变。
现在,几十年来的Xilinx与竞争对手Altera(现在是英特尔的一部分)进行FPGA的技术领导,这是不驾驶它所谓的新产品类别 - 自适应计算加速平台(ACAP) - 它说,远远超过目前FPGA的能力。
该类别中的第一个产品系列是代码名称珠穆朗玛峰,由于磁带出来(使其设计成品已完成)今年和明年发货,Xilinx周一宣布。无论是当前FPGA的增量演变还是更加激烈的东西,因为公司正在揭示一个留出许多技术细节的架构模型,就像芯片将使用的应用程序和实时处理器一样,这是难以说出的。
但我们所知道的功能是结果的。珠穆朗玛峰将作为标准特征将NOC(网络上的芯片)纳入其中,并使用CCIX(缓存相干互连的加速器)互连结构,其中两个都没有出现在当前的FPGA中。
珠穆朗玛峰将提供硬件和软件可编程性,并成为市场上的第一件集成电路之一,用于使用7nm制造过程技术(在这种情况下,TSMC)。制造工艺技术越小,处理器上的晶体管密度越大,导致成本和性能效率。
虽然对制造过程命名和英特尔的制造过程的相对优点存在争议,但基本思想是7nm大约是目前FPGA的几何尺寸的一半,每平方毫米的性能四倍。珠穆朗玛峰设备将拥有多达500亿晶体管,例如英特尔(以前的Altera)当前Stratix 10 FPGA,它使用14nm制造过程和30亿晶体管。
Xilinx.Xilinx的首次产品系列使用其ACAP技术是代号为珠穆朗玛峰,在台积电工艺技术中开发。
“我们真的觉得这是一个不同的产品类别,”最近命名为Xilinx Ceo Victor Peng。Xilinx在过去的四年里花了大约十亿美元,并致力于该项目的工程师1,500名工程师。
Xilinx目前声称其FPGA,由于它们能够为不同的工作负载定制,加速处理40倍的机器学习推理,视频和图像处理的10次,以及基因组学的100次,相对于CPU或GPU - 基于系统。它说,CAAAS将进一步加速20次AI推断,并在其当前的FPGA架构中通过4倍的通信。
FPGA传统上已经提供了一系列通过可编程互连链接的可配置逻辑块。FPGA重新配置FPGA多年通过硬件描述语言(HDL)完成,但芯片开发人员已经开始调整设备的架构,以实现使用更高级别的软件编程语言。
Xilinx最近发布的Zynq所有可编程SOC(芯片上的系统)加入了已经集成在产品中的ARM的处理器的软件可编程性,具有FPGA的硬件可编程性。
“我们一直在改造,但如果你愿意,ACAP是拐点,”彭说。“即使在之前,FPGA也是灵活的,适应性的,那个水平要高得多,是的,我们最近开始让人们在软件级别开发更多,但我们将与这类一起做的程度。产品要高得多。这使得这是一个量子的阶滞,而不是我们以前见过的东西。“
Xilinx表示,软件开发人员将能够使用C / C ++,OpenCL和Python等工具使用珠穆朗玛峰。珠穆朗玛峰也可以使用像Verilog和VHDL等HDL工具的硬件,寄存器传输级别(RTL)编程。
Moor Insights&Strateg的分析师Karl Freund认为珠穆朗玛峰是Xilinx的战略的演变而不是激进的一步,但强调珠穆朗玛峰的硬件和软件元素的进步都很重要。
“这是一个新的类别,但这不仅仅是使它成为新类别的芯片 - 它是芯片,软件,库甚至Web开发模式,”弗隆说。
“他们在软件堆栈中投入了很多,所谓的加速堆栈,使您能够更快地部署FPGA解决方案,因为它们基本上提供了一些标准化的库和工具和算法以及您可以拍摄和部署的IP块在你的FPGA上,“他说。
除了尚未指定的多芯SOC(芯片上的系统)外,Xlinx还表示珠穆朗玛峰将提供PCIe以及CCIX互连支持,多模以太网控制器,用于安全和电源管理的片上控制块,以及可编程I / O接口。它还包括不同类型的SERDES - 将并行数据转换为串行数据,反之亦然。具体来说,它将提供33Gbps NRZ(不返回为零),58Gbps PAM-4(脉冲幅度调制)和112G PAM-4 Serdes。通常,PAM机制提供比NRZ更多的带宽。
Xilinx表示,某些珠穆朗玛峰芯片还将提供高带宽存储器(HBM)或可编程ADC(模数转换)和DAC(数模计)转换器。
Xilinx表示,FPGA和ACAP之间的关键差异是NOC,它连接设备的各种子系统,例如多个处理器和I / O元素。到目前为止,FPGA没有系统级别的NOC,开发人员必须通过芯片的可编程逻辑基本上创建连接基础架构。“你仍然可以通过可编程逻辑编程子系统,但通常,您不会获得相同的性能特征,”彭说。
另一个关键元素是ccix。“革命是什么,它是缓存连贯的,”弗隆说。“首次,您将能够使用标准网络协议构建具有缓存相干加速器的系统,并且现在行业中的任何位置都不存在。”
CCIX是由CCIX联盟开发的一组规范,以解决缓存一致性问题,或者如何确保在尝试修改相同的内存空间或在陈旧的数据副本时不发生冲突,以确保不同的CPU不会发生冲突。
珠穆朗玛峰的一个大目标是ai。没有人希望珠穆朗玛峰与英特尔CPU和NVIDIA GPU背后的纯马力竞争,这些机器正在习惯于“培训”Terabyte-Size数据集,以便在猛犸,100级深,机器学习神经网络中工作。
但是,珠穆朗玛峰的适应性,如传统的FPGA,使其成为“推理”,或实际上将神经网络用于现实生活中的恐惧票据。这是因为应该以最少量的精度处理神经网络的每个级别,以节省时间和能量。与具有固定精度的CPU不同,FPGA可以编程为处理每个级别的神经网络,一旦其构建,适合该层的最小精度。
虽然Xilinx说其主要目标是数据中心,边缘设备和物联网可能最终是珠穆朗玛峰闪耀的地方。机器学习应用程序将越来越结合到边缘设备中,这是相对于大型服务器极其电压的设备,使其成为FPGA的理想候选者。
Microsoft是第一个主要的云提供商宣布为其公共云基础设施部署FPGA的部署,去年给了筹码对AI的使用充满信心的大投票,宣布它将利用FPGA的项目脑波深度学习平台。它正在使用来自Xilinx的克里斯特,英特尔/ Altera的Stratix 10 FPGA,但这仍然有助于水泥使用FPGA来实现AI推理的想法。
Xilinx与英特尔之间的持续竞争将在公司转向较小的制造过程技术时发挥作用。英特尔已经宣布使用英特尔10NM制造技术建造的FPGA代码名为Falcon Mesa,其中一些行业内部人员表示将为TSMC的7nm工艺提供等效的晶体管密度。
珠穆朗玛峰和可能是2019年福尔康的猎鹰梅萨,看起来像FPGA - 或在Xilinx的情况下,CAAP - 将在计算趋势中发挥比他们所拥有的更重要的作用。