集成电路技术分享 - Powered by Discuz! Archiver

fpga_wuhan 发表于 2016-8-19 10:17:46

基于FPGA加速机器学习算法

　AI因为其CNN（卷积神经网络）算法出色的表现在图像识别领域占有举足轻重的地位。基本的CNN算法需要大量的计算和数据重用，非常适合使用FPGA来实现。上个月，Ralph Wittig（Xilinx CTO Office的卓越工程师）在2016年OpenPower峰会上发表了约20分钟时长的演讲并讨论了包括清华大学在内的中国各大学研究CNN的一些成果。
　　在这项研究中出现了一些和CNN算法实现能耗相关的几个有趣的结论：

　　①限定使用片上Memory；

　　②使用更小的乘法器；

　　③进行定点匹配：相对于32位定点或浮点计算，将定点计算结果精度降为16位。如果使用动态量化，8位计算同样能够产生很好的结果。

　　在演讲中Wittig还提到了CNN相关的两款产品：CAPI-compatible Alpha DataADM-PCIE-8K5 PCIe加速卡和Auviz Systems提供的AuvizDNN（深度神经网络）开发库。

　　ADM-PCIE-8K5 PCIe加速卡

　　Alpha DataADM-PCIE-8K5 PCIe加速卡用于X86和IBM Power8/9数据中心和云服务，加速卡基于Xilinx Kintex UltraScale KU115 FPGA，支持Xilinx SDAcess基于OpenCL、C/C++的开发和基于Vivado HLx的HDL、HLS设计流程。
Alpha DataADM-PCIE-8K5 PCIe加速卡片上带32GB DDR4-2400内存（其中16GB含ECC），双通道SFP+支持双通道10G以太网接入。提供包括高性能PCIe/DMA在内的板级支持包（BSP）、OpenPOWER架构的CAPI、FPGA参考设计、即插即用的O/S驱动和成熟的API等设计资源。

　　AuvizDNN开发库

　　深度学习技术使用大量的已知数据来找出一组权重和偏置值来匹配预期结果。处理被称之为训练，训练的结果是大量的模型，这一事实促使工程师们寻求使用GPU之类的专用硬件来进行训练和分类计算。

　　随着未来数据量的巨幅增长，机器学习将会搬到云端完成。这样就急需一种既可以加速算法，又不会大规模增加功耗的处理平台，在这种情况下，FPGA开始登场。

　　随着一些列的先进开发环境投入使用，软件开发工程师将他们的设计在Xilinx FPGA上实现变得更加容易。Auviz Systems开发的AuvizDNN库为用户提供优化的函数接口，用户可以针对不同的应用创建自定义的CNN。这些函数可以方便的通过Xilinx SDAcess这样的集成开发环境调用。在创建对象和数据池后，就会调用函数创建每一个卷积层、然后是致密层，最后是 softmax层。

芙蓉王 发表于 2016-8-19 10:34:04

很有用，感谢

小舍YZ 发表于 2017-5-9 11:06:14

赞，，，，，，，，，，，，，，谢谢分享。。。。。。。。。。。。。。:)

fpga_feixiang 发表于 2017-5-9 11:55:22

"""学好FPGA，海阔天空，人生能有几回从事FPGA，天高菜鸟飞，电路任我构，把电路用语言描述出来，综合成逻辑关系，然后在芯片中利用已有的触发器和LUT构成实际电路，目前来说半定制FPGA芯片主要应用在军工领域较多，一些尖端科技领域，航天航空，以及日常通讯与图像处理算法，复杂工控FPGA也能得到很好应用，这就是FPGA的的本质。
钢铁石油在国家经济发展到一定程度，量就会减少，然后集成电路使用永远都在增加，随着中国的发展，集成电路将越来越发挥巨大作用，FPGA的前景一片大好。
学习技术的过程就是把脑海中的思想用语言表达出来，好的创意是编出好的程序的基石，多多扩大几自己专业知识背景，学习别人好的创意，这是如何学好FPGA的要领。
---札记(飞翔)""




"

逆战发表于 2017-5-10 09:20:05

谢谢分享！

zxopen08 发表于 2017-5-11 10:41:53

基于FPGA加速机器学习算法

zxopenljx 发表于 2021-1-24 11:15:30

基于FPGA加速机器学习算法

hellokity 发表于 2021-1-24 16:56:39

基于FPGA加速机器学习算法

zhangyukun 发表于 2021-1-24 17:38:08

基于FPGA加速机器学习算法

zxopenljx 发表于 2024-8-2 17:43:39

基于FPGA加速机器学习算法

页: [1]

fpga论坛|fpga设计论坛's Archiver

基于FPGA加速机器学习算法