ISDF2016经典之B6:使用OpenCL的高效加速
ISDF2016经典之B6:使用OpenCL的高效加速参考链接:
https://www.altera.com.cn/events/asia/altera-soc-developers-forum/isdf-content.html
全部经典内容包括:
K系列的主题演讲(K1~K3);
A系列的硬件主题(A1~A12);
B系列的软件主题(B1~B10)。
B6指的是软件主题6。
20161108 ISDF 2016,北京
Intel公司Frank Chen
软件主题 37’50’’
下载视频链接:
视频文件:b6.Power-Efficient-Acceleration-using-OpenCL-Frank-Chen-of-Intel-Low.mp4
下载链接:https://www.altera.com.cn/content/dam/altera-www/global/zh_CN/video/ISDF2016-Beijing/b6.Power-Efficient-Acceleration-using-OpenCL-Frank-Chen-of-Intel-Low.mp4
演示文档说明
b3-ts5-sw-100.pdf
TS05-SW
System Software Architectures for Hardware/Software Co-development
本文档涵盖内容:
B6 使用OpenCL的高效加速 Power Efficient Acceleration using OpenCL™ (Frank Chen, Intel)
B7 SoC FPGA 在深度学习中的应用 (邬刚, 加速云 SpeedClouds)
00
(女声)首先呢,让我们来欢迎Intel PSG部门的Frank Chen。
它的主题是关于利用OpenCL进行加速的能效优势。
有请!
首先欢迎大家又回到现场,我今天给大家分享的一个是关于用OpenCL来如何来加速整个设计的这样一个过程。
我是来自Intel,我在Intel主要负责数据通信的解决方案,主要是FPGA相关的解决方案。
然后我们看今天的主题。
今天的主题有四个部分。
首先呢,我们要讨论一下说,既然我们是在FPGA上用OpenCL来解决问题,为什么FPGA适合于这样一个应用方向?
从硬件的角度,FPGA为什么能够做这些事情?
赞,,,,,,,,谢谢分享。。。。。。。。。。。。。:lol 感谢楼主分享OpenCL会越来越火的 01
第二个呢,我们讨论一下,FPGA从软件编程人员的角度来说,怎么样用FPGA?
从传统意义上来说,大家可能能感觉到,FPGA它本身更多地是硬件人员,或者说逻辑人员在使用。
总之说,我要完成一个电路设计,如果我是一个纯软件人员,我能不能从高层语言的角度,换一种方式,能不能也进行FPGA开发呢?
我们今天要回答这个问题。
第三个,我要简单介绍一下,是关于Intel FPGA SDK for OpenCL开发套件它的特性。
最后我给出几个例子,来展示一下OpenCL SDK在实际应用里面,它所表现出来的一些特性。
我们看第一个,为什么我们选择了FPGA?
说到FPGA比较适合的应用场景,我们看一下我们所面临的挑战和趋势。
从传统意义上来说,大家可能能感觉到,FPGA它本身更多地是硬件人员,或者说逻辑人员在使用。
总之说,我要完成一个电路设计,如果我是一个纯软件人员,我能不能从高层语言的角度,换一种方式,能不能也进行FPGA开发呢?
赞,,,,,,,,,,,,,,,谢谢分享。。。。。。。。。。。。。。。。。。:lol ISDF2016经典之B6:使用OpenCL的高效加速 02
增加功能和提高performance,是我们一贯的一个要求。
第二,现在的设备会产生海量的数据,它的数据增长是爆发性的。
第三,我们总是希望我们能够获取非常高的性能,又不想有更高的成本,增加功耗,或者是系统的尺寸。
最后,上市时间是我们做产品的一个压力。
接下来,我们来看一下,关于应用发展的一个趋势。
大家从这个图上可以看得到,有非常多各种不同的应用。
如果把它们归纳起来,它可以分成三个类型。
一个类型呢,我们称之为I/O敏感型,就是横轴这个方向。
03
另外一个方向就是Memory敏感型,纵轴这个方向。
还有一个方向,就是所谓的CPU敏感型,就是中间的这个方向。
这些方向,对于我们想升级我们的系统,能够获取更高的performance,它的挑战是什么呢?
从这个图上,我把表拿出来了。
大家可能会遇到,我要提高performance,我可能会遇到所谓的IO瓶颈。
数据传进来太慢,送出去太慢。
所谓的CPU的瓶颈,CPU可能没有足够的能力来计算这么多数据。
Memory的瓶颈,计算单元不可能很快地获取数据,或者我计算的数据不能够及时地存回。
所有的这一切,或者它的组合,都成为我们想提高系统performance所面临的一个挑战。