|
本帖最后由 lcytms 于 2017-7-25 09:21 编辑
CNN 性能指标评测
自 2010 年以来,Stanford Vision Lab 便开始举办 ImageNet Large Scale Visual Recognition Challenge(ILSVRC)比赛。
参赛者需开发一款 CNN 算法对包含数百 万个图像或视频剪辑的数据集中的对象进行分析和分类。
相比之前的算法,2012 年 的获奖算法 AlexNet* [2] 在降低分类错误率方面实现了巨大飞跃。[3]
2014 年的获奖 算法(GoogLeNet*)进行了相应改进,能够进一步降低错误率。[4]
英特尔开发了一 种新型设计来实施经过修改的性能指标评测算法,从而提升基于英特尔 FPGA 的CNN 运算性能。
CNN 算法包括一系列运算或层级。
例如,AlexNet 算法包括:
• 卷积层,负责在 3D 数据阵列(称为特征图谱)和 3D 滤波器上实施卷积运算。
该运 算将修正线性单元(ReLU)用作激活函数。
• 跨通道局部响应归一化层,负责按一个因子对特征图谱元素进行扩展,该系数是邻近 通道中与归一化中元素处于相同位置的元素的函数。
• 最大值池化层,负责读取 2D 窗口中的数据,并输出最大值。
• 全连接层,负责实施特殊的卷积函数,其中每个节点连接至上 一层的每个节点。
借助扁平化滤波器,输出可表示为扁平化版 本(2D)输出特征图谱的矩阵点积。
• softmax 层,负责使用 softmax 函数(归一化指数函数)对输 入特征图谱值进行归一化处理。
该层可输出 1,000 个元素的矢 量,可能包含属于原始ILSVRC 图像集中 1,000 个可能类别中 的一个的概率。
GoogLeNet 包含卷积、池化和 softmax 层,以及不同配置的 inception层组成。
图 1. Alexnet 算法层
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?我要注册
x
|