资源描述:
深度学习在图像识别中的应用
1目录CONTENTS图像识别概述1人工神经网络与深度学习2卷积神经网络3LeNet-54结束语52
2图像识别概述13
3图像识别图像识别也就是图像的模式识别,是模式识别技术在图像领域中的具体应用,是对输入的图像信息建立图像识别模型,分析并提取图像的特征,然后建立分类器,根据图像的特征进行分类识别的一种技术。4
4图像识别预处理,指将训练或者测试的图像进行一定的处理,使得它更加清晰或者更加适合算法要求。常见的预处理手段包括去噪处理、图像增强、归一化。特征提取。分类器无法识别像素级别的浅层信号,只能识别高层信号从训练数据中提取“有用的”高层信号(特征)识别分类,指算|法通过一定的训练后,形成一个分类标准,可以将测试集中的待识别图像归为某一类的过程。。5
5图像识别的应用在军事领域,无人机侦探,导弹精确打击,军事目标锁定,雷达警戒系统等在公共安全领域,机场安检,恐怖分子搜查,公共交通安全,车牌定位,目标追踪等,在农业领域,物种识别,产品营养成分分析,农作物病情分析等在日常生活中,门禁系统的人脸识别、视网膜扫描、指纹扫描等。6
6图像识别的常用方法贝叶斯分类法模板匹配法核方法集成学习方法人工神经网络法(ANN)7
7人工神经网络与深度学习28
8人脑识别的过程人脑是通过分级的、多层网络模型来识别减少数据量,保留物体的有用信息9
9ANN的发展史1943年,Mc|culloch和Pitts提出了神经元的数学模型,奠定基础;1958年,Rosenblatt提出了感知机模型,首次把人工神经网络的研究从理论探讨付诸工程实践;1969年,Minskyh《感知机》指出当前的网络只能应用于简单的线性问题,却不能有效地应用于多层网络,低潮;1982年,美国物理学家Hopfield博士提出了Hopfield模型理论,他证明了在一定条件下,网络可以达到稳定的状态。在他的影响下,神经网络得以复兴;80、90年代,提出BP算法、CNN;2006年,Hinton提出了一种深度神经网络参数的训练算法,在物体识别、图像分类、语音识别等领域取得了突破性进展,开启了深度学习在学术界和|工业界的浪潮。10
10人工神经网络与深度学习深度学习的概念源于人工神经网络的研究,是机器学习的分支;机器学习的发展经历了浅层学习和深度学习两次浪潮浅层学习,通常包含一层或两层的非线性特征变换,可以看成是具有一层隐含层或者没有隐含层的结构。大多数传统的机器学习和信号处理技术,都是利用浅层结构的架构。例如高斯混合模型(GMMs)、支持向量机(SVMs)等都是浅层结构。深度学习,主要指超过三层的神经网络模型。11
11深度学习的现状深度学习在语音识别、图像识别等领域摧枯拉朽。12国际会议、期刊等涌现大量深度学习的文章,CNN被引入很多领域。知名高科技公司都在深度学习领域加大投入。
12深度学习对图像识别|的影响GoogleBrain项目,用16000个CPUCore的并行计算平台,创建了一个深度神经网络,仅通过YouTube视频学习到“猫”;2012年Hinton用DNN技术在图像识别方面取得惊人的成功,在著名的ImageNet问题上将错误率从26%降低到了15%,并且输入没有用到其他任何人工特征,仅仅是图像的像素。13
13深度学习深度学习是一种高效的特征提取方法深度是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。深度学习作为机器学习的一个分支,其学习方法可以分为无监督学习:深度信念网(DeepBeliefNetwork,DBN)监督学|习:卷积神经网络(ConvolutionalNeuralNerwork,CNN)14
14卷积神经网络(CNN)315
15CNN的由来卷积神经网络(CNN)是人工神经网络的一种,是多层感知机(MLP)的一个变种模型,它是从生物学概念中演化而来的。Hubel和Wiesel早期对猫的视觉皮层的研究中得知在视觉皮层存在一种细胞的复杂分布,这些细胞对于外界的输入局部是很敏感的,它们被称为“感受野”(细胞),它们以某种方法来覆盖整个视觉域。这些细胞就像一些滤波器一样,够更好地挖掘出自然图像中的目标的空间关系信息。视觉皮层存在两类相关的细胞,S细胞(SimpleCell)和C(ComplexCell)细胞。|S细胞在自身的感受野内最大限度地对图像中类似边缘模式的刺激做出响应,而C细胞具有更大的感受野,它可以对图像中产生刺激的模式的空间位置进行精准地定位。16
16CNN概述卷积神经网络已成为当前语音分析和图像识别领域的研究热点。80年代末,YannLeCun就作为贝尔实验室的研究员提出了卷积网络技术,并展示如何使用它来大幅度提高手写识别能力。目前来看,在图像识别领域,CNNs已经成为一种高效的识别方法17
17CNN的三个基本概念局部感受野(localreceptivefields)共享权重(sharedweights)池化(pooling)18
18局部感受野图像的空间联系是局部的,就像人通过局部的感|受野去感受外界图像一样,每个神经元只感受局部的图像区域,然后在更高层,将这些感受不同局部的神经元综合起来就可以得到全局的信息了。CNN中相邻层之间是部分连接,也就是某个神经单元的感知区域来自于上层的部分神经单元。19
19局部感受野20
20局部感受野21
21卷积特征增强,降低噪声a1=σ(b+w*a0)卷积核跨距22
22共享权重隐层的参数个数和隐层的神经元个数无关,只和滤波器的大小和滤波器种类的多少有关。23
23特征图(FeatureMap)提取不同的特征,需要多个滤波器。每种滤波器的参数不一样,表示它提出输入图像的不同特征。这样每种滤波器去卷积图像就得到对图像的不同特征的反映,我们称之为Fea|tureMap。100种卷积核就有100个FeatureMap。这100个FeatureMap就组成了一层神经元。24
24池化常见的方法:最大值池化(max-pooling)L2池化(L2poolin