1 绪论
1.1 背景
现今, 随着计算机计算能力的提高, 在人工智能 (Artificial Intelligent,AI) 领域中, 深度学习的人工神经网络的算法慢慢崭露头角, 开始在不同的领域识别取得不错的准确率.
而且, 在我们日常生活中广泛应用. 如帮助医生进行武汉肺炎医学诊断影像, 移动人脸支付, 停车场车牌识别和犯罪嫌疑犯的人脸识别等等.
如今, 各类技术公司将深度学习成熟运用于我们生活方方面面当中, 科大讯飞公司的语言识别技术, 旷视 face++ 公司的人脸识别技术, Google 公司深度学习框架的开源和业界内大量人工智能的应用等等.
现今, 大量企业对于深度学习领域的人脸识别应用于智能家居安防, 春运期间人脸识别检验旅客的信息, 人脸识别购物反欺诈等等的应用, 逐渐获得社会的关注和大量的应用.
深度学习的有着悠久的历史, 随着可用准确的训练数据量的不断增加, 深度学习的方法变得高可靠.
而且, 随着科学技术的发展, 针对深度学习的计算机硬件基础设施, 如: 图像处理单元 (Graphics Processing Unit,GPU), 现场可编程门阵列(FPGA), 谷歌公司的张量处理器(Tensor Processing Unit,TPU) 等改善, 深度学习的模型的深度和规模也会随之得到拓展.
总结, 深度学习随着时间的推移, 已经可以解决日益复杂的应用, 模型的精度也得到提高.
在 1989 年 Yann Lecun 教授使用神经网络实现数字的识别[2];
1998 年 Yann Lecun 发布了 Lenet 的卷积神经网络 (CNNs) 用于手写数字识别的文章[3];
2009 年, imageNet 大型分类数据集发布;
2012 年, AlexNet 提出 GPU 训练的深度学习卷积神经网络, 并获得了 imageNet 冠军[4];
2014 年, GoogLeNet 使用 Inception 网络结构, 在 ImageNet 夺冠[5];
2015 年, ResNet 在 ILSVRC 冠军[6];
到了 2018 年, MobileNetV2[7]的提出.
对此, 卷积神经网络对于图像识别分类有着更高的精度.
1.2 国内外研究现状
近些年来, 随着计算机视觉计算的不断迭代更新, 计算机的硬件如 CPU,GPU 和 FPGA 等计算能力的提升, 图像识别的模型训练速度得到提升, 由此, 识别的准确率也有了很大的提升.
在国外, 手机移动端使用摄像头皮肤癌症检测对于采集的图像进行分类, 根据模型预测对应的皮肤疾病, 其识别的准确度才能保证协助医生更好的诊断病情, 提高疾病的查出率.
目前, 在国内外的人脸识别的应用使用比较广泛的方面, 主要有图像检索, 街道摄像头嫌疑犯的人脸查找, 出入境人脸身份的验证和人脸支付等.
随着 GPU 高效的运用在神经网络的训练的过程当中, 并行化处理每个神经元的参数, 对于高纬度的张量计算, 减少了训练模型的时间, 加快了每次调参数的时间, 最终提高了模型训练的准确度.
虽然, 基础理论结合高速率的计算机计算能力, 不断提升模型训练的精度和速率, 但是在实际应用当中, 随着应用场景的变化, 人脸识别的精确度也有挑战性的因素存在:
(1)模型训练集的选取, 使用多角度的人脸集, 不同表情的人脸集, 还是不同场景的人脸集等, 都会对人脸识别的模型造成训练的误差;
(2)实际的人脸识别的过程中, 识别环境的光线要求比较高, 对于在不同的环境光线对人脸识别系统的识别率要求比较高.
2 深度学习的领域
在计算机从层次化的概念体系当中学习并理解世界, 而层次化的概念让计算机构建比较简单的概念来学习, 达到学习复杂的概念, 对此建立在彼此之间的图, 可以不断学习等到层次更多的图, 由此得到这种方法为深度学习(Deep Learning,DL)[1].
人工智能属于一级专业的领域, 其涵括机器学习, 而神经网络因其迭代计算和网络结构深度被包括在深度学习的领域.
实际的工业级应用中, google 公司的 DeepMind 团队研发的 Alpa Go 系统因其深度学习系统在围棋领域战胜人类专业的选手李世石而名声大振.
深度学习的神经网络结构, 有 DNN 深度神经网络, CNNs 卷积神经网络, RNN 循环卷积网络等, 因其算法功能和实际应用的场景对应产生不同的神经网络.
图 2-1 深度学习的维恩图
由图 2-1 维恩图可知, 展现了深度学习不仅是一种表示学习, 还是一种机器学习, 可以用于大多数的人工智能的方法, 其中维恩图的每个部分都是 AI 技术的子集.
2.1 机器学习
机器学习是一个计算机程序在某类任务 T 和衡量 P 从经验 E 中自我完善, 如果它的表现在任务 T 通过 P 来衡量并通过经验 E 提高, 可以说计算机程序从 E 中学习.
机器学习又可以分为监督学习, 无监督学习, 半监督学习, 增强学习等不同的领域.
对应监督学习是需要用给定有标签的数据集进行训练, 训练出来的模型, 使用测试数据集进行测试, 得到的误差进行迭代测试, 最终将模型调试成得到的预测数与实际的数据误差更小的过程[7].
目的就是根据实际应用场景选择合适的学习方法, 然后使用对应的训练和测试数据集进行模型的构造.
图 2-2 监督学习过程
由图 2-2 可知, 监督学习过程是输入有标签的数据集, 使用对应的监督学习的算法进行机器学习模型的训练, 再使用数据输入进训练好的模型, 模型对数据集进行预测, 获得预测的数据整个流程.
因此, 这个思路在系统的构建可以灵活的应用[8].
2.2 深度学习
对于传统学习算法在对象识别方面的泛化预测能力不足, 深度学习算法由此得到一些发展.
深度学习因其神经网络结构的隐藏处理层的数量增加, 对于图片的分类的精度的提高, 而目前使用 GPU 并行化处理提高神经网络的训练速度, 因此可以被应用于图像分类.
深度学习因此应用于语言识别, 预测疾病, 模式识别等等的方面.
3 总结
最后通过思维导图, 总结一下什么是深度学习.
深度学习属于人工智能领域, 是一种机器学习的方法.
通过运用不同的神经网络, 可以运用于我们日常生活当中, 如: 语音识别, 人脸识别, 模式识别等等.
参考文献
- [1] Ian Goodfellow, Y Bengio,Aaron Courville. Deep learning[M]. Book in preparation for MIT Press,2016.
- [2] Y. LeCun. Generalization and Network Design Strategies[R].Technical Report CRG-TR-89-4,1989.
- [3] Y LeCun,L Bottou, Y Bengio, Pateick H. Gradient-Based Learning Applied to Document Recognition[J].Proc of the [3] IEEE,1998:7-8.
- [4] Alex Krizhevsky, I Sutskever, G E. Hinton. Imagenet classification with deep convolutional neural networks[J].In [4] NIPS,pp,2012:4-6.
[5] Christian Szegedy,Wei Liu,Yangqing Jia,Pierre Sermanet,Scott Reed,Dragomir Anguelov,Dumitru Erhan,Vincent Vanhoucke,Andrew Rabinovich. Going deeper with convolutions,2014.
[6]Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Deep Residual Learning for Image Recognition,2015.
[7]Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, Liang-Chieh Chen. MobileNetV2: Inverted Residuals and Linear Bottlenecks,2019.
来源: https://www.cnblogs.com/txkjai/p/12533283.html