首页技术总结正文内容

深度学习概述

技术总结

更新时间：2024-12-23 03:50:10 31

admin 管理员组

文章数量: 887021

2023年12月16日发(作者：vb是什么游戏)

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。

同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分．不同的学习框架下建立的学习

模型很是不同．例如，卷积神经网络（Convolutional neural networks，简称CNNs）就是一种深度的监督学习下的机器学习模型，而深度置信网（Deep

Belief Nets，简称DBNs）就是一种无监督学习下的机器学习模型。

1简介

2基础概念

▪ 深度

▪ 解决问题

3核心思想

4例题

5转折点

6成功应用

1简介

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。[2]

深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能。[2]

2基础概念

深度：从一个输入中产生一个输出所涉及的计算可以通过一个流向图(flow

graph)来表示：流向图是一种能够表示计算的图，在这种图中每一个节点表示一个基本的计算并且一个计算

深度学习的值(计算的结果被应用到这个节点的孩子节点的值)。考虑这样一个计算集合，它可以被允许在每一个节点和可能的图结构中，并定义了一个函数族。输入节点没有孩子，输出节点没有父亲。

这种流向图的一个特别属性是深度(depth)：从一个输入到一个输出的最长路径的长度。

传统的前馈神经网络能够被看做拥有等于层数的深度(比如对于输出层为隐层数加1)。SVMs有深度2(一个对应于核输出或者特征空间，另一个对应于所产生输出的线性混合)。[3]

解决问题：

需要使用深度学习解决的问题有以下的特征：

深度不足会出现问题。

人脑具有一个深度结构。

认知过程逐层进行，逐步抽象。

深度不足会出现问题

在许多情形中深度2就足够表示任何一个带有给定目标精度的函数。但是其代价是：图中所需要的节点数(比如计算和参数数量)可能变的非常大。理论结果证实那些事实上所需要的节点数随着输入的大小指数增长的函数族是存在的。

我们可以将深度架构看做一种因子分解。大部分随机选择的函数不能被有效地表示，无论是用深的或者浅的架构。但是许多能够有效地被深度架构表示的却不能被用浅的架构高效表示。一个紧的和深度的表示的存在意味着在潜在的可被表示的函数中存在某种结构。如果不存在任何结构，那将不可能很好地泛化。

大脑有一个深度架构

例如，视觉皮质得到了很好的研究，并显示出一系列的区域，在每一个这种区域中包含一个输入的表示和从一个到另一个的信号流(这里忽略了在一些层次并行路径上的关联，因此更复杂)。这个特征层次的每一层表示在一个不同的抽象层上的输入，并在层次的更上层有着更多的抽象特征，他们根据低层特征定义。

需要注意的是大脑中的表示是在中间紧密分布并且纯局部：他们是稀疏的：1%的神经元是同时活动的。给定大量的神经元，仍然有一个非常高效地(指数级高效)表示。

认知过程逐层进行，逐步抽象

人类层次化地组织思想和概念；

人类首先学习简单的概念，然后用他们去表示更抽象的；

工程师将任务分解成多个抽象层次去处理；

学习/发现这些概念(知识工程由于没有反省而失败？)是很美好的。对语言可表达的概念的反省也建议我们一个稀疏的表示：仅所有可能单词/概念中的一个小的部分是可被应用到一个特别的输入(一个视觉场景)。

3核心思想

深度学习的核心思想

把学习结构看作一个网络，则深度学习的核心思路如下：

①无监督学习用于每一层网络的pre-train；

②每次用无监督学习只训练一层，将其训练结果作为其高一层的输入；

③用自顶而下的监督算法去调整所有层

4例题

a). AutoEncoder

最简单的一种方法是利用人工神经网络的特点，人工神经网络（ANN）本身就是具有层次结构的系统，如果给定一个神经网络，我们假设其输出与输入是相同的，然后训练调整其参数，得到每一层中的权重，自然地，我们就得到了输入I的几种不同表示（每一层代表一种表示），这些表示就是特征，在研究中可以发现，如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度，甚至在分类问题中比目前最好的分类算法效果还要好！这种方法称为AutoEncoder。当然，我们还可以继续加上一些约束条件得到新的Deep Learning方法，如如果在AutoEncoder的基础上加上L1的Regularity限制（L1主要是约束每一层中的节点中大部分都要为0，只有少数不为0，这就是Sparse名字的来源），我们就可以得到Sparse AutoEncoder方法。

b). Sparse Coding

如果我们把输出必须和输入相等的限制放松，同时利用线性代数中基的概念，即O = w1*B1 + W2*B2+....+ Wn*Bn， Bi是基，Wi是系数，我们可以得到这样一个优化问题：

Min |I - O|

通过求解这个最优化式子，我们可以求得系数Wi和基Bi，这些系数和基础就是输入的另外一种近似表达，因此，可以用它们来特征表达输入I，这个过程也是自动学习得到的。如果我们在上述式子上加上L1的Regularity限制，得到：

Min |I - O| + u*(|W1| + |W2| + ... + |Wn|)

这种方法被称为Sparse Coding。

c) Restrict Boltzmann Machine (RBM)

假设有一个二部图，每一层的节点之间没有链接，一层是可视层，即输入数据层（v)，一层是隐藏层(h)，如果假设所有的节点都是二值变量节点（只能取0或者1值），同时假设全概率分布p(v, h)满足Boltzmann 分布，我们称这个模型是Restrict Boltzmann Machine (RBM)。下面我们来看看为什么它是Deep

Learning方法。首先，这个模型因为是二部图，所以在已知v的情况下，所有的隐藏节点之间是条件独立的，即p(h|v) =p(h1|v).....p(hn|v)。同理，在已知隐藏层h的情况下，所有的可视节点都是条件独立的，同时又由于所有的v和h满足Boltzmann 分布，因此，当输入v的时候，通过p(h|v) 可以得到隐藏层h，而得到隐藏层h之后，通过p(v|h) 又能得到可视层，通过调整参数，我们就是要使得从隐藏层得到的可视层v1与原来的可视层v如果一样，那么得到的隐藏层就是可视层另外一种表达，因此隐藏层可以作为可视层输入数据的特征，所以它就是一种Deep Learning方法。

如果，我们把隐藏层的层数增加，我们可以得到Deep Boltzmann Machine

(DBM)；如果我们在靠近可视层的部分使用贝叶斯信念网络（即有向图模型，当然这里依然限制层中节点之间没有链接），而在最远离可视层的部分使用Restrict Boltzmann Machine，我们可以得到Deep Belief Net （DBN）。

当然，还有其它的一些Deep Learning 方法。总之，Deep Learning能够自动地学习出数据的另外一种表示方法，这种表示可以作为特征加入原有问题的特征集合中，从而可以提高学习方法的效果，是业界的研究热点。

5转折点

2006年前，尝试训练深度架构都失败了：训练一个深度有监督前馈神经网络趋向于产生坏的结果(同时在训练和测试误差中)，然后将其变浅为1(1或者2个隐层)。

2006年的3篇论文改变了这种状况，由Hinton的革命性的在深度信念网(Deep Belief Networks, DBNs)上的工作所引领：

Hinton, G. E., Osindero, S. and Teh, Y.,A fast learning algorithm for

deep belief Computation 18:1527-1554, 2006

Yoshua Bengio, Pascal Lamblin, Dan Popovici and Hugo

Larochelle,Greedy LayerWise Training of Deep Networks, in J. Platt et al.

(Eds), Advances in Neural Information Processing Systems 19 (NIPS 2006),

pp. 153-160, MIT Press, 2007

Marc’Aurelio Ranzato, Christopher Poultney, Sumit Chopra and Yann

LeCun Efficient Learning of Sparse Representations with an Energy-Based

Model, in J. Platt et al. (Eds), Advances in Neural Information Processing

Systems (NIPS 2006), MIT Press, 2007

在这三篇论文中以下主要原理被发现：

表示的无监督学习被用于(预)训练每一层；

在一个时间里的一个层次的无监督训练，接着之前训练的层次。在每一层学习到的表示作为下一层的输入；

用有监督训练来调整所有层(加上一个或者更多的用于产生预测的附加层)；

DBNs在每一层中利用用于表示的无监督学习RBMs。Bengio et al paper 探讨和对比了RBMs和auto-encoders(通过一个表示的瓶颈内在层预测输入的神经网络)。Ranzato et al paper在一个convolutional架构的上下文中使用稀疏auto-encoders(类似于稀疏编码)。Auto-encoders和convolutional架构将在以后的课程中讲解。

从2006年以来，大量的关于深度学习的论文被发表。

6成功应用

1、计算机视觉

ImageNet Classification with Deep Convolutional Neural Networks,

Alex Krizhevsky, Ilya Sutskever, Geoffrey E Hinton, NIPS 2012.

Learning Hierarchical Features for Scene Labeling, Clement Farabet,

Camille Couprie, Laurent Najman and Yann LeCun, IEEE Transactions on

Pattern Analysis and Machine Intelligence, 2013.

Learning Convolutional Feature Hierachies for Visual Recognition,

Koray Kavukcuoglu, Pierre Sermanet, Y-Lan Boureau, Karol Gregor,

Michaël Mathieu and Yann LeCun, Advances in Neural Information

Processing Systems (NIPS 2010), 23, 2010.

2、语音识别

微软研究人员通过与hintion合作，首先将RBM和DBN引入到语音识别声学模型训练中，并且在大词汇量语音识别系统中获得巨大成功，使得语音识别的错误率相对减低30%。但是，DNN还没有有效的并行快速算法，很多研究机构都是在利用大规模数据语料通过GPU平台提高DNN声学模型的训练效率。

在国际上，IBM、google等公司都快速进行了DNN语音识别的研究，并且速度飞快。

国内方面，阿里巴巴，科大讯飞、百度、中科院自动化所等公司或研究单位，也在进行深度学习在语音识别上的研究。

3、自然语言处理等其他领域

很多机构在开展研究，但深度学习在自然语言处理方面还没有产生系统性的突破。

本文标签：学习深度表示

版权声明：本文标题：深度学习概述内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1702721268h428043.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

深度学习概述

更多相关文章

最新深度学习环境搭建：win10+Anaconda+PyCharm+python3.7+tensorflow-gpu1.15+keras2.3.1+CUDA10.0+CUDNN7.6.5

win10下基于python（anaconda）安装gpu版本的TensorFlow以及kears深度学习框架

win10+ubuntu18.04双系统+cuda10+cudnn7.4+tensorRT5深度学习环境

深度学习环境搭建：win10+GTX1060 + tensorflow1.5+keras+cuda9.0+cudnn7

Tensorflow+SSD+Yolo（目标检测）文章1：深度学习环境搭建：win10+GTX1060 + tensorflow1.8.0+keras+cuda9.2+cudnn7.1.4

免费下载深度操作系统（deepin），三步快捷体验优秀国产操作系统

2022年7月25日 原Windows10安装深度Deepin系统，双系统安装成功

基于深度学习的人脸识别考勤系统设计

linux制作deepin启动盘制作工具,深度启动盘制作工具(Deepin Boot Maker)下载_深度启动盘制作工具(Deepin Boot Maker)官方下载-太平洋下载中心...

真正的深度清理c盘

Springboot集成ChatGpt获取短视频素材并利用深度学习把视频变为高清视频

深度解读ChatGPT：原理、应用与未来探索

重磅推荐：机器人行业深度报告

深度学习：智能时代的核心驱动力量

ubuntu20.04 安装、美化、办公环境搭建及深度学习开发环境搭建

深度linux u盘启动安装教程,国产系统Deepin Linux U盘安装教程，支持一下！

【操作系统实践】深度操作系统

深度技术GHOST WIN7 SP12013 新春版

deepin 安装office_Deepin深度操作系统安装及使用体验

Windows系统下安装深度学习Caffe软件及实现MATLAB调用的详细步

发表评论

推荐文章

AListFlutter（手机alist）——一键安装，可在手机电视上运行并挂载各个网盘

软文推广平台的效果跟内容和平台有很大的关系

低烟无卤电线的产品特点与应用

想要电脑一接通电源就自动开机？把这个开关打开就可以

windows系统盗版赔偿

热门文章

VMware Workstation Pro最新版17.6免费下载安装使用（官方正版，无需破解）

Axure中推动拉动元件不生效_Axure教程：苹果手机拨号原型

开机自启动脚本_使用xtu降低笔记本（游戏本）cpu电压及功耗·游戏本延时（以及试着解决开机自启动的问题）...

虚拟机中安装Ubuntu 20.04，Liunx系统的常用命令以及工具安装

不锈钢视镜行业头部企业市场占有率及排名调研报告

springboot2原理实战(16)

mysql substring 下标

电脑c盘清理软件，电脑c盘清理软件哪个好用

★★★HEU_KMS_Activator_v7.5 （附详细说明文档）

彻底禁止win10更新

最新文章

2022年7月25日原Windows10安装深度Deepin系统，双系统安装成功