深度学习笔记-深度学习基础(0)

什么是深度学习

人工智能、机器学习与深度学习

主要内容包括基本概念、机器学习与深度学习的特点、机器学习简史。

符号主义人工智能 一些专家认为，只要程序员精心编写足够多的明确规则来处理知识，就可以实现与人类水平相当的人工智能。富豪注意人工智能适合解决定义明确的逻辑问题，比如下国际象棋，但是难以给出明确的规则来解决更加复杂、模糊的问题，比如图像分类、语音识别和机器翻译。

专家系统 在经典的程序设计中（即符号主义人工智能的范式）中，人们输入的是规则（即程序），和需要根据这些规则进行处理的数据，系统输出的是答案。

机器学习 利用机器学习，人们输入的是数据和从数据中预期得到的答案，系统输出的是规则。这些规则随后可应用于新的数据，并使计算机自主生成答案。

1562315412510

1562315692602

机器学习系统是训练出来的，而不是明确地用程序编写出来的。机器学习尤其是深度学习，是以工程为导向的，想法更多地是靠实践来证明，而不是靠理论推导。

机器学习三要素：

输入数据点
预期输出的示例
衡量算法效果好坏的方法

机器学习和深度学习的核心问题在于有意义地变换数据，在于学习输入数据的有用表示（representation），使得数据更接近预期输出。

学习机器学习中的学习指的是寻找更好数据表示的自动搜索过程。

机器学习技术定义 在预先定义好的可能性空间中，利用反馈信号的指引来寻找输入数据的有用表示。

深度学习 深度学习是机器学习的一个分支领域，强调从连续的层（layer）中进行学习，深度指的是一系列连续的表示层。可以将深度网络看作多级信息蒸馏操作：信息穿过连续的过滤器，其纯度越来越高（即对任务的帮助越来越大）。

深度学习技术定义 学习数据表示的多级方法。

1562316580866

深度学习工作原理

1562316662724

神经网络学习的意思是为神经网络的所有层找到一组权重值，使得该网络能够将每个示例输入与其目标值正确地一一对应。

损失函数（loss function）衡量输出与期望值之间的距离，也叫目标函数（objective function）。

优化器（optimizer）可以利用距离值作为反馈信号来对权重进行微调，以降低当前示例对应的损失值，这就是所谓的反向传播（back propagation）。

机器学习简史

概率建模

概率建模是统计学原理在数据分析中的应用，其中最有名的就是朴素贝叶斯算法和logistic回归。

早期神经网络

贝尔实验室于1989年第一次成功实现了神经网络的实践应用，将卷积神经网络的早期思想与反向传播算法相结合，应用于手写数字分类问题，即LeNet网络。

核方法

利用核函数（kernel funciton）计算映射到高维空间的数据中点对之间的距离，并在新的空间中找到良好的决策超平面。和函数通常是人为选择的，而不是从数据中学到的，对于SVM来说，只有分割超平面是通过学习得到的。

SVM通过两步来寻找决策平面：

将数据映射到一个高维表示，这时决策边界可以用一个超平面表示
尽量让超平面与每个类别最近的数据点间隔最大化，计算良好的决策边界

SVM在简单分类问题上表现出很好的性能，并且适用于严肃的数学分析；但是SVM很难扩展到大型数据集，并且在图像分类等感知问题上的效果也不好。

决策树、随机森林、梯度提升机

随机森林 将躲棵决策树的输出集成在一起。

梯度提升机 通过合并多个决策树来构建一个更为强大的模型，采用连续的方式构造树，每棵树都试图纠正前一棵树的错误。（XGBoost）

深度学习

特点

深度学习将特征工程完全自动化。
通过渐进的、逐层的方式形成越来越复杂的表示。
对中间的渐进表示共同进行学习。
扩展性强，可以并行计算。
多功能可复用，可以迁移学习，可以连续在线学习，模型可以用于其它用途。

算法改进

更好的激活函数
更好的权重初始化方案
更好的优化方案
有利于梯度传播的方法，批标准化、残差连接、深度可分离卷积