深度学习笔记-深度学习基础(1)

神经网络的数学基础

初识神经网络

主要内容包括神经网络介绍、数据表示、张量的操作、常见的向量数据、张量运算。

神经网络的核心组件是层，大多数深度学习都是将简单的层链接起来，从而实现渐进式的数据蒸馏。深度学习模型就像是数据处理的筛子，包含一系列越来越精细的数据过滤器（即层）。

模型编译时，需要三个参数：

数据存储在多维Numpy数组中，也叫张量(tensor)，它是一个数据容器，是矩阵向任意维度的推广，张量的维度通常叫做轴（axis）。

顾名思义，仅包含一个数字

数字组成的数组叫一维张量，仅有一个轴。有5个元素的向量被称为5D向量，但仍然叫做1D张量。

同list切片

随机是指每批数据都是随机抽取的

**SGD ** 小批量SGD 每次取一批数据；真SGD 每次只抽取一个样本；批量SGD 每次迭代所有数据（每次更新都更加精确，但是计算代价也会很高）

优化器 计算下一次权重更新时，考虑上一次权重更新。如带动量的SGD、Adagrad、RMSProp。动量解决了SGD的两个问题：收敛速度和局部极小点。动量的方法实现过程类似于移动小球，不仅要考虑当前的加速度，还要考虑之前的累加的速度。

仿射变换、旋转、缩放等基本的几何操作等都可以理解为张量运算。神经网络可以解释为在高维空间中非常复杂的几何变换。

例子：想象有两张彩纸：一张红色，一张蓝色。将两张纸叠在一起揉成小球。这个皱巴巴的纸球就是输入的数据，每张纸对应于分类问题的一个类别（三维空间中无法准确分开）。神经网络要做的就是找到可以让纸秋恢复平整的变换，从而能够再次让两个类别明确可分。（变换为高维空间上的两张纸）

让纸球恢复平整就是机器学习的内容：为复杂的、高度折叠的数据流形找到简洁的表示。