什么是深度学习？这篇文章说透了！ • 《从零学AI指南手册》

更新于 2026年6月28日

1. 什么是深度学习？#

结构定义：深度学习通常指网络层数大于 2 的深度神经网络（DNN）。它由输入层、多个隐藏层（也称隐含层）和输出层组成。
核心机制：在这些网络中，如果某一层每个神经元的输入都完全依赖于前一层所有神经元的输出，则称为全连接层。
处理流程：深度学习将原始特征通过多层神经网络进行抽象特征提取，然后再将提取到的特征输入到最后一层进行回归或分类等任务处理。

2. 为什么要“深度”？#

“深度”不仅仅是层数的堆叠，其背后的核心逻辑在于提升模型的表达能力和自动化水平：

实现自动特征提取：深度学习最核心的目的就是特征提取。在传统的机器学习中，特征通常需要人工设计（特征工程），这受限于人类的解释能力且难以处理高维数据（如像素）。深度学习将这一过程交给模型，让网络自己去提取特征。
从具体到抽象的层级表征：在多层网络中，越靠近输入层的隐藏层提取的特征越具体，而越靠后的隐藏层提取的特征越抽象。例如在图像识别中，浅层可能识别边缘，深层则能识别复杂的物体轮廓。
增强模型表达能力（非线性变换）：如果只是简单的线性层堆叠，无论多少层最终都只能简化为一个线性回归模型。通过在层与层之间引入非线性激活函数（如 Sigmoid, ReLU），“深度”结构能让模型捕捉到极其复杂的非线性映射关系，而不会退化为简单的线性组合。
性能突破：大量的研究实验表明，深层次的特征提取所取得的效果要远远好于浅层网络。深度网络能够提供更为丰富和高级的特征表示，从而显著提高下游任务（如分类或生成）的精度。

深度学习通过“深度”结构实现了对复杂数据特征的层级化、抽象化提取，解决了传统方法难以处理复杂非线性问题的瓶颈。

阅读 --