第2章 基于卷积神经网络的图像复原方法基础
2.1 卷积层
在计算机视觉领域,输入图像的尺寸通常较大。手写字体识别模型LeNet是最早的卷积神经网络(Convolutional Neural Network, CNN)之一。相较于仅使用全连接层搭建的网络结构,LeNet通过巧妙的设计,利用卷积、池化等操作进行特征提取。其中,卷积层具有局部连接和权重共享的特点,避免了较高的计算成本,并在完成分类识别任务方面表现出色。使用PyTorch实现LeNet的示例代码如算法2-1所示,该算法展示了如何定义LeNet的结构、准备数据加载器、编译(在PyTorch中称为配置优化器)及训练模型。
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_40_1.jpg?sign=1738961372-0vJ7J1g3YHfmaeTXYprLS75T6yR6rDGd-0-abc5b587a11d4fccb571e63281616c07)
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_41_1.jpg?sign=1738961372-XbAwuKq2W8M2AJxG3XFRUWf1gt4sSdKZ-0-74b7de25bf5a5a0ae2f822b6774331be)
![](https://epubservercos.yuewen.com/FC5F35/31155506704132806/epubprivate/OEBPS/Images/48304_42_1.jpg?sign=1738961372-sgJZHC1kb8oqTRz5trhKdMYG1tRi8X4l-0-4a7d4a800f11781983021b6deeb74c36)
卷积层是卷积神经网络最重要的组成部分,其主要作用是自动学习和提取图像特征。卷积层包括一组滤波器(又称卷积核),通过对给定输入做卷积来生成输出特征图。