Pytorch学习Day 5: 神经网络基础(nn.Module)学习课程
yuyutoo 2025-05-24 18:07 4 浏览 0 评论
学习目标
- 理解 PyTorch 中 nn.Module 类的作用和核心功能。
- 掌握如何使用 nn.Linear 构建简单的单层神经网络。
- 学会访问和打印神经网络的参数。
- 通过代码实践加深对 PyTorch 神经网络模块的理解。
术语解释
- nn.Module: PyTorch 中所有神经网络模块的基类,用于定义和管理网络层及其参数。 提供自动管理参数(如权重和偏置)、前向传播(forward 方法)等功能。 自定义网络时,通常继承 nn.Module 并实现 forward 方法。
- nn.Linear: 表示一个全连接层(线性层),执行线性变换:y = xW^T + b。 参数: in_features:输入特征数量。 out_features:输出特征数量。 bias:是否包含偏置(默认 True)。
- 参数(Parameters): 神经网络中可学习的权重和偏置,存储在 nn.Module 的 parameters() 方法中。 可通过优化器(如 torch.optim.SGD)进行更新。
- 前向传播(Forward Pass): 输入数据通过网络层计算输出的过程。 在 nn.Module 中通过定义 forward 方法实现。
学习内容
- 理解 nn.Module 的核心功能: 自动管理网络层和参数。 提供 parameters() 方法访问可学习参数。 实现 forward 方法定义前向传播逻辑。
- 使用 nn.Linear 构建单层网络: 创建一个简单的全连接层网络。 输入和输出维度自定义,模拟简单的线性变换。
- 打印网络参数: 使用 named_parameters() 或 parameters() 方法访问权重和偏置。 理解参数的形状和作用。
代码示例
以下是一个完整的代码示例,展示如何使用 nn.Module 和 nn.Linear 构建单层神经网络,并打印其参数:
python
import torch
import torch.nn as nn
# 定义一个单层神经网络
class SingleLayerNet(nn.Module):
def __init__(self, input_size, output_size):
super(SingleLayerNet, self).__init__()
# 定义一个线性层
self.linear = nn.Linear(input_size, output_size)
def forward(self, x):
# 前向传播:通过线性层
return self.linear(x)
# 设置随机种子以确保结果可复现
torch.manual_seed(42)
# 定义输入和输出维度
input_size = 3
output_size = 2
# 实例化网络
model = SingleLayerNet(input_size, output_size)
# 打印网络结构
print("网络结构:")
print(model)
# 打印网络参数
print("\\n网络参数:")
for name, param in model.named_parameters():
print(f"层:{name} | 参数形状:{param.shape} | 参数值:\\n{param.data}")
# 创建一个示例输入张量
x = torch.randn(1, input_size) # 批量大小=1,输入维度=3
print(f"\\n输入张量:{x}")
# 前向传播
output = model(x)
print(f"输出张量:{output}")
代码输出(示例):
网络结构:
SingleLayerNet(
(linear): Linear(in_features=3, out_features=2, bias=True)
)
网络参数:
层:linear.weight | 参数形状:torch.Size([2, 3]) | 参数值:
tensor([[ 0.3367, 0.1288, 0.2345],
[ 0.2303, -0.1227, 0.2467]])
层:linear.bias | 参数形状:torch.Size([2]) | 参数值:
tensor([-0.1818, 0.4817])
输入张量:tensor([[0.3367, 0.1288, 0.2345]])
输出张量:tensor([[0.4262, 0.4967]], grad_fn=<AddmmBackward0>)
代码解析:
- 模型定义:继承 nn.Module,在 init 中定义 nn.Linear 层,在 forward 中实现前向传播。
- 参数打印:使用 named_parameters() 遍历权重(linear.weight)和偏置(linear.bias),显示形状和值。
- 输入输出:创建随机输入张量,调用模型进行前向传播,得到输出。
任务
- 实现单层网络: 修改代码中的 input_size 和 output_size,观察参数形状的变化。 尝试禁用偏置(设置 bias=False),查看参数和输出的变化。
- 打印参数: 使用 model.parameters() 打印所有参数,比较与 named_parameters() 的差异。 手动访问 model.linear.weight 和 model.linear.bias,确认参数值。
- 扩展练习: 增加一个 nn.ReLU 激活函数到 forward 方法中,观察输出变化。 创建一个批量输入(例如 torch.randn(5, input_size)),运行前向传播,验证输出形状。
资源建议
- PyTorch 官方文档: nn.Module nn.Linear
- 教程: PyTorch 官方教程:Building Neural Networks 博客:Understanding nn.Module
- 视频资源: YouTube: Search for “PyTorch nn.Module tutorial” (如 Aladdin Persson 的 PyTorch 系列)。
后续学习建议
- 下一步可以学习多层神经网络(MLP),引入激活函数(如 ReLU)和损失函数。
- 探索 torch.optim 优化器,结合损失函数进行参数更新。
- 深入理解 nn.Sequential 简化网络构建。
通过本课程,你将掌握 nn.Module 和 nn.Linear 的基本用法,为构建更复杂的神经网络打下基础!
- 上一篇:内存问题探微
- 下一篇:「技术干货」一文搞懂Linux内核调试方法(二)
相关推荐
- Linux内核网络设备驱动
-
1.接收数据包过程概述介绍数据包收包过程,有助于我们了解Linux内核网络设备在数据收包过程中的位置,下面从宏观的角度介绍数据包从被网卡接收到进入socket接收队列的整个过程:加载网卡驱动,初...
- 「技术」一文带你掌握Linux字符设备架构
-
一、Linux设备分类Linux系统为了管理方便,将设备分成三种基本类型:...
- 「技术干货」一文搞懂Linux内核调试方法(二)
-
上篇回顾:一文Linux内核调试方法(一)...
- Pytorch学习Day 5: 神经网络基础(nn.Module)学习课程
-
学习目标理解PyTorch中nn.Module类的作用和核心功能。掌握如何使用nn.Linear构建简单的单层神经网络。学会访问和打印神经网络的参数。通过代码实践加深对PyTorch神...
- 内存问题探微
-
这篇文章是我在公司TechDay上分享的内容的文字实录版,本来不想写这么一篇冗长的文章,因为有不少的同学问是否能写一篇相关的文字版,本来没有的也就有了。说起来这是我第二次在TechDay上做的...
- 阿里架构师的5年经验总结:盘点数据仓库常用的4大数据工具平台
-
数据仓库是解决方案,真正落地的时候,还要依托于工具平台。...
- 软考系统架构师2021_备考说明---软考高级之系统架构师_备考笔记
-
第一轮一个半月.这些是考试内容.这个通过率全国,只有百分之10左右..挺难的....
- 从 Java 程序员到架构师:技术进阶与能力跃迁的完整路径(深度版)
-
#程序员如何进阶为架构师?#从Java程序员到架构师:技术进阶与能力跃迁的完整路径(深度版)...
- 大厂架构师被A1逼疯:我20年经验不如A1五分钟生成的方案
-
程序员末日?AI竟包办八成代码!前端真的凉了?...
- 立志成为架构师的你请收下——架构设计的三种思维
-
软件架构的几个误区1.架构的目标即灵活性灵活性越好的架构越能适应未来变化的需要,但不是架构设计的目标,一味追求容易陷入另外一个坑,造成性能的损失和资源的浪费。2.一套成熟的开源框架就是架构框...
- 系统架构师之——软件开发方法
-
不管你是开发人员,还是互联网行业人员,基本上经常看到各种各样的软件相关的图,如什么架构图什么设计图什么模式图甘特图等。很多时候总是傻傻分不清。对此,我们很有必要对系统开发基础知识有认知。对于一名程序员...
- 系统分析师和系统架构师的区别是什么?
-
软考高级包括系统分析师、信息系统项目管理师、网络规划设计师、系统架构设计师和系统规划与管理师,其中,系统分析师和系统架构师这两个科目是大家很容易搞混淆的,因为都属于软考,所以他们的报考时间、报考条件都...
- 软件开发 “四高”的详细分析——高扩展
-
高并发架构的黄金法则:用“分治异步”玩转每秒10万+请求弹性架构:像搭乐高一样扩展你的系统杰夫·贝索斯曾说:“架构不是设计出来的,而是演化出来的。”高并发系统的核心在于...
- 复习七天通过软考高级系统架构师
-
前言软考复习的方式可以分为两种:报班和自学。首先晒一下成绩,开心的一批,虽然考的不是很好!!每科满分75,需要同时都>=45分才算合格。...
- 软件开发 “四高”的详细分析,即高并发、高性能、高扩展、高可用
-
高并发(HighConcurrency)是互联网分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计保证系统能够同时并行处理很多请求。高并发相关常用的一些指标有响应时间(ResponseT...
你 发表评论:
欢迎- 一周热门
-
-
前端面试:iframe 的优缺点? iframe有那些缺点
-
带斜线的表头制作好了,如何填充内容?这几种方法你更喜欢哪个?
-
漫学笔记之PHP.ini常用的配置信息
-
其实模版网站在开发工作中很重要,推荐几个参考站给大家
-
推荐7个模板代码和其他游戏源码下载的网址
-
[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗
-
正在学习使用python搭建自动化测试框架?这个系统包你可能会用到
-
织梦(Dedecms)建站教程 织梦建站详细步骤
-
【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)
-
2024PHP在线客服系统源码+完全开源 带详细搭建教程
-
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)