PyTorch深度学习框架基础——实现循环神经网络，并解析

yuyutoo 2025-03-06 21:01 12 浏览 0 评论

使用PyTorch实现一个简单的循环神经网络（Recurrent Neural Network, RNN），并对代码进行详细解析。

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import numpy as np

# 示例数据
X = np.array([
    [1, 2, 3, 4, 5],
    [5, 4, 3, 2, 1],
    [2, 3, 4, 5, 6],
    [6, 5, 4, 3, 2]
], dtype=np.float32)

y = np.array([0, 1, 0, 1], dtype=np.float32)

X_tensor = torch.tensor(X)
y_tensor = torch.tensor(y, dtype=torch.long)

dataset = TensorDataset(X_tensor, y_tensor)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

class SimpleRNN(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, num_classes):
        super(SimpleRNN, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        
        self.embedding = nn.Embedding(input_size, hidden_size)
        self.lstm = nn.LSTM(hidden_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, num_classes)
        
    def forward(self, x):
        embedded = self.embedding(x)
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        out, (hn, cn) = self.lstm(embedded, (h0, c0))
        out = out[:, -1, :]
        out = self.fc(out)
        return out

# 超参数
input_size = 10  # 词汇表大小
hidden_size = 128
num_layers = 2
num_classes = 2  # 二分类

model = SimpleRNN(input_size, hidden_size, num_layers, num_classes)

criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
num_epochs = 20
for epoch in range(num_epochs):
    for inputs, labels in dataloader:
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
    
    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

代码解析

数据准备部分

数据创建：创建了一个简单的数据集，其中每个输入序列由5个整数组成，对应的标签为0或1。
张量转换：将NumPy数组转换为PyTorch张量，以便进行后续的计算。
数据集和数据加载器：使用TensorDataset和DataLoader将数据组织成批次，便于训练。

模型定义部分

嵌入层（Embedding Layer）：

nn.Embedding(input_size, hidden_size)：将输入的整数（词汇表中的索引）转换为向量表示。这里，input_size是词汇表的大小，hidden_size是嵌入向量的维度。

RNN层（LSTM）：

nn.LSTM(hidden_size, hidden_size, num_layers, batch_first=True)：使用LSTM作为RNN的实现。hidden_size是LSTM隐藏层的维度，num_layers是LSTM层的数量，batch_first=True表示输入和输出的张量第一个维度是批次大小。

全连接层（Fully Connected Layer）：

nn.Linear(hidden_size, num_classes)：将LSTM的输出映射到最终的分类结果。

前向传播：

嵌入：将输入序列中的每个整数转换为向量。
初始化隐藏状态和细胞状态：为LSTM初始化隐藏状态和细胞状态，均为全零张量。
LSTM前向传播：将嵌入后的序列输入到LSTM中，得到输出和最终的隐藏状态。
取最后一个时间步的输出：由于我们关注的是整个序列的表示，因此取LSTM输出的最后一个时间步的输出。
全连接层：将LSTM的输出通过全连接层，得到最终的分类结果。

训练部分

损失函数：使用交叉熵损失（nn.CrossEntropyLoss）进行分类任务的损失计算。
优化器：使用Adam优化器（optim.Adam）进行参数更新。
训练循环：遍历每个批次的数据。前向传播计算输出和损失。反向传播计算梯度。更新模型参数。每经过一个epoch，打印当前的损失。

注意事项

数据预处理：在实际应用中，输入数据需要进行适当的预处理，例如词汇表构建、序列填充等。
超参数调整：隐藏层大小、层数、学习率等超参数对模型性能有重要影响，需要根据具体任务进行调整。
模型评估：训练完成后，需要在验证集或测试集上评估模型性能，以防止过拟合。

pytorch

上一篇：PyTorch官宣:告别CUDA，GPU推理迎来Triton加速新时代,
下一篇：PyTorch深度学习框架进阶——模型部署

PyTorch深度学习框架基础——实现循环神经网络，并解析

代码解析

数据准备部分

模型定义部分

训练部分

注意事项

相关推荐

取消回复欢迎你发表评论:

前端面试:iframe 的优缺点? iframe有那些缺点

蓝导航是一个功能齐全、简洁便捷的导航网站

带斜线的表头制作好了，如何填充内容?这几种方法你更喜欢哪个?

漫学笔记之PHP.ini常用的配置信息

推荐7个模板代码和其他游戏源码下载的网址

其实模版网站在开发工作中很重要，推荐几个参考站给大家

[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗

正在学习使用python搭建自动化测试框架?这个系统包你可能会用到

【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)

setuphost.exe占用较高的CPU，可以这样修复它

PyTorch深度学习框架基础——实现循环神经网络，并解析

代码解析

数据准备部分

模型定义部分

训练部分

注意事项

相关推荐

取消回复欢迎 你 发表评论:

前端面试:iframe 的优缺点? iframe有那些缺点

蓝导航是一个功能齐全、简洁便捷的导航网站

带斜线的表头制作好了，如何填充内容?这几种方法你更喜欢哪个?

漫学笔记之PHP.ini常用的配置信息

推荐7个模板代码和其他游戏源码下载的网址

其实模版网站在开发工作中很重要，推荐几个参考站给大家

[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗

正在学习使用python搭建自动化测试框架?这个系统包你可能会用到

【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)

setuphost.exe占用较高的CPU，可以这样修复它

取消回复欢迎你发表评论: