解决PyTorch CNN训练循环无法结束问题

在使用PyTorch进行CNN图像处理时，您可能会遇到训练循环无法结束的问题。这篇文章将探讨这个问题的常见原因，并提供解决方案。

问题描述

您可能写了如下代码来训练您的CNN模型：pythonnum_epochs = 10for epoch in range(num_epochs): model.train() running_loss = 0.0 #for images, labels in train_loader: for batch_idx, (images, labels) in enumerate(train_loader): images = images.to(device) labels = labels.to(device) optimizer.zero_grad() outputs = model(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() epoch_loss = running_loss / len(train_loader) print(f'Epoch {epoch+1}/{num_epochs}, Loss: {epoch_loss:.4f}')

这段代码看起来没有问题，但循环可能无法按预期结束。

原因分析

问题在于代码的缩进。print 语句的缩进级别与内层 for 循环相同，导致它在每个批次结束后都会执行，而不是在每个epoch结束后执行。

解决方案

要解决这个问题，只需将 print 语句的缩进调整到与外层 for 循环相同：pythonnum_epochs = 10for epoch in range(num_epochs): model.train() running_loss = 0.0 for batch_idx, (images, labels) in enumerate(train_loader): images = images.to(device) labels = labels.to(device) optimizer.zero_grad() outputs = model(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() epoch_loss = running_loss / len(train_loader) print(f'Epoch {epoch+1}/{num_epochs}, Loss: {epoch_loss:.4f}')

这样，print 语句只会在每个 epoch 结束后执行一次，循环也会按预期结束。

总结

在编写 PyTorch 代码时，请务必注意代码的缩进。缩进错误会导致代码逻辑错误，难以调试。