MNIST数据集下载、查看及JSON压缩指南

本指南将引导您完成以下步骤:

  1. 下载 MNIST 数据集
  2. 查看数据集实例
  3. 将数据集转换为 JSON 格式并压缩

以下是实现这些步骤的 Python 代码:

import torchvision.datasets as datasets
import gzip
import json

# 下载并加载 MNIST 训练集
train_dataset = datasets.MNIST(root='./data', train=True, download=True)

# 获取训练集的数据和标签
train_data = train_dataset.data
train_labels = train_dataset.targets

# 将数据转化为列表格式
data_list = []
for i in range(len(train_data)):
    data = train_data[i].tolist()
    label = train_labels[i].item()
    data_list.append({'image': data, 'label': label})

# 将数据保存为 JSON 文件
with open('mnist.json', 'w') as f:
    json.dump(data_list, f)

# 压缩 JSON 文件
with open('mnist.json', 'rb') as f_in:
    with gzip.open('mnist.json.gz', 'wb') as f_out:
        f_out.writelines(f_in)

代码说明:

  1. 首先,我们使用 torchvision.datasets.MNIST 函数下载 MNIST 训练集。
  2. 然后,我们将图像数据和标签分别存储在 train_datatrain_labels 变量中。
  3. 接下来,我们将数据转换为列表格式,其中每个样本都是一个包含 'image' 和 'label' 键的字典。
  4. 然后,使用 json.dump() 函数将数据列表保存为名为 'mnist.json' 的 JSON 文件。
  5. 最后,我们使用 gzip 模块压缩 JSON 文件,生成 'mnist.json.gz'。

准备工作:

在运行代码之前,请确保您已经安装了 torchvision 模块。您可以使用以下命令安装:

pip install torchvision

希望本指南对您有所帮助!如果您有任何其他问题,请随时提出。

MNIST数据集下载、查看及JSON压缩指南

原文地址: http://www.cveoy.top/t/topic/czKP 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录