Python MNIST 数据集读取函数详解
这段代码是一个 Python 函数,用于读取 MNIST 数据集。它接收两个参数:path 指示 MNIST 数据集所在的路径,kind 表示读取训练集('train')还是测试集('test')。
函数首先通过 os.path.join 拼接路径,分别获取标签文件和图片文件的路径。然后,使用 open 以二进制读取模式打开文件,并使用 struct.unpack 解包文件头信息。
对于标签文件,解包文件头信息后,使用 np.fromfile 将剩余数据读入内存,并转换为 uint8 类型的一维数组,即 labels。
对于图片文件,解包文件头信息后,使用 np.fromfile 将剩余数据读入内存,并转换为 uint8 类型的一维数组,然后使用 reshape 将其重塑为二维数组,即 images。每个图片的像素值存储为一行,总共有 len(labels) 张图片。
最后,函数返回 images 和 labels。其中,images 是一个二维数组,每一行代表一张图片的像素值,共有 len(labels) 张图片;labels 是一个一维数组,每个元素代表对应图片的数字标签。
原文地址: https://www.cveoy.top/t/topic/nw7o 著作权归作者所有。请勿转载和采集!