在使用 MindSpore 进行人脸识别时,可能会遇到 ValueError: mindspore\core\utils\check_convert_utils.cc:367 CheckInteger] The primitive[Conv2D]'s x shape size must be equal to 4, but got 5. 的错误。这个错误提示表明模型中的卷积层 (Conv2D) 接收到的输入数据维度不正确,需要检查模型的输入和输出维度是否正确。

以下是一些常见的错误原因和解决方法:

  1. 检查模型的输入维度是否正确:

    • 确保模型的输入维度与代码中提供的输入维度一致。例如,如果模型的输入维度是 (batch_size, channel, height, width),那么代码中提供的输入也应该具有相同的维度。
    • 打印调试信息,例如 print(face.shape),查看输入数据的实际维度。
  2. 检查模型的输出维度是否正确:

    • 确保模型的输出维度与代码中预期的输出维度一致。
    • 打印调试信息,例如 print(output.shape),查看输出数据的实际维度。
  3. 检查模型中的卷积层参数是否正确:

    • 检查卷积核大小、步长、填充等参数是否正确,是否与模型的设计预期一致。
    • 可以通过查看模型的配置文件或代码来确认这些参数。
  4. 检查代码中的数据预处理过程是否正确:

    • 确保数据类型、数据范围、数据维度等都符合模型的预期。
    • 可以通过打印调试信息,例如 print(face.dtype)print(face.min())print(face.max()),查看数据的实际情况。
  5. 检查代码中的数据处理过程是否正确:

    • 确保数据是否进行了正确的归一化、增强等操作。
    • 可以通过查看代码,确认数据处理过程是否符合模型的要求。

排查技巧:

  • **打印调试信息:**在关键位置打印输入和输出数据的维度和内容,方便观察数据流和定位问题。
  • **逐层检查:**从模型的第一层开始,逐步检查每一层的输入和输出,排查错误发生的具体位置。
  • **查看模型配置文件:**参考模型的配置文件,确认模型的设计参数,例如卷积核大小、步长等。

示例:

以下是一个使用 MindSpore 进行人脸识别时出现的错误示例,以及解决方法:

import cv2
import numpy as np
import mindspore
from mindspore import Tensor, load_checkpoint, load_param_into_net
from mindspore.dataset.vision import py_transforms
from mindspore.dataset.transforms.py_transforms import Compose
from PIL import Image
from main import ResNet, BasicBlock

# 加载模型
network = ResNet(BasicBlock, [2, 2, 2, 2], num_classes=100)
model_path = 'D:/pythonProject7/ckpt/checkpoint_resnet_6-10_25.ckpt'
params = load_checkpoint(model_path)
load_param_into_net(network, params)

# 加载标签
with open('label.txt') as f:
    labels = f.readlines()
labels = [l.strip() for l in labels]

# 加载人脸检测器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 打开摄像头
cap = cv2.VideoCapture(0)

while True:
    # 读取视频帧
    ret, frame = cap.read()

    # 转换为灰度图像
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 检测人脸
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)

    for (x, y, w, h) in faces:
        # 提取人脸图像
        face = gray[y:y + h, x:x + w]
        face = cv2.resize(face, (224, 224)).astype(np.float32)
        face = cv2.cvtColor(face, cv2.COLOR_GRAY2RGB)

        # 转换为Tensor类型,并进行归一化
        transform = Compose([
            py_transforms.ToTensor(),
            py_transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
        ])
        face = transform(face)

        # 转换为Tensor类型,并增加一个维度
        face = Tensor(face)
        face = mindspore.ops.ExpandDims()(face, 0)

        # 预测人脸所属的类别
        output = network(face)
        prediction = np.argmax(output.asnumpy())

        # 在图像上标注人脸和类别
        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 0, 255), 2)
        cv2.putText(frame, labels[prediction], (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)

    # 显示图像
    cv2.imshow('frame',frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放摄像头并关闭窗口
cap.release()
cv2.destroyAllWindows()

错误原因:

在上面的代码中,face 的维度是 (1, 3, 224, 224),而模型的第一层卷积层的输入维度可能是 (batch_size, channel, height, width),因此会导致错误。

解决方法:

  • 检查模型的配置文件,确定第一层卷积层的输入维度。

  • 如果模型的输入维度是 (batch_size, channel, height, width),则需要修改代码中 face 的维度,例如:

    face = face.reshape(1, 3, 224, 224)
    
  • 如果模型的输入维度是 (channel, height, width),则需要修改代码中 face 的维度,例如:

    face = face.squeeze()
    

通过以上方法,可以排查并解决 Conv2D 输入维度不正确 的错误。

MindSpore 人脸识别模型错误排查:Conv2D 输入维度问题

原文地址: https://www.cveoy.top/t/topic/jqkV 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录