这个错误提示说明了在使用 Conv2D 时输入的 x 的维度数应该是 4,但是你的输入维度数只有 3。可能是因为你传入的人脸图像在转换为 Tensor 时维度不正确导致的。建议在转换为 Tensor 前先检查一下人脸图像的形状是否为 (224, 224, 3)。如果不是,可以尝试对其进行 reshape 或者扩展维度。同时,你也可以在网络的输入层进行调整,使其适应你的输入维度。

以下是一个可能的代码示例,展示了如何解决 Conv2D 输入维度错误:

import cv2
import numpy as np
import mindspore
from mindspore import Tensor, load_checkpoint, load_param_into_net
from PIL import Image
from main import ResNet, BasicBlock

# 加载模型
network = ResNet(BasicBlock, [2, 2, 2, 2], num_classes=100)
model_path = 'D:/pythonProject7/ckpt/checkpoint_resnet_6-10_25.ckpt'
params = load_checkpoint(model_path)
load_param_into_net(network, params)

# 加载标签
with open('label.txt') as f:
    labels = f.readlines()
labels = [l.strip() for l in labels]

# 加载人脸检测器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 打开摄像头
cap = cv2.VideoCapture(0)

while True:
    # 读取视频帧
    ret, frame = cap.read()

    # 转换通道数
    if len(frame.shape) == 2:
        frame = cv2.cvtColor(frame, cv2.COLOR_GRAY2BGR)
    elif frame.shape[2] == 4:
        frame = cv2.cvtColor(frame, cv2.COLOR_BGRA2BGR)

    # 转换为灰度图像
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 检测人脸
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)

    for (x,y,w,h) in faces:
        # 提取人脸图像
        face = frame[y:y+h, x:x+w]
        face = cv2.resize(face, (224, 224))
        face = cv2.cvtColor(face, cv2.COLOR_BGR2RGB)
        # 检查并调整维度
        if face.shape != (224, 224, 3):
            face = face.reshape((224, 224, 3))  # 或使用 np.expand_dims(face, axis=0)
        face = face.transpose().astype(np.float32) / 255.
        face = Tensor(face)

        # 预测人脸所属的类别
        output = network(face)
        prediction = np.argmax(output.asnumpy())
        output = Tensor(output)

        # 在图像上标注人脸和类别
        cv2.rectangle(frame,(x,y),(x+w,y+h),(0,0,255),2)
        cv2.putText(frame, labels[prediction], (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0,0,255), 2)

    # 显示图像
    cv2.imshow('frame',frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放摄像头并关闭窗口
cap.release()
cv2.destroyAllWindows()

注意:

  • 在代码中,我们添加了一个判断语句,用于检查人脸图像的形状是否为 (224, 224, 3)。如果形状不符合要求,则使用 face.reshape((224, 224, 3))np.expand_dims(face, axis=0) 进行调整。
  • 你也可以在网络的输入层进行调整,使其适应你的输入维度。例如,可以将网络的输入层修改为 Conv2D(in_channels=3, ...)

请根据你的实际情况进行调整。如果你还有其他问题,请随时提出。

MindSpore 实战:人脸识别系统错误排查 - Conv2D 输入维度问题

原文地址: https://www.cveoy.top/t/topic/mTWi 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录