import os import cv2 import numpy as np import mindspore from mindspore import Tensor, load_checkpoint, load_param_into_net from mindspore.dataset.vision import py_transforms from mindspore.dataset.transforms.py_transforms import Compose from PIL import Image from main import ResNet, BasicBlock

加载标签

with open('label.txt') as f: labels = f.readlines() labels = [l.strip() for l in labels]

加载人脸检测器

face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

打开摄像头

cap = cv2.VideoCapture(0)

遍历ckpt文件夹中的所有ckpt文件

ckpt_dir = 'D:/pythonProject7/ckpt/' ckpt_files = os.listdir(ckpt_dir) ckpt_files = [f for f in ckpt_files if f.endswith('.ckpt')] ckpt_files.sort(key=lambda x: os.path.getmtime(os.path.join(ckpt_dir, x)))

for ckpt_file in ckpt_files: # 加载模型的函数 def load_model(): network = ResNet(BasicBlock, [2, 2, 2, 2], num_classes=100) params = load_checkpoint(os.path.join(ckpt_dir, ckpt_file)) load_param_into_net(network, params) return network

# 加载模型
network = load_model()

while True:
    # 读取视频帧
    ret, frame = cap.read()

    # 转换为灰度图像
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 检测人脸
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)

    for (x, y, w, h) in faces:
        # 提取人脸图像
        face = gray[y:y + h, x:x + w]
        face = cv2.resize(face, (224, 224)).astype(np.float32)
        face = cv2.cvtColor(face, cv2.COLOR_GRAY2RGB)

        # 转换为Tensor类型,并进行归一化
        transform = Compose([
            py_transforms.ToTensor(),
            py_transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
        ])
        face = transform(face)

        # 转换为Tensor类型,并增加一个维度
        face = Tensor(face)
        #face = mindspore.ops.ExpandDims()(face, 0)

        # 预测人脸所属的类别
        output = network(face)
        prediction = np.argmax(output.asnumpy())

        # 在图像上标注人脸和类别
        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 0, 255), 2)
        cv2.putText(frame, labels[prediction], (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)

    # 显示图像
    cv2.imshow('frame',frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放摄像头并关闭窗口
cap.release()
cv2.destroyAllWindows()

如何正确调整model识别人脸内容:在代码中,可以通过以下方式来正确调整模型识别人脸:

  1. 加载人脸检测器

在代码中已经加载了人脸检测器,可以使用它来检测视频帧中的人脸。可以根据需要修改检测人脸的参数,如缩放因子和最小邻居数等。

  1. 提取人脸图像

在检测到人脸后,可以使用OpenCV提取人脸图像。可以根据需要调整提取的图像大小和颜色空间。

  1. 转换为Tensor类型,并进行归一化

将提取的人脸图像转换为Tensor类型,并进行归一化。可以使用MindSpore提供的py_transforms中的ToTensor和Normalize函数来实现。

  1. 预测人脸所属的类别

将归一化后的人脸图像输入到模型中,进行预测人脸所属的类别。可以使用MindSpore提供的Tensor类型的数据进行预测。

  1. 在图像上标注人脸和类别

在视频帧上标注人脸和类别,可以使用OpenCV提供的函数来实现。可以根据需要调整标注的颜色、字体和位置等参数。

  1. 显示图像

将标注后的视频帧显示出来,可以使用OpenCV提供的imshow函数来实现。可以根据需要调整显示的窗口名称和帧率等参数。

  1. 释放摄像头并关闭窗口

在程序结束时,需要释放摄像头并关闭窗口,可以使用OpenCV提供的release和destroyAllWindows函数来实现。

使用 MindSpore 和 OpenCV 进行实时人脸识别

原文地址: https://www.cveoy.top/t/topic/jqmP 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录