《OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields》是一篇由 CMU 团队发表在 2018 年 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 上的论文。该论文提出了一种名为 OpenPose 的系统,能够实现实时多人 2D 姿态估计,并应用于人体动作识别、手势识别、面部表情识别等领域。

该系统采用了一种基于 Part Affinity Fields (PAFs) 的姿态估计方法,能够有效地解决多人姿态估计中的遮挡和重叠问题。具体来说,该系统首先使用一个 CNN 网络对输入图像进行特征提取,然后将这些特征送入两个并行的 CNN 网络,分别用于估计关节点和 PAFs。在关节点估计网络中,每个像素都对应一个关节点的置信度得分,而在 PAFs 估计网络中,每个像素对应于一对关节点之间的 PAF 向量,用于描述这两个关节点之间的连线情况。

通过将这些 PAF 向量进行聚类和筛选,可以得到最终的姿态估计结果。同时,该系统还采用了一些优化技巧,如多尺度处理、卷积核分离和后处理等,能够进一步提高系统的性能和鲁棒性。

该论文的实验结果表明,OpenPose 系统能够在多种数据集上取得优秀的姿态估计效果,并且具有较好的实时性能和鲁棒性。该系统已经成为了当前姿态估计领域的重要研究方向之一,为人体动作识别、手势识别、面部表情识别等领域的应用提供了有力的支持。

OpenPose: 实时多人 2D 姿态估计 - 基于部件亲和场 (PAFs) 的方法

原文地址: https://www.cveoy.top/t/topic/oEGn 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录