微前端架构如何改变企业的开发模式与效率提升
1305
2022-11-23
2D人体姿势估计论文合集
文章目录
前言什么是人体姿势估计?为什么难?二维人体姿态估计的不同方法
经典方法基于深度学习的方法
2018
Simple Baselines for Human Pose Estimation and TrackingReal-time 2D Multi-Person Pose Estimation on CPU: Lightweight OpenPose
2019
Deep High-Resolution Representation Learning for Human Pose EstimationPifPaf: Composite Fields for Human Pose Estimation
2020
HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose EstimationSimple Pose: Rethinking and Improving a Bottom-up Approach for Multi-Person Pose Estimation
2021
Rethinking Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human Pose EstimationBottom-Up Human Pose Estimation Via Disentangled Keypoint RegressionOpenPifPaf:Composite Fields for Semantic Keypoint Detection and Spatio-Temporal Association
前言
人体姿态估计是过去几十年来一直受到计算机视觉社区关注的一个重要问题。这是了解图像和视频中的人物的关键一步。在这篇文章中,我写了关于人体姿势估计 (2D) 的基础知识,并回顾了有关该主题的文献。这篇文章也将作为人体姿势估计的教程,可以帮助您学习基础知识。
什么是人体姿势估计?
为什么难?
强大的关节、小而几乎看不见的关节、遮挡、衣服和照明变化使这成为一个难题。
二维人体姿态估计的不同方法
经典方法
基于深度学习的方法
经典管道有其局限性,并且姿态估计已被 CNN 大大重塑。随着 Toshev 等人提出“ DeepPose ”,人体姿态估计的研究开始从经典方法转向深度学习。大多数最近的姿势估计系统都普遍采用ConvNets作为其主要构建块,在很大程度上取代了手工制作的特征和图形模型;这一战略在标准基准上取得了巨大的进步。
在下一节中,我将按时间顺序总结几篇论文,这些-表了从 Google 的 DeepPose 开始的 Human Pose Estimation 的演变(这不是一个详尽的列表,而是我认为展示了最佳进展/最每个会议重要的)。
2018
Simple Baselines for Human Pose Estimation and Tracking
code: 2D Multi-Person Pose Estimation on CPU: Lightweight OpenPose
code: High-Resolution Representation Learning for Human Pose Estimation
code: 在本文中,我们感兴趣的是人类姿态估计问题,重点是学习可靠的高分辨率表示。大多数现有的方法从高到低分辨率网络产生的低分辨率表示中恢复高分辨率表示。相反,我们提出的网络在整个过程中都保持着高分辨率的表示。
PifPaf: Composite Fields for Human Pose Estimation
2020
HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation
code: Pose: Rethinking and Improving a Bottom-up Approach for Multi-Person Pose Estimation
code: Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human Pose Estimation
code: Human Pose Estimation Via Disentangled Keypoint Regression
code: Fields for Semantic Keypoint Detection and Spatio-Temporal Association
code : 许多基于图像的感知任务可以表述为检测、关联和跟踪语义关键点,如人体姿态估计和跟踪。在这项工作中,我们提出了一个在单一阶段联合检测和形成时空关键点关联的通用框架,使这成为第一个实时姿态检测和跟踪算法。我们提出了一种通用的神经网络架构,它使用复合场来检测和构造一个时空姿态,这是一个单一的连接图,其节点是多个帧中的语义关键点(例如,一个人的身体关节)。对于时间关联,我们引入了时间复合关联场(TCAF),它需要一个扩展的网络架构和训练方法。我们的实验显示,在多个公开数据集上,如COCO、CrowdPose和2017年和2018年的邮政数据集上,竞争的准确性要快一个数量级。我们还表明,我们的方法可以推广到任何类型的语义关键点,如汽车和动物部件,以提供一个整体的感知框架,非常适合城市移动,如自动驾驶汽车和交付机器人。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~