【ECCV 2020】论文阅读：Motion Guided 3D Pose Estimation from Videos

2022-03-05 22:00:21 阅读：267 来源： 互联网

标签：loss Videos ECCV Minkowski Pose motion Distance 向量 3D

ECCV2020的一篇关于3D姿态视频评估的文章

论文地址：https://arxiv.org/abs/2004.13985

Github地址：好像没找到官方的，但已经有非官方的供参考：https://github.com/tamasino52/UGCN

单位：亚马逊、港中文

摘要

作者提出了一个新的损失函数，称之为motion loss，用于解决单目下从2D pose到3D HPE的问题。在计算motion loss时，一种简单却有效的关键点动作表示方法——paorwise motion被引入进来。作者设计了一个新的图卷积神经网络架构UGCN，这个架构同时捕获长短时动作信息以充分利用motion loss中额外的监督信息。作者在两个大型数据集Human3.6M 和 MPI-INF-3DHP.上进行了实验。该模型大大超过了其他最先进的模型，同时展示了产生平滑的3D序列和恢复关键动作的强大能力。

1&2. Introduction and related work

解释一下文中关于Minkowski Distance部分的描述，下图是定义，P=1时为曼哈顿距离，P=2时为欧几里得距离。通过Fig.1解释一下Minkowski Distance的局限性。通过图中可知，trace1基本和ground truth曲线形状相似，trace2趋势不同但还是比较丝滑的，trace3就随机摇摆并且不平滑了，三条曲线的L1 loss平均值相等，但是时序结构完全不同，因为Minkowski Distance只是独立计算每个瞬间的距离，而无法体现轨迹的内部依赖。因为人体关节点与单摆类似，这也是为什么作者要提出这个motion loss。

motion loss需要在重建三维关键点位置的基础上，额外重建关键的的轨迹。它通过计算特定表中空间（称为motion encoding）中预测关节点位置和真实值之间的差值来衡量动作重建质量。motion encoding以可微分算子的形式建立。首先将一个轨迹粗略的分解为一组成对的坐标向量，它们具有不同的时间间隔对应不同的时间尺度。一个可微分的二元向量算子，如减法，内积和向量积，应用在每一对上。然后将得到的结果串联起来构造完全的motion coding。这种表示方法如图1所示，运用的是减法，可以有效的评估时序结构的质量。

标签：loss,Videos,ECCV,Minkowski,Pose,motion,Distance,向量,3D
来源： https://www.cnblogs.com/Nothing-is-easy/p/15969583.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

【ECCV 2020】论文阅读：Motion Guided 3D Pose Estimation from Videos

摘要

1&2. Introduction and related work