姿态估计 - Convolutional Pose Machines_姿态估计热力图-程序员宅基地

技术标签: CPM  单人姿态估计  CV  pose estimation  姿态估计  

0. 前言

  • 相关资料:
  • 论文基本信息
    • 领域:姿态估计
    • 作者单位:卡耐基梅隆大学
    • 发表时间:2016 CVPR
  • 一句话总结:(单人)姿态估计的奠基之作,使用热力图的方式表示关键点结果,使用多stage细化关键点结果,每个stage都添加loss抑制梯度消散。

1. 要解决什么问题

  • 使用卷积网络解决姿态估计问题。
  • 这论文比较早了,感觉类似于图像分割中的FCN。

2. 用了什么方法

  • 虽然没看过,但应该有一篇论文叫 Pose Machine,CPM应该就是在Pose Machine的基础上使用卷积作为特征提取方式。
  • 总体结构
    • a/b应该是pose machine的结构
      • 感觉就是定义了姿态估计问题的基本解法?
      • 每个stage都预测所有关键节点的位置,通过分类实现,类别数量为 P+1,P为关键点数量。
      • 预测的heatmap尺寸与输入图片一样。
      • 每个stage都输出关键点,随着stage的叠加,结果也越来越细化。
      • 有中间的辅助loss,可以使得抑制梯度消失的问题。
    • c/d应该是CPM的结构。
      • 从现在看,感觉也没有什么忒别的。
      • 中间有很多辅助loss
      • 每一个stage的输入都是由上一stage的输出再加上一个辅助输入叠加。
    • image-20201222103400283

3. 效果如何

  • 查看梯度消散的问题

    • 红色的是没有中间层loss的情况,黑色是有中间层loss的情况
    • image-20201222113207308
  • 对比各个stage的结果

    • image-20201222113130705
  • 性能对比(当时的sota都没有什么意义了)

    • image-20201222113331476

4. 还存在什么问题&可借鉴之处

  • 16年论文能咋看,应该是基础了吧,有用的后面会一直使用。
  • 热力图的方式展示姿态估计结果,应该是很6了。
  • 这是单人姿态估计的工作。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/irving512/article/details/111521562

智能推荐

MyBatis要不要学?字节跳动的内部的这份文档真香_mysql与mybatis都要学吗-程序员宅基地

文章浏览阅读356次。很多人说 mybatis重不重要?这里再说下,互联网公司基本都是用mybatis做为持久层框架的,所以mybatis是一定要学的。程序员80%时间都在CRUD,对了mybatis就是干这个的,这儿有一份网易十六年架构师编写的思维导图和文档,需要的朋友可以【点击此处】无偿获取! MyBatis是一个实现了JPA规范的用来连接数据库并对其进行增删改查操作的开源框架 (就和传统的JDBC一样,就是个连接数据库的东西),其实,它底层就是一个JDBC封装的组件。MyBatis的前身是Ibatis,Ibatis创建与2_mysql与mybatis都要学吗

React+Ts,这样学起来确实简单!!!-程序员宅基地

文章浏览阅读1.2w次,点赞19次,收藏72次。React这样的框架存在对应的声明文件,声明文件通过一些基础语法定义了一些类型,从而获取到TypeScript中诸如类型检查、接口提示等特性功能,也可以在自己用TS开发时避免自己写一些复杂的ts结构类型了,下面就来看一下React中定义ts语法如何使用。茶已备好,只待君来!感谢关注 前端点线面 (>‿<),本号干货满满:1.14个门类(100+篇原创)内容——..._react ts

SQL注入天书—ASP注入漏洞全接触 -程序员宅基地

文章浏览阅读845次。随着B/S模式应用开发的发展,使用这种模式编写应用程序的程序员也越来越多。但是由于这个行业的入门门槛不高,程序员的水平及经验也参差不齐,相当大一部分程序员在编写代码的时候,没有对用户输入数据的合法性进行判断,使应用程序存在安全隐患。用户可以提交一段数据库查询代码,根据程序返回的结果,获得某些他想得知的数据,这就是所谓的SQL Injection,即SQL注入。随着B/S模式应用开发的发展,

Thingsboard 3.0 TB-Gateway网关接入 MQTT 设备_tb_gateway_mqtt-程序员宅基地

文章浏览阅读4.7k次,点赞4次,收藏16次。Thingsboard IoT Gateway是一个开源解决方案,可让您使用Thingsboard集成连接到旧系统和第三方系统的设备。ThingsBoard IoT网关提供以下功能:OPC-UA连接器,用于从连接到OPC-UA服务器的设备收集数据。MQTT连接器,用于收集发布到外部MQTT代理的数据。Modbus连接器,用于从Modbus服务器和从站收集数据。BLE连接器,用于从BLE设备收集数据。请求连接器以从HTTP API收集数据。CAN连接器使用CAN协议收集数据。BACnet连_tb_gateway_mqtt

a标签的target指向iframe实现页面局部刷新_iframe的name等于一个a标签的target-程序员宅基地

文章浏览阅读1w次。iframe的name属性配合a标签的target属性实现页面局部刷新:页面一代码:html>head lang="en"> meta charset="UTF-8"> title>title>head>body> ul> li>a href="M2.html" target="myFrame">培养目标a>li> li>_iframe的name等于一个a标签的target

android tvdpi不能编译问题_product_aapt_config-程序员宅基地

文章浏览阅读846次。在开发中需要添加tvdpi资源时,如drawable-tvdpi,在Eclipse或Android Studio上能编译,但在AOSP下mm时并没有编译该目录解决办法:build/core/product_config.mk 找到# Default to medium-density assets.# (Can be overridden in the device config,_product_aapt_config

随便推点

flask读取服务器信息,flask获取请求的参数-程序员宅基地

文章浏览阅读1.2k次。1.获取URL参数 (GET请求)URL参数是出现在url中的键值对,例如http://127.0.0.1:5000/?disp=3中的url参数是{'disp':3}1、同上,创建项目1mkdirHelloWorld2mkdirHelloWorld/static3mkdirHelloWorld/templates4touchHelloWorld/server.py2、列出所有的u..._flask获取服务请求域名

0x0FA23F7D (ucrtbased.dll)处(位于.exe 中)引发的异常: 0xC0000005: 读取位置 0x0000012C 时发生访问冲突。_ucrtbased.dll)处(位于 taskscheduler.exe 中)引发的异常: 0xc0-程序员宅基地

文章浏览阅读7.2k次。@语冰咔咔 楼下评论解决的_ucrtbased.dll)处(位于 taskscheduler.exe 中)引发的异常: 0xc0000005: 读取位置

Mac环境下使用python安装pandas库_python3.8 如何安装 pandas1.5.3-程序员宅基地

文章浏览阅读1.3w次,点赞16次,收藏27次。因为在github上找了个能计算自己gpa的.py文件,因此想试试看自己的绩点有什么水平,扒下来之后,缺少pandas库无法运行,于是百度安装方法,在终端使用如下命令:️//系统版本为macOS Mojave 10.14.6//当前楼主的电脑已经安装了python3.8pip3 install pandas正常加载后出现如下状况:️并未安装成功并出现如图警告️:️在Stac..._python3.8 如何安装 pandas1.5.3

012、数据库管理之cluster部署-程序员宅基地

文章浏览阅读1.1k次。最基础的 TiDB 测试集群通常由 2 个 TiDB 实例、3 个 TiKV实例、3 个 PD 实例和可选的 TiFlash 实例构成。tiup playground启动的集群,在命令会话终端如果关闭会话,或者⽤ Control+C 键终⽌当前会话,tidb集群将被关闭。使⽤TiUP部署的测试集群,仅适⽤于快速上⼿体验,不适⽤于⽣产环境。虚拟机的IP,可以通过虚拟机IP来访问到TiDB的实例。启动集群:使⽤ tiup playground 启动集群,有两种⽅式。这是关闭所有集群,当然也可以关闭指定集群。

PTA贪心--区间选点问题-程序员宅基地

文章浏览阅读551次,点赞2次,收藏3次。一、问题描述数轴上有n个闭区间[ai, bi]。取尽量少的点,使得每个区间内都至少有一个点(不同区间内含的点可以是同一个)。输入格式:第一行一个数字n,表示有n个闭区间。 下面n行,每行包含2个数字,表示闭区间[ai, bi]输出格式:一个整数,表示至少需要几个点输入样例:在这里给出一组输入。例如:31 32 45 6输出样例:在这里给出相应的输出。例如:2二、代码`#inc...

net_device_net_device private data-程序员宅基地

文章浏览阅读879次。The net_device data structure stores all information specifically regarding a network device.There is one such structure for each device, both real ones (such as Ethernet NICs) and virtual ones (such _net_device private data