Redian新闻
>
无障碍化身小黑子只需6枚传感器,来自清华轻量化动捕新成果|SIGGRAPH 2024

无障碍化身小黑子只需6枚传感器,来自清华轻量化动捕新成果|SIGGRAPH 2024

公众号新闻
清华大学 徐枫团队 投稿
量子位 | 公众号 QbitAI

仅需6枚硬币大小的传感器,即可做到实时精准全身动作捕捉

来自清华大学团队的最新研究,入选计算机图形学顶会SIGGRAPH 2024

有了这项技术,可以无障碍化身小黑子。

打拳等大幅度运动也不在话下。

简洁是这类技术的核心优势之一,6枚惯性传感器(IMU)穿戴于四肢末端、头部和后背。

IMU传感器其实智能手机、手环、手表、耳机上都有,生活中十分常见。视频中使用的IMU体积非常小,与一枚一圆硬币大小相当,佩戴在身上几乎察觉不到。

一元硬币(左)与该技术使用的惯性传感器(右)

不光形式简洁、佩戴方便,且和一套动辄百十万的传统动捕设备相比,其成本降低到了普通用户可以轻松接受的水平。

例如,日本索尼公司在去年发布了mocopi产品,提供给用户6枚IMU进行动作捕捉的解决方案,售价为449.99美元。

索尼mocopi产品,使用6个IMU进行动作捕捉

来自清华大学的研究人员基于在该领域已有的技术积累,提出名为PNP的新技术,在动作捕捉精度上大幅超越现有的学术界及工业界解决方案。

其中与索尼公司的mocopi相比,可见新方案在多数人体动作上完成的更加标准、自然:

索尼mocopi(左,黑色)与本技术PNP(右,橙色)实时动作捕捉结果对比

不仅相比于工业界产品mocopi有明显更高的精度,相比于学术界的最先进的方案,本技术也有明显优势:

学术界的最先进方案PIP(左,蓝色)与本技术PNP(右,橙色)实时动作捕捉结果对比

该技术将发表在SIGGRAPH 2024上,代码已经开源

建模非惯性力带来“虚拟加速度”

本技术指出了过去工作存在的一个问题,即使用惯性测量值估计人体运动时忽略了非惯性力的问题。

具体来说,人体动作捕捉任务通常分解为人体姿态估计人体运动估计两个子任务求解。

在人体姿态估计任务中,过去的方法往往使用人体根节点坐标系简化网络训练,即使用根节点坐标系下的IMU测量值(包括加速度、和旋转)来估计人体姿态(即关节旋转)。

然而由于人体的加速和转动,根节点坐标系通常是一个非惯性系,将加速度变换到非惯性系时必须要考虑非惯性力的影响。

举一个简单的例子,假设被捕捉者站立于转台上,此时静止的观测者会认为IMU加速度测量值和人体运动一致(读数为旋转的向心加速度),而位于转台上的动态观测者则会指出IMU的加速度读数与他看到的人体运动不符(他会看到静止的人体)。

究其原因,是因为动态观测者使用了非惯性参考系,他在读取IMU的数据时必须加上非惯性力(如离心力、科里奥利力),才能获得和观测一致的结果。

本技术通过建模非惯性力带来的“虚拟加速度”,保证了神经网络看到的加速度和人体运动一致。通过更加充分利用加速度测量值,可以提高动作捕捉的精度。

以一个例子说明本技术的实际作用:我们对比人体转圈和收缩手臂的两种运动(下图左),此时位于手臂上的IMU都会测到向内的加速度,如果简单地变换到根节点坐标系,这两种动作将无法区分(下图中);而在本技术中,人体旋转产生的“离心力”与IMU测量到的向心力抵消,使得两种动作可以被有效区分开(下图右)。

本项目主页中的视频通过动画直观的讲解了本技术的核心思路和背后的物理知识,读者可以进行参考。

准确且符合物理规律

得益于更充分的加速度的使用,本技术可以解决过去工作难以捕捉的举手、冲拳等IMU旋转几乎不变、只能通过加速度来重建的动作。

相比于之前的方法PIP(左,蓝色),本技术PNP(右,橙色)能更准确重建举手、冲拳动作

复杂动作的捕捉也更加准确。

相比于之前的方法PIP(左,蓝色),本技术PNP(右,橙色)能更准确地捕捉复杂动作

相比于工业界的方案(索尼mocopi),本技术使用了人体物理优化,使得重建的结果符合物理规律(例如避免了脚在地面上滑动等问题)。

相比于索尼mocopi(左,黑色),本技术PNP(右,橙色)捕捉的动作符合物理规律(脚不滑动)

对于复杂运动如下蹲行走,本技术也能更好地处理:

相比于索尼mocopi(左,黑色),本技术PNP(右,橙色)捕捉复杂动作更加准确。

更多的对比结果可以参考主页的视频。

论文地址:https://arxiv.org/abs/2404.19619
项目主页:https://xinyu-yi.github.io/PNP/
开源代码:https://github.com/Xinyu-Yi/PNP

—  —


投稿请发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容

附上论文/项目主页链接,以及联系方式哦

我们会(尽量)及时回复你


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ECCV 2024 | 清华提出PYRA:超轻量级ViT适应&推理高效微调模块SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事具有高阶交互的网络化动态系统:稳定性与复杂性 | NSR美股基本面 - 2024_03_26 * 午报 * 美国复活节鸡蛋价格接近历史高点。福特首席财务官称巴尔的摩大桥倒塌将影响供应今日Matter:可拉伸但不受拉伸影响的复合响应压力传感器SIGGRAPH 2024 | AI可以生成3D主题乐园啦!角色建筑批量生成【喜报】8枚哈佛, 5枚耶鲁, 3枚普林, 6枚哥大, 6枚宾大, 5枚布朗, 6枚康奈尔, 4枚杜克(附分享会信息)三星发布先进芯片工艺路线图:新版2纳米制程2027年量产;新一代人造太阳“中国环流三号”取得新成果丨智能制造日报微型传感器意指实时监测肿瘤 研究人员希望它能更好地替代活组织检查2024,哪个包会是LV的断货王?大模型+智能眼镜,让失明人士也能无障碍阅读退休了三支国内团队获荣誉提名,英伟达CMU各占40%!ACM顶会SIGGRAPH 2024最佳论文揭晓有不烦车子的自动停启功能的吗?2024 BMW X5「全球十大顶尖 AI 模型」背后成员曝光,华人占近两成,大多来自清华深圳发布公告:专项扶持传感器产业自驾从SF到LA: 斯坦福大学校园Keychron 海外推出 M7 无线鼠标:63g 右手人体工学、3395 传感器、Type-C 接收器OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生CMOS图像传感器,堆叠三层了几個畫家的對話英伟达摘两篇最佳论文、浙大周昆获时间检验奖,SIGGRAPH 2024奖项出炉磁传感器市场烽烟四起,巨头争雄,新秀崛起南洋理工肖教授1v1科研:水下传感器网络的最优布局|收获一作论文与导师推荐信!愚人节(4/1/2024)微针葡萄糖传感器贴片 可至皮肤深层持续监测Nature:新型无线植入式传感器,通过超声波监测颅内生理信号ACM顶会SIGGRAPH 2024最佳论文揭晓,英伟达CMU各占40%!三支国内团队获荣誉提名春季观鹤:2024 科州汽车传感器,增速惊人2030年,自动驾驶传感器市场将高达235亿美元我看见,透过迷雾的自由———— 写于巴尔的摩“弗朗西斯·斯科特·基”桥被撞毁坍塌的时候Best CD Rates Of April 2024: Up To 5.42%深耕高端超声相控阵传感器十余年,它参与20多项国家标准制定清华“天眸芯”登Nature封面!全球首款类脑互补视觉芯片,施路平团队最新成果信息无障碍,光凭责任心就够了吗iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?AI生成3D主题乐园,角色建筑批量生成,风格保持一致 | SIGGRAPH 2024
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。