细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

MultiGO团队 投稿

从人体单图变身高保真3D模型,不知道伤害了多少程序猿头发的行业难题,竟然被港科广团队一招破解了!

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

团队最新提出的MultiGO创新方案,借助分层建模思路——将人体分解为不同精度层级,从基础体型到衣物褶皱逐级细化。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

这有点像在搭乐高积木:先大模块构建整体轮廓,再用小零件补充细节,最后再处理材质纹理。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

相关研究成果目前已入选CVPR 2025,项目代码也在加紧开源的路上。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

更多详情,让我们接着继续看~

技术改进路在何方?

传统方法的瓶颈

基于单目图像的三维人体重建存在固有深度歧义性,现有方法通常依赖SMPL-X等人体轮廓的预训练模板提供几何先验,但依然难以捕捉细节特征和特定解剖学结构。

这些方法往往聚焦于人体整体几何建模,而忽视了多层次结构(如骨骼、关节,以及手指、面部等部位的细密皱纹)。这种过度简化的建模方式导致骨骼重建不准确、关节位置偏差,以及衣物皱纹等细节模糊不清。

MultiGO创新框架

该研究提出三级几何学习框架实现突破:

  1. 骨架增强模块:通过将3D傅里叶特征投影到2D空间,结合SMPL-X人体网格作为几何先验,增强人体骨架建模。傅里叶空间位置编码提升了3D模型与2D图像的语义对齐能力。
  2. 关节增强策略:在训练时对关节点位置施加扰动,提升模型对深度估计误差的鲁棒性。通过重点调整影响深度感知的参数,使模型能更好适应实际观测中的结构偏差。
  3. 皱纹优化模块:采用类似扩散模型去噪的方法,将表面皱纹视为可优化的噪声模式。从粗糙的人体网格中,恢复出更精细化的高频细节。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

MultiGO技术解剖

MultiGO方法的核心在于通过多层次几何学习框架全面提升单目纹理3D人体重建的质量。该方法基于现有物体高斯重建预训练模型,针对人体几何的不同粒度层级(骨骼、关节、皱纹)设计了协同优化的三重机制:

  • 骨骼层级:骨架增强模块通过将3D傅里叶特征投影到输入图像一致的2D空间,使高斯重建模型能够充分融合先验的人体形态知识,从而精准捕捉人体姿态特征。这种特征投影机制有效解决了单目视角下3D结构信息缺失的问题。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

  • 关节层级:关节增强策略在训练阶段对真实的SMPL(X)模型的关节参数进行扰动。通过模拟深度不确定性,增强模型对推理过程中关节深度误差的鲁棒性。这种数据增强方式使模型能够学习更稳定的关节空间关系,避免因深度歧义导致的肢体位置重建不准。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

  • 微观几何细节层面:皱纹优化模块创新性地借鉴扩散理论思想。该模块将粗糙网格视为高斯噪声,而以重建的高质量高斯纹理作为条件输入,通过类似扩散模型去噪的过程逐步优化皱纹等细微几何特征。这种纹理引导的细化机制实现了亚毫米级表面细节的生成,弥补了传统方法在衣物褶皱等高频细节上的不足。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

三个层级模块并非孤立运作,而是形成从宏观姿态到微观特征的递进式优化链条:骨架增强模块建立的准确骨骼框架为关节定位提供基础,关节增强策略稳定的关节预测又为皱纹细化创造了低噪声的几何环境。整个框架通过端到端训练实现多层次几何信号的联合优化,最终输出兼具准确拓扑结构和丰富表面细节的高保真3D人体模型。

效果show time

所提出的多层级几何学习框架在CustomHumanTHuman3.0两个测试集上实现了最先进的性能表现,在人体几何重建任务中显着优于其他现有技术:

在CustomHuman数据集上,倒角距离(CD)提升0.180/0.406,法向一致性(NC)提高0.034,f-score增加6.277;在THuman3.0数据集上,CD指标提升0.355/0.369,NC提高0.047,f-score大幅提升9.861。

这种性能突破源于我们提出的创新性解决方案——通过三级分层建模策略(而非传统单一层次建模)精细化处理人体几何特征,从多层次协同优化人体重建效果,从而实现了更精准的几何细节复原。

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

多场景应用

MultiGO的分层高斯建模技术通过将人体分解为不同精度层级(从基础体型到衣物褶皱和材质纹理逐级细化),并利用高斯溅射点作为3D基元实现高效、高保真的单图重建,使其在虚拟试衣与时尚电商(实时生成可动态调整的3D人体与服装模型)游戏与元宇宙(快速创建个性化虚拟角色并支持细节编辑)以及影视特效(高精度动态人体重建与后期分层调整)等领域具有突出优势,尤其适合需要快速生成且对真实感和多尺度细节还原要求高的应用场景。

虚拟试衣与时尚电商

消费者上传一张全身照片即可生成高保真3D人体模型,系统能自动模拟不同服装的穿着效果(包括衣物褶皱和材质细节),支持360度查看,提升在线购物体验。结合分层建模能力,可区分用户体型(基础层)与服装细节(精细层),实现动态布料仿真。

游戏与元宇宙角色生成

通过单张照片快速创建个性化的3D虚拟形象,分层结构支持灵活调整(如更换发型、配饰等)。高斯溅射点的特性可保留皮肤纹理和光影细节,增强虚拟角色的真实感。适用于社交元宇宙、NPC批量生成等场景,显着降低美术资源生产成本。

影视特效与虚拟制作

在特效制作中,仅需演员的单视角照片即可重建高精度3D模型,用于动作捕捉或替身合成。分层设计允许后期单独编辑特定层级(如调整肌肉线条或添加伤痕特效)。结合动态高斯溅射点技术,可进一步实现毛发、湿润皮肤等细微效果的实时渲染。

论文链接:https://arxiv.org/pdf/2412.03103
项目链接:https://multigohuman.github.io/

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/11104.html

(0)
人脑网的头像人脑网
上一篇 2025年5月5日 下午3:01
下一篇 2025年5月5日 下午3:01

相关推荐

  • 质量无损,算力砍半!达摩院视觉生成新架构出道即SOTA|ICLR2025

    算力砍半,视觉生成任务依然SOTA! 达摩院在ICLR 2025上抛出的DyDiT架构:通过时间步长与空间区域的智能资源分配,将DiT模型的推理算力削减51%,生成速度提升1.73倍,而FID指标几乎无损! 更惊人的是,这一突破仅需3%的微调成本。 该方法通过引入动态化调整机制,可精准削减视觉生成任务中50%的推理算力,有效缓解传统扩散模型的计算冗余问题,相…

    2025年4月25日
    1300
  • 老黄唱衰编程,GitHub CEO硬刚:放弃写代码等于放弃智能体话语权

    在最新的媒体采访中,GitHub CEO托马斯·多姆克正面battle最近甚嚣尘上的“编程无用论”。 在他的构想中,2025年是属于编程智能体的一年,但未来仍然属于全体人类程序员。 网友们纷纷表示:终于!看到有人说相反的话了。 与他一同接受采访的CPO马里奥·罗德里格斯,更是直言不讳地说道: 在过去的一年里,这家以“帮助程序员编写更好的代码”为使命的公司,先…

    2025年5月20日
    700
  • Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

    全网刷屏的Claude系统提示词,结果被卡帕西大神当场抓虫?! 事情是这样的。 一夜之间,近1.7万字系统提示词——包含24000个token,详细定义了模型行为、工具使用和引用格式…..全部细节直接在GitHub上被泄露了! 这事儿一出,网友蜂拥而至速速围观,甚至亲切地称呼这次意外泄漏事件是提示技术的金矿。 就在此时,大神卡帕西发现了华点:LLM学习缺少主…

    2025年5月14日
    600
  • OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到

    GPT-4o更新后“变谄媚”?后续技术报告来了。 OpenAI一篇新鲜出炉的认错小作文,直接引来上百万网友围观。 CEO奥特曼也做足姿态,第一时间转发小作文并表示: 概括而言,最新报告提到,大约一周前的bug原来出在了“强化学习”身上—— 一言以蔽之,OpenAI认为一些单独看可能对改进模型有益的举措,结合起来后却共同导致了模型变得“谄媚”。 而在看到这篇报…

    2025年5月3日
    1000
  • 狸谱App负责人一休:从“叫爸爸”小游戏到百万月活AI爆款产品

    消费者和创作者中间有巨大的gap,AI来了以后这个gap有可能被合到一起。 在今年的中国AIGC产业峰会上,狸谱App负责人一休以创业公司的视角,同与会嘉宾和在线观众一起分享了浸入AI产品创业的所思所感。 狸谱App是一个集同人创作、虚拟互动和社区交流于一体的AIGC二次元社区产品,用户群体主要是05后年轻人。产品上线后,仅4个月即达到百万月活。 一休表示,…

    2025年4月24日
    2500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信