科研成果
北师大人工智能学院黄永祯教授团队三篇论文被顶级会议/期刊录用
TIFS(IEEE Transactions on Information Forensics and Security),是信息安全领域国际顶级期刊之一,该期刊发表的文章包括对数字取证、隐写术、密码学、网络安全、多媒体安全等方面的原创研究成果,它在信息取证和安全领域具有较高的声誉和影响力,被推荐为CCF-A类期刊。
论文介绍
论文题目:Integral Pose Learning via Appearance Transfer for Gait Recognition
论文作者:黄攀坚,侯赛辉,曹春水,刘旭,胡学财,黄永祯
通讯作者:黄永祯,胡学财
论文概述:步态识别技术在视频监控及安全领域扮演着核心角色,其通过分析个体独一无二的行走模式实现人员辨认。当前的识别技术在可控环境下,凭借形态与动态特征的精准解析,已取得了显著的准确度。然而,面临由极端外观变化引起的辨别特征失真时,该技术在跨越不同变量条件下的表现尚存不足。 本研究首先揭示了一个关键发现:即便在个体外观多样化的背景下,每个人行走时剪影的完备姿态仍保留有一种稳定的、与外观无关的身份辨识信息。遗憾的是,现有步态数据库中外观变量的单一性限制了模型有效抽取这种姿态特征的能力。 针对这一挑战,我们创新性地设计了“外观迁移与姿态解耦生成网络”(GaitApp),旨在创造出兼具多样外观形态与恒定姿态特征的步态轮廓样本。GaitApp通过精细的多分支协作机制,巧妙地将姿态特征与外观特征分离,并实现了跨个体的外观信息迁移。借助这一策略,我们模拟了在控制变量环境下个体外观动态变换的过程,从而极大地促进了下游模型学习和提炼出稳固且具有高度辨别力的完备姿态特征的能力。 广泛的实验验证证明,我们的方法显著提升了主流步态识别模型的识别水平,为跨协变量条件下的步态识别研究开辟了新的视野与可能性,推动了该领域向更深层次的探索迈进。
计算机视觉和模式识别大会(IEEE/CVF Computer Vision and Pattern Recognition Conference,简称CVPR),该会议是由IEEE计算机协会和计算机视觉基金会(Computer Vision Foundation,CVF)共同主办,议程包括主会议和各类专题研讨会,是世界公认的人工智能和计算机视觉领域顶级学术会议之一,享有卓越的学术声誉。该会议每年举行一次,被推荐为CCF-A类会议。
论文介绍
论文题目:POPDG: Popular 3D Dance Generation with PopDanceSet
论文作者:骆振业,任民,胡学财,黄永祯,姚力
通讯作者:黄永祯,胡学财
论文概述:在跨模态领域,根据音乐生成既逼真又与音乐保持一致的舞蹈仍然是一项具有挑战性的任务。本文发布了首个根据年轻观众的喜好量身定制的音乐生成舞蹈数据集PopDanceSet,在音乐流派的多样性以及舞蹈动作的复杂性方面,它超越了此前最大的数据集AIST++。为了进一步提升舞蹈生成效果,本文在iDDPM框架内提出的POPDG模型,以增强生成舞蹈的多样性,并通过空间增强算法加强了人体关节之间的空间物理连接,确保增加的多样性的同时不会影响生成质量。本文还设计了一个流线型的对齐模块,以提升舞蹈和音乐之间的对齐效果。大量实验表明,POPDG在PopDanceSet以及AIST++数据集上实现了当前最好的结果。此外,本文还扩展了生成舞蹈的评估指标。
AAAI (AAAI Conference on Artificial Intelligence) 是由国际先进人工智能协会主办,人工智能领域的顶级国际学术会议之一。自1979年成立以来,已成为展示人工智能领域最新研究成果和进展的重要平台,并致力于推动人工智能科学的发展和应用,在国际上具有深远的影响力。该会议被推荐为CCF-A类会议。
论文介绍
论文题目:Disentangled Diffusion-Based 3D Human Pose Estimation with Hierarchical Spatial and Temporal Denoiser
论文作者:蔡清源、胡学财、侯赛辉、姚力、黄永祯
通讯作者:黄永祯、侯赛辉
论文概述:最近,一些基于扩散模型的三维人体姿态估计算法在当前公开的数据集上取得了SOTA的结果,这些算法的核心是直接将2D人体姿态直接回归成3D人体姿态。当前也有一些方法通过解耦的方式,将3D人体姿态的回归任务解耦成3D骨骼长度和3D骨骼方向两个子任务,进而组合成三维人体姿态。但是实验结果表明,由于人体骨骼天然存在的树形连接方式,这种方法在利用解耦出的3D骨骼长度和3D骨骼方向组合3D人体姿态时,会造成更大的层级累计误差,进而影响模型整体的性能。
针对于这个问题,我们提出了一个名为DDHPose的三维人体姿态估计方法,该方法包括(1)基于扩散模型的解耦建模方法;(2)层级空间-时序去噪器。通过在两个公共数据集 (Human3.6M、MPI-INF-3DHP) 的实验,验证了所提出DDHPose方法的有效性。
联系电话:010-58807943
邮编:100875
地址:北京市海淀区新外大街19号电子楼