(通讯员 李宇楠)3月13日,2024年国际人工智能顶级会议AAAI竞赛奖项正式颁布,来自3522vip浦京集团大数据与视觉智能研究所博士研究生冯冠文、本科生钱之浩、硕士研究生程昊然、麻志远组成的BDIV Lab团队在苗启广和李宇楠两位老师的共同指导下,从中国科学技术大学、华南理工大学、中国平安科技、上海学深智能科技、VAST等海内外十多家单位的参赛队伍中脱颖而出,在AAAI2024 Workshop AI for Digital Human的任务3:Multi-modal Learning for Audio-driven Talking Head Generation夺冠。
比赛获奖证书
本专题的竞赛议程聚焦于AIGC(Artificial Intelligence Generated Content)中的数字人生成领域,从两个赛道进行综合评估,分别是单图像赛道(Single Image Setting)和视频赛道(Video Setting)。在单图像赛道中,团队的方法以3DMM 系数为媒介,通过特征提取、系数融合预测和渲染三个模块实现视频序列的生成。在视频赛道中,团队采用神经辐射场的基本框架,用辐射场分别建模生成头部和躯干部分,最后将头部与躯干融合形成最终视频。
单图像赛道方法框架 视频赛道方法框架
据悉,在苗启广教授的带领下,大数据与视觉智能研究所近年来在图像/视频处理及人体行为智能识别等领域开展了大量研究,在面向细粒度情感控制的面部生成方面取得了一定成果。
成果链接:https://peterfanfan.github.io/EmoSpeaker/