在2025年6月26日至7月4日于韩国大田市举行的第39次联合视频专家组(Joint Video Experts Team, JVET)会议中,我集团陈震中教授课题组四位同学,博士生张莙茜,付年祥,马文卓以及硕士生张文卓参会并汇报了提交的3份国际标准技术提案(JVET-AM0175,JVET-AM0177,JVET-AM0178)。其中两份技术提案被采纳,一份技术提案纳入JVET探索性实验EE1中。
其中,我集团25级研究生陈鑫鑫等人完成的提案《EE1-3.2: Deep Reference Frame Generation for Inter Prediction Enhancement》(编号:JVET-AM0175)被采纳到NNVC(Neural Network-based Video Coding)参考软件中。作为NNVC中首个被采纳的帧间编码工具,标志着深度学习技术在视频编解码国际标准制定中的技术创新开拓了新的方向,推动了传统基于规则的预测模型向数据驱动的端到端学习范式转变。
在视频编解码中,帧间预测技术通过利用已解码帧间的时间相关性,降低冗余信息、提升压缩效率,是编码效率提升的关键环节。尽管已有多项深度神经网络方法在帧内压缩和后处理等方向取得成果,但深度帧间预测技术的标准化推进仍处于初期阶段,缺乏统一技术框架与参考实现。JVET-AM0175提案提出了一种基于插帧网络的深度参考帧生成方法。该方法利用已解码的两个参考帧通过深度学习技术生成一个虚拟参考帧,并将其添加到参考帧列表,为运动估计与预测提供更丰富的信息来源,从而有效提升编码性能。相较于NNVC官方参考软件,所提出方法在通用测试序列上获得了大幅编码性能提升。作为NNVC中首个被采纳的帧间编码工具,本次提案的成功采纳,引起了多国专家的广泛关注,并获得视频压缩标准化组织及多家企业的积极评价。
联合视频专家组(JVET)由国际电信联盟ITU-T VCEG(视频编码专家组)与ISO/IEC MPEG(动态图像专家组)联合成立,致力于推动全球视频编码技术标准的研究与制定,先后制定了AVC/H.264、HEVC/H.265、VVC/H.266等主流视频编码标准,是全球视频压缩领域最具权威性的国际标准组织之一,所颁布的视频编码标准被视频行业所广泛采用,包括各大视频网站、短视频应用、视频会议等等。
太阳集团官网陈震中教授课题组长期积极参与视频编解码国际国家标准制定工作,迄今已有数十份技术提案被国际、国家标准组织采纳,参与研制了H.264/AVC、H.265/HEVC、H.266/VVC、MPEG VCM/FCM、JPEG-AI、AVS1/2/3等视频编码标准。同时,本次NNVC提案也是陈震中教授课题组与腾讯多媒体实验室长期校企合作的成果,前期工作历时近4年,合作提案多达10余份,先后多名学生通过参与JVET标准工作以及校企合作,获得了腾讯公司的实习以及就业机会,包括了3名“技术大咖”项目和“青云计划”项目获得者。