承担社会责任 提升成员能力
2025年9月6日,CCF YOCSEF合肥顺利举办了主题为“三维场景信息建模和传输技术未来发展之路”深度技术论坛。本次论坛聚焦于三维场景信息的高效建模、存储传输与实时渲染等关键技术进行深入讨论,以期推动该领域的进一步发展。论坛汇聚了来自三维视觉信息处理与编码的学者、工业界专家及YOCSEF委员共计40多位参与讨论。
开场环节
本次论坛执行主席为YOCSEF合肥主席、中国科学技术大学李礼,以及YOCSEF合肥AC委员、安徽财经大学袁明磊。执行主席李礼首先介绍了论坛主题,并对与会嘉宾表示热烈欢迎。随后,YOCSEF合肥主席李礼介绍了YOCSEF由来以及其“人人平等,直呼其名”的价值观。
引导发言报告环节
中国科学技术大学,陈雪锦做了题为《三维表征的未来:统一还是多样?》的引导报告。她首先从传统计算机图形学的角度回顾了三维表征技术发展脉络。然后,重点阐述了基于显式几何表达与运动表达相关的研究进展,包括自监督物体表面网格重建和基于层级结构的动态场景神经渲染,并从三维表征的显示、传输、编辑与生成等角度出发对统一表示与多样表示两种技术路径进行了对比分析。
清华大学深圳国际研究生院,金欣做了题为《ISO/IEC MPEG微镜光场视频编码标准进展与展望》的引导报告。她首先介绍了光场相机的工作原理、光场采集与成像方式、以及基于微镜视频的光场统一表征结构。随后,重点阐述了微镜视频编码在MPEG的标准化历程,涵盖应用场景、技术需求、数据集与评估方法、压缩架构、以及性能评价,并对后续的标准化工作计划进行了展望。
浙江大学,廖依伊做了题为《MPEG GSC标准化探索与展望》的引导报告。她首先介绍了MPEG对于沉浸式媒体编码的发展历程:从点云到mesh再到多视角视频,并介绍了辐射场编码从NeRF到3D Gaussian Splatting的演进。随后,重点介绍了GSC在标准化过程中面临的挑战与问题,以及由此而发展来的I-3DGC Track、A-3DGS Track和I-3DGS 1-F Track三种技术路线的进展,最后介绍了软件平台GSCodec Studio等工作。
上海交通大学,胡强做了题为《面向沉浸式通信的跨尺度重建与呈现》的引导报告。他首先介绍了沉浸式体积视频智能编码的应用场景,以及体积视频重建面临的挑战。随后重点介绍了基于高斯表征的体积视频压缩3DGC、分层渐进式体积视频编码4DGCPro、边云协同体积视频实时传输与交互的平台构建、对齐几何语义的稀疏室内重建AlignGS以及基于云渲染平台的实时呈现与交互等工作。
思辨环节
本次论坛共设置了三个思辨议题,旨在探索三维场景信息建模和传输技术未来发展路径。议题一:适配实际场景的三维信息载体应具备什么特点?现有信息载体各自有何优劣?议题二:静态或动态场景高效压缩传输的技术和标准化路径。议题三:三维信息真的会有“流”起来的一天吗?三个议题形成“总-分-总”逻辑结构。首先所有嘉宾共同讨论三维场景的信息载体问题,然后分成两组,分别围绕采集数据(如多视角视频、光场视频等)和中间数据(NeRF、3D Gaussian等)在静态和动态场景下的高效压缩传输技术和标准化路径展开深入讨论,最后所有嘉宾共同畅想三维信息真的会有“流”起来的一天吗?
议题一:适配实际场景的三维信息载体应具备什么特点?现有信息载体各自有何优劣?
该议题邀请了中国科学技术大学张举勇、上海交通大学鲁国、臻像光电高超作为思辨嘉宾,由他们为议题一做引导发言。在该议题下,嘉宾们针对三维信息载体应该具备的特点,以及现有三维信息载体的优劣进行深入讨论,并在以下方面形成共识。三维信息载体应具备的特点:1)方便获取:采集设备简单高效;2)表达紧致:适合高效存储和传输;3)实时渲染:支持沉浸式体验实时呈现;4)编辑友好:便于内容生成与后期处理。现有三维信息载体的优势和不足:1)多视角和光场视频等作为三维信息载体较为方便快捷,但其本质是2.5D,难以满足沉浸式交互需求;2)NeRF对于静态场景重建质量高,但存在渲染速度慢、动态处理能力有限等问题;3)3D Gaussian在获取效率、表达紧凑与渲染性能等方面综合能力较好,但是目前可编辑性较弱。目前并没有完美的3D表征。
议题二:静态和动态场景高效压缩传输的技术和标准化路径
该议题采用分组讨论形式。分组一讨论多视角和光场等采集数据用于高效压缩传输静态和动态场景的技术和标准化路径。分组一邀请中山大学张云、山东大学元辉、中国移动研究院赵丽丽作为思辨嘉宾,由他们为议题二分组一做引导发言。在该议题下,嘉宾们形成以下共识:1)目前2D视频有成熟的编解码方案和硬件生态,若能将3D编码技术设计为兼容现有2D体系,将更有利于其在实际系统中的推广应用。2)业界期待形成一种主流的3D格式,支持与其他格式的相互转换。建立统一的企业标准,有利于推动国家倡导的数据流通战略。3)非标的私有化部署以及标准化的可流通部署各有其适用场景,压缩技术本身处于持续演进中,不存在一劳永逸的框架。
分组二聚焦3D Gaussian用于高效压缩传输静态场景或物体的技术和标准化路径。分组二邀请中国科学技术大学李鑫、上海交通大学程正雪、南京大学陈彤作为思辨嘉宾,由他们为议题二分组二做引导发言。在该议题下,嘉宾们形成以下共识:1)在压缩对象方面,3D Gaussian相比多视角图像更适配视角数量较多时的三维信息编码传输场景;2)在评价指标方面,3D Gaussian压缩应该同时考虑2D和3D视角下的评价指标,同时考虑不同视角的图像以及无压缩3D模型作为ground truth;3)在技术路径方面,可以考虑现有基于V-PCC或者G-PCC的方案;4)在应用场景方面,可以优先针对结构化明显的数字人,以及其他国家重点需求定制标准。
议题三:三维信息真的会有“流”起来的一天吗?
在该议题下,嘉宾们针对三维信息“流”起来的必要性和可行性进行深入讨论,并在以下方面形成共识。在必要性方面:1)虽然现有硬件和模型尚未满足高效三维传输需求,但存在强烈需求,尤其是会议场景下实现身临其境的体验,三维信息流动具有现实必要性。2)不同场景对三维信息的要求存在差异,在消费类电子场景,沉浸式体验相比三维信息更重要;在医疗等信息要求极高的精准领域,高质量、高保真的三维信息本身具有不可替代的重要价值。在可行性方面:1)前端采集的便捷性与终端显示的舒适性是面向普通消费者应用成功的关键,中间环节的编码与传输技术终将逐步突破并实现成熟落地;2)参考超高清视频技术的普及路径,三维技术的推广同样将遵循“体验驱动”的逻辑。当前计算架构已逐步支持三维数据处理,未来随着显示技术的迭代升级,三维内容的常态化呈现具备扎实的发展基础。
论坛最后,执行主席李礼对本次深度技术论坛进行了总结。与会嘉宾经过充分交流和思辨,在三维信息载体、压缩和流动等关键议题方面形成了重要技术共识。本次论坛由中国计算机学会(CCF)主办,YOCSEF合肥学术委员会组织。
CCF YOCSEF合肥成立于2011年,是中国计算机学会青年计算机科技论坛在全国的28个分论坛之一。CCF YOCSEF合肥将肩负引领学术前沿探索的重任,针对计算机学术、产业和技术进行研讨思辨,思其本质、辨其真伪。CCF YOCSEF合肥成员主要来自合肥高校和计算机信息类企业中的专家教授与负责人。欢迎各界学术和产业精英加入YOCSEF合肥。