让相机真正看清世界:科学家打造出新型“计算成像镜头”,可实现全场景同时对焦

抖音秀 热点资讯 2

12 月 2 日消息,长期以来,传统相机镜头只能在单一平面实现清晰对焦(一片透镜在同一时刻,只能形成一个统一的焦平面),景深范围有限,即便缩小光圈也会因衍射而带来画质损失。这意味着相机必须在大光圈、景深、分辨率之间不断妥协。

为此,卡内基梅隆大学(CMU)秦颖思团队开发出了一种能够让整幅画面从近景到远景同时清晰成像的新型“计算成像镜头”,为摄影、显微成像和移动设备光学带来潜在变革性突破。

相关成果已在 2025 年国际计算机视觉大会(ICCV)上发表,并获得 ICCV2025 最佳论文荣誉提名。

研究者基于 Lohmann 镜头结构,通过两片可相对移动的三次曲面镜片调节焦点,并结合相位型空间光调制器,使系统能够在画面不同区域实现不同深度的同时对焦。这种“光学 + 算法”结合的计算镜头能让场景各部分分别获得最佳清晰度。

这一系统级突破由两大核心创新共同支撑:在光学硬件层面,我们实现了首个可对不同传感器像素赋予不同焦距的可编程光学结构。在算法层面,我们同样首次提出了能够驱动不同图像区域进行独立自动对焦的算法框架。

在自动对焦方面,系统采用两种方法协同工作:对比度检测自动对焦(CDAF)将图像划分为多个区域,各自寻找最清晰的焦点;相位检测自动对焦(PDAF)利用双像素传感器判断焦点偏移方向,可提升速度并适应动态场景。团队修改后的传感器可在 21 帧 / 秒下运行,使多深度同步对焦具备实用性。

这项技术让相机第一次摆脱“只有一个焦平面”的限制 —— 把对焦从一个平面升级为可自由编程、可随场景变化的焦曲面。

它可以让相机在任何复杂、起伏剧烈的三维场景中做到真正的“全场景清晰”。无论深度多么不规则,相机都能在一次曝光中让各区域自动对到正确的位置,让对焦成为一个可编程的维度,不再受光圈与景深的物理限制,可以自由、直观地交互调控。

它可以让相机“看穿”前景的小遮挡。比如,拍人像时,如果前面有铁丝网、树枝,传统相机会把它们拍进去。而新系统可以让这些遮挡在光学上直接变得极其模糊甚至不可见,只聚焦在主体与背景。

它还能帮你进行创意虚化。告诉相机“让凯旋门和远方楼群清晰对焦,其他地方都要模糊”,相机就能直接拍出这种效果,无需任何后期处理。

研究人员表示,该设计属于全新的光学类别,潜在应用范围广泛。显微镜可一次性捕获样本全层结构;自动驾驶系统有望获得更高质量的环境感知;增强和虚拟现实设备也可能借助类似技术改善深度呈现效果。团队认为,这种可为不同像素分配独立焦点调节能力的新型镜头设计,或将重新定义相机的成像方式。

秦颖思个人资料页显示,她拥有哥伦比亚大学计算机科学专业的理学学士学位、科尔盖特大学物理学专业的文学学士学位,目前是卡内基梅隆大学电气与计算机工程专业的博士候选人,曾在 Meta Reality Labs 显示系统研究部(2024 年、2025 年)和 Snap Research 计算成像部(2020 年)、谷歌搜索部门(2019 年)担任实习生。

▲  秦颖思(图源个人博客:https://yingsiqin.github.io/)

附论文地址:
https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatially_Varying_Autofocus.pdf