為什么非得用雙目相機才能得到深度?我閉上一只眼只用一只眼來觀察,也能知道哪個物體離我近哪個離我遠??!是不是說明單目相機也可以獲得深度?
首先,確實人通過一只眼也可以獲得一定的深度信息,不過這背后其實有一些容易忽略的因素在起作用:
一是因為人本身對所處的世界是非常了解的(先驗知識),因而對日常物品的大小是有一個基本預判的(從小到大多年的視覺訓練),根據近大遠小的常識確實可以推斷出圖像中什么離我們遠什么離我們近;
二是人在單眼觀察物體的時候其實人眼是晃動的,相當于一個移動的單目相機,這類似于運動恢復結構(Structure from Motion, SfM)的原理,移動的單目相機通過比較多幀差異確實可以得到深度信息。
但是實際上,相機畢竟不是人眼,它只會傻傻的按照人的操作拍照,不會學習和思考。
下圖從物理原理上展示了為什么單目相機不能測量深度值而雙目可以的原因。
我們看到紅色線條上三個不同遠近的黑色的點在下方相機上投影在同一個位置,因此單目相機無法分辨成的像到底是遠的那個點還是近的那個點,但是它們在上方相機的投影卻位于三個不同位置,因此通過兩個相機的觀察可以確定到底是哪一個點。
相關閱讀:雙目攝像頭產品介紹