双目相机深度的误差分析(基线长度和相机焦距的选择)

article/2025/6/20 20:17:56

全文基于针孔模型和基线水平放置来讨论

影响双目计算深度的因素:

  • 1、基线长度:两台相机光心之间距离
  • 2、相机焦距(像素): f x f_x fx(或 f y f_y fy)为焦距 f f f和一个缩放比例的乘积。在针孔相机模型中,焦距 f f f 是从针孔(即光心)到成像平面的距离。而 f x f_x fx实际上指的是以像素为单位的“有效焦距”,它将物理世界中的距离转换到了图像坐标系下的像素距离,在讨论相机时,一般是讨论 f x f_x fx(或 f y f_y fy)。
  • 3、算法匹配的精确度:计算视差时候的精度
  • 4、物体深度:随着物体越远,理论误差会越大

当我们有两个不同位置拍摄的同一物体的图像时,可以通过比较这两个图像中物体的位置差异(即视差)来计算该物体与相机之间的距离。
请添加图片描述

根据相似三角形原理,可以得到视差与深度关系:
disparity = x − x ′ = B f Z \text{disparity} = x - x' = \frac{Bf}{Z} disparity=xx=ZBf

  • xx’ 分别表示对应于3D场景点X在两张图片中的位置。
  • B 是两个相机之间的距离,即基线长度。
  • f 是相机的焦距(像素)。
  • Z 是物体到相机平面的距离(深度)。
  • disparity 是同一个点在两个不同视角下的图像中的水平位移。一般会把图像在y轴对齐,之后沿着x轴搜索对应的像素。
    可参考opencv文档:https://docs.opencv.org/4.x/dd/d53/tutorial_py_depthmap.html

可以得到深度的计算公式为:
Z = B f disparity Z = \frac{Bf}{\text{disparity}} Z=disparityBf
可以看深度和视差成反比,深度焦距(像素)或者基线长度成正比关系,我们测量深度时候,肯定是希望越准确越好,因此焦距和基线长度在硬件上面需要好好选型,而视差是跟算法相关,视差的计算肯定是存在误差,这会导致深度估计肯定也有误差,因此像素匹配越精确越好。

焦距:

先补充一些焦距知识:
我们首先要确认研究的范围,假设研究深度是15m-24m,水平视野FOV是40°。对此,我们肯定会选取水平视野为40°的相机,如果对应镜头是8mm,图像大小是1920*1200,根据
Sensor Size = 2 × f × tan ⁡ ( FOV 2 ) \text{Sensor Size} = 2 \times f \times \tan(\frac{\text{FOV}}{2}) Sensor Size=2×f×tan(2FOV)
所以,传感器尺寸为

Sensor Size = 2 × 8 × tan ⁡ ( 40 ∘ / 2 ) ≈ 5.76 mm \text{Sensor Size} = 2 \times 8 \times \tan(40^\circ / 2) \approx 5.76\text{mm} Sensor Size=2×8×tan(40/2)5.76mm

计算像素焦距
像素焦距通常指的是将物理焦距转换到像素域的比例因子。可以通过下面的公式估算:
Pixel Focal Length = Focal Length in mm Sensor Size in mm × Image Size in pixels \text{Pixel Focal Length} = \frac{\text{Focal Length in mm}}{\text{Sensor Size in mm}} \times \text{Image Size in pixels} Pixel Focal Length=Sensor Size in mmFocal Length in mm×Image Size in pixels
因此,水平方向像素焦距fx为:
Pixel Focal Length = 8 5.76 × 1920 ≈ 2667 pixels (标定实测结果是 2672 p i x e l ) \text{Pixel Focal Length} = \frac{8}{5.76} \times 1920 \approx 2667\text{ pixels} \\(标定实测结果是2672pixel) Pixel Focal Length=5.768×19202667 pixels(标定实测结果是2672pixel

平时工作我们会更换镜头,测试哪个焦距效果更好,那么假设保持传感器不变,更换16mm镜头,那么像素焦距和视野怎么变呢?
FOV = 2 × arctan ⁡ ( Sensor Size 2 × f ) \text{FOV} = 2 \times \arctan\left(\frac{\text{Sensor Size}}{2 \times f}\right) FOV=2×arctan(2×fSensor Size)
所以新视野为:
FOV = 2 × arctan ⁡ ( 5.76 2 × 16 ) ≈ 20 ∘ \text{FOV} = 2 \times \arctan\left(\frac{\text{5.76}}{2 \times 16}\right) \approx 20^\circ FOV=2×arctan(2×165.76)20
Pixel Focal Length = 16 5.76 × 1920 ≈ 5333 pixels (标定实测结果是 5419 ) \text{Pixel Focal Length} = \frac{16}{5.76} \times 1920 \approx 5333\text{ pixels} \\(标定实测结果是5419) Pixel Focal Length=5.7616×19205333 pixels(标定实测结果是5419

对此,我们可以得到结论:

  • 视野大小与焦距成反比关系。
  • 像素焦距与物理焦距成正比关系。

双目视觉基础

在双目视觉系统中,假设两个相机的焦距为 f f f(单位:像素),基线长度(两相机光心之间的距离)为 B B B(单位:米),某点在左、右图像上的投影坐标分别为 ( x l , y ) (x_l, y) (xl,y) ( x r , y ) (x_r, y) (xr,y),其中 x l x_l xl x r x_r xr 分别是该点在左右图像中的横坐标, y y y 是纵坐标(由于进行了极线校正,所有对应点都在同一水平线上)。则该点的视差 d d d 定义为:

d = x l − x r d = x_l - x_r d=xlxr

深度计算公式

根据相似三角形原理,在已知焦距 f f f、基线 B B B 以及视差 d d d 的情况下,可以计算出物体到相机的距离 Z Z Z(即深度)如下:

Z = f B d Z = \frac{fB}{d} Z=dfB

这里的 Z Z Z 表示的是物体相对于相机平面的实际距离。

深度误差分析

为了计算深度误差 Δ Z \Delta Z ΔZ,我们需要考虑视差测量误差 Δ d \Delta d Δd 对深度计算的影响。通过微分法对深度公式进行变换,我们可以得到深度误差与视差误差之间的关系:

Z = f B d Z = \frac{fB}{d} Z=dfB

对上式两边同时取微分,得:

d Z = − f B d 2 d d dZ = -\frac{fB}{d^2}dd dZ=d2fBdd

从而,

Δ Z = ∣ d Z d d ∣ Δ d = f B d 2 Δ d \Delta Z = \left| \frac{dZ}{dd} \right| \Delta d = \frac{fB}{d^2} \Delta d ΔZ= dddZ Δd=d2fBΔd

Z = f B d Z = \frac{fB}{d} Z=dfB 代入上述公式中替换掉 f B d 2 \frac{fB}{d^2} d2fB,可得:

Δ Z = Z 2 ⋅ Δ d f B \Delta Z = \frac{Z^2 \cdot \Delta d}{fB} ΔZ=fBZ2Δd

这个公式说明了深度误差与物体到相机的距离平方成正比,与视差误差成正比,而与焦距和基线长度成反比。这表明对于远距离物体,即使是小的视差误差也会导致较大的深度误差;相反,增加焦距或基线长度可以减小深度误差。


根据之前的参数(相机分辨率为1920x1200,焦距为2667像素,基线长度为400mm,工作距离在15m到24m之间),我们可以对视差误差进行评估。

计算过程

给定条件:

  • 工作距离 Z Z Z:15m 到 24m
  • 焦距 f f f:2667 像素
  • 基线长度 B B B:0.4 米

假设视差误差 Δ d \Delta d Δd为1像素(很理想的状态了,实际更大),我们可以计算出不同工作距离下的深度误差 Δ Z \Delta Z ΔZ

对于15米的工作距离

Δ Z 15 m = ( 15 ) 2 ⋅ 1 2667 ⋅ 0.4 = 225 1066.8 ≈ 0.2109 米 \Delta Z_{15m} = \frac{(15)^2 \cdot 1}{2667 \cdot 0.4} = \frac{225}{1066.8} \approx 0.2109 \text{米} ΔZ15m=26670.4(15)21=1066.82250.2109

对于24米的工作距离

Δ Z 24 m = ( 24 ) 2 ⋅ 1 2667 ⋅ 0.4 = 576 1066.8 ≈ 0.5721 米 \Delta Z_{24m} = \frac{(24)^2 \cdot 1}{2667 \cdot 0.4} = \frac{576}{1066.8} \approx 0.5721 \text{米} ΔZ24m=26670.4(24)21=1066.85760.5721

工作距离 (米)误差 ($ \Delta Z $,米)
15 15 2 1066.8 ≈ 0.2109 \frac{15^2}{1066.8} \approx 0.2109 1066.81520.2109
16 16 2 1066.8 ≈ 0.2403 \frac{16^2}{1066.8} \approx 0.2403 1066.81620.2403
17 17 2 1066.8 ≈ 0.2722 \frac{17^2}{1066.8} \approx 0.2722 1066.81720.2722
18 18 2 1066.8 ≈ 0.3065 \frac{18^2}{1066.8} \approx 0.3065 1066.81820.3065
19 19 2 1066.8 ≈ 0.3433 \frac{19^2}{1066.8} \approx 0.3433 1066.81920.3433
20 20 2 1066.8 ≈ 0.3824 \frac{20^2}{1066.8} \approx 0.3824 1066.82020.3824
21 21 2 1066.8 ≈ 0.4239 \frac{21^2}{1066.8} \approx 0.4239 1066.82120.4239
22 22 2 1066.8 ≈ 0.4679 \frac{22^2}{1066.8} \approx 0.4679 1066.82220.4679
23 23 2 1066.8 ≈ 0.5142 \frac{23^2}{1066.8} \approx 0.5142 1066.82320.5142
24 24 2 1066.8 ≈ 0.5721 \frac{24^2}{1066.8} \approx 0.5721 1066.82420.5721

因此,在1像素的视差误差下,对于15米的工作距离,预计的深度误差大约为0.2109米;而对于24米的工作距离,深度误差大约为0.5721米。这个计算是基于理想的视差估计误差为1像素的情况。实际上,视差估计误差可能会大于1像素,特别是在存在图像噪声、光照变化或纹理缺乏的情况下,这将导致更大的深度误差。

从上面可以看到当距离较远时,对我们的匹配要求的准确度极高,这是很难做到的,因此需要升级硬件,从深度的误差公式,我们可以看到,在匹配算法无法优化的情况下,可以增大焦距和基线的长度,焦距增大n倍,则深度误差少n倍;基线长度长n倍,则深度误差少n倍。


标定的效果也会影响到深度误差:

焦距误差对深度误差的影响

假设焦距存在一个微小的误差 Δ f \Delta f Δf,我们想要知道这个误差如何影响最终计算出来的深度 Z Z Z。为此,我们需要对原始深度公式进行微分,以找到焦距误差 Δ f \Delta f Δf 与深度误差 Δ Z \Delta Z ΔZ 之间的关系。
原公式:
Z = f B d Z = \frac{fB}{d} Z=dfB
首先,将原始深度公式两边同时对 f f f 求导,得到:

∂ Z ∂ f = B d \frac{\partial Z}{\partial f} = \frac{B}{d} fZ=dB

这表示深度 Z Z Z 对焦距 f f f 的变化率。因此,对于一个小的焦距误差 Δ f \Delta f Δf,对应的深度误差 Δ Z \Delta Z ΔZ 可以近似为:

Δ Z ≈ ∂ Z ∂ f Δ f = B d Δ f \Delta Z \approx \frac{\partial Z}{\partial f} \Delta f = \frac{B}{d} \Delta f ΔZfZΔf=dBΔf

但是,通常更关心的是相对误差,即深度误差相对于实际深度的比例。所以,我们将上面的结果转换成相对形式:

Δ Z Z ≈ Δ f f \frac{\Delta Z}{Z} \approx \frac{\Delta f}{f} ZΔZfΔf

这是因为:

Z = f B d Z = \frac{fB}{d} Z=dfB

所以,

Δ Z Z = B d Δ f f B d = Δ f f \frac{\Delta Z}{Z} = \frac{\frac{B}{d}\Delta f}{\frac{fB}{d}} = \frac{\Delta f}{f} ZΔZ=dfBdBΔf=fΔf

这意味着焦距误差导致的深度误差与其相对于焦距的比例相同。换句话说,如果焦距测量存在1%的误差,则计算出的深度也会有大约1%的误差。如果焦距有1%,此时深度是20m,则深度的误差就有0.2m。这种线性关系表明,在设计和校准双目视觉系统时,精确确定焦距是非常重要的,因为它直接影响到深度估计的准确性。


接下来推导 基线长度误差(即双目相机之间的距离误差)与 深度误差 之间的关系。

基线长度误差对深度误差的影响

原公式:
Z = f B d Z = \frac{fB}{d} Z=dfB

将深度公式视为关于 B B B 的函数:

Z ( B ) = f B d Z(B) = \frac{fB}{d} Z(B)=dfB

对其求微分:

∂ Z ∂ B = f d \frac{\partial Z}{\partial B} = \frac{f}{d} BZ=df

所以,当基线长度存在一个小的误差 Δ B \Delta B ΔB 时,对应的深度误差近似为:

Δ Z ≈ ∂ Z ∂ B ⋅ Δ B = f d ⋅ Δ B \Delta Z \approx \frac{\partial Z}{\partial B} \cdot \Delta B = \frac{f}{d} \cdot \Delta B ΔZBZΔB=dfΔB

也可以用相对误差形式表示:

Δ Z Z = Δ B B \frac{\Delta Z}{Z} = \frac{\Delta B}{B} ZΔZ=BΔB

因为:

Δ Z Z = f d Δ B f B d = Δ B B \frac{\Delta Z}{Z} = \frac{\frac{f}{d} \Delta B}{\frac{fB}{d}} = \frac{\Delta B}{B} ZΔZ=dfBdfΔB=BΔB

绝对误差关系:

Δ Z = f d ⋅ Δ B \Delta Z = \frac{f}{d} \cdot \Delta B ΔZ=dfΔB
相对误差关系:

Δ Z Z = Δ B B \frac{\Delta Z}{Z} = \frac{\Delta B}{B} ZΔZ=BΔB

  • 深度误差 Δ Z \Delta Z ΔZ 与基线误差 Δ B \Delta B ΔB 成正比。
  • 如果你高估了基线长度( Δ B > 0 \Delta B > 0 ΔB>0),那么你也会高估物体的深度( Δ Z > 0 \Delta Z > 0 ΔZ>0)。
  • 在相对误差层面,深度误差百分比等于基线误差百分比。例如,如果基线被低估了5%,则深度也会被低估5%。
  • 这说明在双目系统中,精确测量基线长度非常关键,尤其是在远距离测量或高精度应用中。

计算(使用之前参数)
  • 焦距 f = 2667 f = 2667 f=2667 像素
  • 基线 B = 0.4 B = 0.4 B=0.4
  • 工作距离 Z = 24 Z = 24 Z=24
  • 视差 d = f B Z = 2667 × 0.4 15 = 72 d = \frac{fB}{Z} = \frac{2667 \times 0.4}{15} = 72 d=ZfB=152667×0.4=72 像素

假设基线误差 Δ B = 1 \Delta B = 1 ΔB=1 mm = 0.001 m:

Δ Z = f d ⋅ Δ B = 2667 72 ⋅ 0.001 = 37 ⋅ 0.001 = 0.037 米 = 3.7 cm \Delta Z = \frac{f}{d} \cdot \Delta B = \frac{2667}{72} \cdot 0.001 = 37 \cdot 0.001 = 0.037 \text{ 米} = 3.7 \text{ cm} ΔZ=dfΔB=7226670.001=370.001=0.037 =3.7 cm

所以在这种情况下,1毫米的基线误差会导致约3.7厘米的深度误差



http://www.hkcw.cn/article/nTbKvbFCGG.shtml

相关文章

Namespace 命名空间的使用

名字空间:划分更多的逻辑空间,有效避免名字冲突的问题 1.什么是命名空间 名字命名空间 namespace 名字空间名 {...} // 名字空间 n1 域 namespace n1 {// 全局变量int g_money 0;void save(int money){g_money money;}void pay(int money){g_money - m…

力扣热题100之翻转二叉树

题目 给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。 代码 方法一:递归 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # …

simulink mask的使用技巧

1.mask界面布局 1.1如何调整控件的位置和控件大小? 反正2020a是调不了, 找了好久,只能是调布局,例如你要调成下面这样: 第一个控件的iTem location属性选择New row 后面跟着的几个和第一个同一行的空间属性选择Cu…

第12讲、Odoo 18 权限控制机制详解

目录 引言权限机制概述权限组(Groups)访问控制列表(ACL)记录规则(Record Rules)字段级权限控制按钮级权限控制菜单级权限控制综合案例:多层级权限控制最佳实践与注意事项总结 引言 Odoo 18 提…

AIGC学习笔记(8)——AI大模型开发工程师

文章目录 AI大模型开发工程师007 LangChain之Model IO模块1 Model IO核心概念2 Model IO代码实战什么是LCEL?ModelModel的分类LLMsChatModel PromptPrompt templatesExample selectorsOutput parsers AI大模型开发工程师 007 LangChain之Model IO模块 1 Model IO核…

Java 文件操作 和 IO(5)-- 综合案例练习 -- 示例一

题目描述:扫描指定目录,并找到名称中包含指定字符的所有普通文件(不包含目录),并且后续询问用户是否要删除该文件 文章目录 题目描述:扫描指定目录,并找到名称中包含指定字符的所有普通文件&…

Leetcode 465. 最优账单平衡

1.题目基本信息 1.1.题目描述 给你一个表示交易的数组 transactions ,其中 transactions[i] [fromi, toi, amounti] 表示 ID fromi 的人给 ID toi 的人共计 amounti $ 。 请你计算并返回还清所有债务的最小交易笔数。 1.2.题目地址 https://leetcode.cn/pro…

【沉浸式求职学习day51】【发送邮件】【javaweb结尾】

沉浸式求职学习 邮件发送原理及实现1.概述2.简单邮件3.复杂邮件 网站注册发送邮件功能实现 邮件发送原理及实现 1.概述 传输协议 SMTP协议 发送邮件: 我们通常把处理用户smtp请求(邮件发送请求)的服务器称之为SMTP服务器(邮件发送服务器)。POP3协议 接收邮件&#…

标题:2025海外短剧爆发年:APP+H5双端系统开发,解锁全球流量与变现新大陆

描述: 2025年出海新风口!深度解析海外短剧系统开发核心(APPH5双端),揭秘高效开发策略与商业化路径,助您抢占万亿美元市场! 全球娱乐消费模式正在剧变。2025年,海外短剧市场已从蓝海…

uni-app学习笔记十六-vue3页面生命周期(三)

uni-app官方文档页面生命周期部分位于页面 | uni-app官网。 本篇再介绍2个生命周期 1.onUnload:用于监听页面卸载。 当页面被关闭时,即页面的缓存被清掉时触发加载onUnload函数。 例如:在demo6页面点击跳转到demo4,在demo4页面回退不了到d…

钉钉红包性能优化之路

一、业务背景 请客红包、小礼物作为饿了么自研的业务产品,在钉钉的一方化入口中常驻,作为高UV、PV的toB产品,面对不同设备环境的用户,经常会偶尔得到一些用户反馈,如【页面白屏太久了】、【卡住了】等等,本…

鲲鹏Arm+麒麟V10 K8s 离线部署教程

针对鲲鹏 CPU 麒麟 V10 的离线环境,手把手教你从环境准备到应用上线,所有依赖包提前打包好,步骤写成傻瓜式操作指南。 一、环境规划# 准备至少两台机器。 架构OS作用Arm64任意,Mac 也可以下载离线包Arm64麒麟 V10单机部署 K8s…

Redis主从复制详解

概述 Redis 的主从复制(Master-Slave Replication)是实现数据备份、读写分离和水平扩展的核心机制之一。通过主从复制,一个主节点(Master)可以将数据同步到多个从节点(Slave),从节点…

16.进程间通信(二)

一、命名管道 1.概念 匿名管道解决了具有血缘关系的进程之间的通信,如果两个进程毫不相干,如何进行通信呢?通过文件,管道文件。 对于两个不同进程,打开同一路径下的同一文件,inode和文件内核缓冲区不会加载…

优化的两极:凸优化与非凸优化的理论、应用与挑战

在机器学习、工程设计、经济决策等众多领域,优化问题无处不在。而在优化理论的世界里,凸优化与非凸优化如同两个截然不同的 “王国”,各自有着独特的规则、挑战和应用场景。今天,就让我们深入探索这两个优化领域的核心差异、算法特…

day15 leetcode-hot100-29(链表8)

19. 删除链表的倒数第 N 个结点 - 力扣(LeetCode) 1.暴力法 思路 (1)先获取链表的长度L (2)然后再次遍历链表到L-n的位置,直接让该指针的节点指向下下一个即可。 2.哈希表 思路 &#xff0…

rtpinsertsound:语音注入攻击!全参数详细教程!Kali Linux教程!

简介 2006年8月至9月期间,我们创建了一个用于将音频插入指定音频(即RTP)流的工具。该工具名为rtpinsertsound。 该工具已在Linux Red Hat Fedora Core 4平台(奔腾IV,2.5 GHz)上进行了测试,但预…

谷歌Stitch:AI赋能UI设计,免费高效新利器

在AI技术日新月异的今天,各大科技巨头都在不断刷新我们对智能工具的认知。最近,谷歌在其年度I/O开发者大会期间,除了那些聚光灯下的重磅发布,还悄然上线了一款令人惊喜的AI工具——Stitch。这是一款全新的、完全免费的AI驱动UI&am…

PowerBI企业运营分析——线性回归销售预测

PowerBI企业运营分析——线性回归销售预测 欢迎来到Powerbi小课堂,在竞争激烈的市场环境中,企业运营分析平台成为提升竞争力的核心工具。 该平台通过整合多源数据,实现关键指标的实时监控,从而迅速洞察业务动态,精准…

<4>, Qt窗口

目录 一,菜单栏 二,工具栏 三,状态栏 四,浮动窗口 五,对话框 一,菜单栏 MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), ui(new Ui::MainWindow) {ui->setupUi(this);// 创建菜单栏…