PnP（Perspective-n-Point）算法 | 用于求解已知n个3D点及其对应2D投影点的相机位姿-海口c网

PnP（Perspective-n-Point）算法 | 用于求解已知n个3D点及其对应2D投影点的相机位姿

article/2025/8/25 4:46:47

什么是PnP算法？

PnP 全称是 Perspective-n-Point，中文叫“n点透视问题”。
它的目标是：
已知一些空间中已知3D点的位置（世界坐标）和它们对应的2D图像像素坐标，求解摄像机的姿态（位置和平移）和朝向（旋转）。

简单来说，就是通过3D点和它们在照片上的投影点，算出相机“站在哪儿”和“看向哪儿”。

PnP解决的问题

你有一堆现实世界的点（比如3D模型上的标志点），也知道这些点在照片里的像素位置，PnP就是帮你找出“相机相对于这些点的位置和角度”。

PnP算法的原理（简单版）

已知条件：
- $n$ 个已知3D点 $P_i = (X_i, Y_i, Z_i)$ ，在世界坐标系里。
- 它们对应的2D像素点 $p_i = (u_i, v_i)$ ，在图像中。
目标：
- 找到相机的旋转矩阵 $R$ 和平移向量 $t$ ，使得所有3D点经过变换后投影到图像上的位置，尽可能接近对应的2D点。
数学关系：

$\begin{bmatrix} u_i \\ v_i \\ 1 \end{bmatrix} = K \times \big( R \times P_i + t \big)$

其中：
- $K$ 是相机内参矩阵，已知。
- $R, t$ 是未知（我们要解的）。
- $s$ 是尺度因子（用于齐次坐标）。
求解过程：
- 利用多组点的对应关系，建立方程组。
- 通过最小化投影误差（图像点和投影点的距离），用优化算法求出最佳的 $R$ 和 $t$ 。

你可以这样理解：

PnP就像“反向投影”：你知道点在现实和照片的位置，求相机的位置和朝向。

额外说明：

如果点的数量较少（最少4个点），算法能工作，但更多点通常能得到更稳定准确的结果。
经典的PnP算法有很多变体，比如EPnP、UPnP、RPnP等，都旨在更快或更鲁棒地求解。

在这里插入图片描述

值得注意的是PnP的前提：对应关系必须先确定

**PnP算法本身不负责找到哪些3D点对应哪些2D点，**它的输入是：
- 一组3D点（已知位置）
- 它们在图像中的对应2D点
所以，在用PnP之前，必须先解决“匹配”问题：
怎样找到图像中哪个像素点对应哪个3D世界点？

对应关系的获得途径举例：

人工标定/标记：
在物体或场景上贴标记点，知道标记点的3D坐标，手动或者半自动找到图像中的对应点。
特征匹配：
利用特征点检测（如SIFT、ORB）在图像中提取关键点，并用描述子匹配它们与3D点（如用激光扫描得到的点云中提取特征点）。
结构光或投影仪：
通过主动投影图案产生已知对应关系。
深度相机（RGB-D）或激光雷达数据：
直接获得3D点和2D图像对齐。

没有对应关系，PnP算法就无从下手

所以在做定位、姿态估计、SLAM等任务时，建立稳定准确的“3D点 ↔ 2D点”对应关系是关键的第一步。

http://www.hkcw.cn/article/WuXjHRQwsN.shtml

相关文章

C++核心编程_4.5 运算符重载_4.5.1 加号运算符重载

C++核心编程_4.5 运算符重载_4.5.1 加号运算符重载

#include <iostream> #include <string> using namespace std;/* ### 4.5 运算符重载运算符重载概念：对已有的运算符重新进行定义，赋予其另一种功能，以适应不同的数据类型 *//* 4.5.1 加号运算符重载作用：实现两…

阅读更多...

文本预处理

文本预处理

文本预处理 1 词向量表示 1.1 word2vec之skipgram方式： 定义：给你一段文本，选定特定的窗口长度，然后利用中间词来预测上下文实现过程：1、选定一个窗口长度：3、5、7等；2、指定词向量的维度&a…

阅读更多...

C++中单例模式详解

C++中单例模式详解

在C中，单例模式 (Singleton Pattern) 确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。这在需要一个全局对象来协调整个系统行为的场景中非常有用。为什么要有单例模式？ 在许多项目中，某些类从逻辑上讲只需要一个实…

阅读更多...

什么是单片机?

什么是单片机?

众所周知，人类行为受大脑调控，正如视觉、听觉、味觉、嗅觉、触觉及运动功能等感官与肢体活动均受其指挥；换言之，大脑作为人体的中枢神经系统，负责管理所有可控制的生理功能。在电子设备领域，单片机…

阅读更多...

DMBOK对比知识点整理（4）

DMBOK对比知识点整理（4）

1.常见数据质量维度常见数据质量维度（DMBOK-P353）质量维度

阅读更多...

Web攻防-SQL注入增删改查盲注延时布尔报错有无回显错误处理

Web攻防-SQL注入增删改查盲注延时布尔报错有无回显错误处理

知识点： 1、Web攻防-SQL注入-操作方法&增删改查 2、Web攻防-SQL注入-布尔&延时&报错&盲注案例说明： 在应用中，存在增删改查数据的操作，其中SQL语句结构不一导致注入语句也要针对应用达到兼容执行，另…

阅读更多...

动态规划-152.乘积最大子数组-力扣(LeetCode)

动态规划-152.乘积最大子数组-力扣(LeetCode)

一、题目解析根据示例nums数组中存在负数，下面分析时需注意二、算法原理 1、状态表示此时f[i]表示：以i位置为结尾的所有子数组中的最大乘积，但是由于nums中存在负数，所以还需要g[i]表示：以i位置为结尾的所有子数组…

阅读更多...

Leetcode 159. 至多包含两个不同字符的最长子串

Leetcode 159. 至多包含两个不同字符的最长子串

1.题目基本信息 1.1.题目描述给你一个字符串 s ，请你找出至多包含两个不同字符的最长子串，并返回该子串的长度。 1.2.题目地址 https://leetcode.cn/problems/longest-substring-with-at-most-two-distinct-characters/description/ 2.解题方法…

阅读更多...

MATLAB 横向剪切干涉系统用户界面设计及其波前重构研究

MATLAB 横向剪切干涉系统用户界面设计及其波前重构研究

▒▒本文目录▒▒ 一、横向剪切干涉系统效果预览二、引言三、横向剪切干涉理论基础四、MATLAB 横向剪切干涉系统用户界面设计五、参考文献六、实验指导与matlab代码获取一、横向剪切干涉系统效果预览开发的系统如下所示： 横向剪切干涉系统二、引言横向剪切干…

阅读更多...

C54-动态开辟内存空间

C54-动态开辟内存空间

1.malloc 原型：void* malloc(size_t size);（位于 <stdlib.h> 头文件中） 作用：分配一块连续的、未初始化的内存块，大小为 size 字节。返回值： 成功：返回指向分配内存首地址的 void* 指针…

阅读更多...

【Linux网络篇】：初步理解应用层协议以及何为序列化和反序列化

【Linux网络篇】：初步理解应用层协议以及何为序列化和反序列化

✨感谢您阅读本篇文章，文章内容是个人学习笔记的整理，如果哪里有误的话还请您指正噢✨ ✨ 个人主页：余辉zmh–CSDN博客 ✨ 文章所属专栏：Linux篇–CSDN博客文章目录一.序列化和反序列化为什么需要序列化和反序列化为什么应用层…

阅读更多...

【Tips】关于PCI和PCIe的配置空间差异和io/memory io读写

【Tips】关于PCI和PCIe的配置空间差异和io/memory io读写

最近在看同事2023年讲的PCI基础课，感觉确实是豁然开朗了，赞美同事。 PCIe实际上是PCI的扩展（extended），PCIe设备相当于是迭代升级产品。而PCIe的配置空间基于PCI原有的0xFF（256字节）配置空间…

阅读更多...

华为OD机试真题——阿里巴巴找黄金宝箱(III)（2025A卷：100分）Java/python/JavaScript/C/C++/GO最佳实现

华为OD机试真题——阿里巴巴找黄金宝箱(III)（2025A卷：100分）Java/python/JavaScript/C/C++/GO最佳实现

2025 A卷 100分题型本专栏内全部题目均提供Java、python、JavaScript、C、C++、GO六种语言的最佳实现方式；并且每种语言均涵盖详细的问题分析、解题思路、代码实现、代码详解、3个测试用例以及综合分析；本文收录于专栏：《2025华为OD真题目录+全流程解析+备考攻略+经验分…

阅读更多...

拓扑排序算法剖析与py/cpp/Java语言实现

拓扑排序算法剖析与py/cpp/Java语言实现

拓扑排序算法深度剖析与py/cpp/Java语言实现一、拓扑排序算法的基本概念1.1 有向无环图（DAG）1.2 拓扑排序的定义1.3 拓扑排序的性质二、拓扑排序算法的原理与流程2.1 核心原理2.2 算法流程三、拓扑排序算法的代码实现3.1 Python实现3.2 C实现3.3 Java…

阅读更多...

C#学习：基于LLM的简历评估程序

C#学习：基于LLM的简历评估程序

前言在pocketflow的例子中看到了一个基于LLM的简历评估程序的例子，感觉还挺好玩的，为了练习一下C#，我最近使用C#重写了一个。准备不同的简历： 查看效果： 不足之处是现实的简历应该是pdf格式的，后面可以…

阅读更多...

华为OD机试真题——阿里巴巴找黄金宝箱(II)（2025A卷：100分）Java/python/JavaScript/C/C++/GO最佳实现

华为OD机试真题——阿里巴巴找黄金宝箱(II)（2025A卷：100分）Java/python/JavaScript/C/C++/GO最佳实现

2025 A卷 100分题型本专栏内全部题目均提供Java、python、JavaScript、C、C++、GO六种语言的最佳实现方式；并且每种语言均涵盖详细的问题分析、解题思路、代码实现、代码详解、3个测试用例以及综合分析；本文收录于专栏：《2025华为OD真题目录+全流程解析+备考攻略+经验分…

阅读更多...

最大流-Ford-Fulkerson增广路径算法py/cpp/Java三语言实现

最大流-Ford-Fulkerson增广路径算法py/cpp/Java三语言实现

最大流-Ford-Fulkerson增广路径算法py/cpp/Java三语言实现一、网络流问题与相关概念1.1 网络流问题定义1.2 关键概念二、Ford-Fulkerson算法原理2.1 核心思想2.2 算法步骤三、Ford-Fulkerson算法的代码实现3.1 Python实现3.2 C实现3.3 Java实现四、Ford-Fulkerson算法的时间…

阅读更多...

摄像头模块的镜头类型

摄像头模块的镜头类型

一、‌按光学功能分类‌ ‌球面镜（Spherical Lens）‌ ‌特点‌：表面为球面曲率，工艺简单且成本低，但存在球面像差和色差，边缘画质易模糊。 ‌应用‌：低端监控设备、玩具相机等对画质要求低的…

阅读更多...

汽车EPS系统的核心：驱动芯片的精准控制原理

汽车EPS系统的核心：驱动芯片的精准控制原理

随着科技的飞速发展，电机及其驱动技术在现代工业、汽车电子、家用电器等领域扮演着越来越重要的角色。有刷马达因其结构简单、成本低廉、维护方便等优点，在市场上占据了一定的份额。然而，为了充分发挥有刷马达的性能，一款高效能、…

阅读更多...

51c视觉~3D~合集3

51c视觉~3D~合集3

我自己的原文哦~ https://blog.51cto.com/whaosoft/13954440 #SceneTracker 在4D时空中追踪万物！国防科大提出首个长时场景流估计方法本篇分享 TPAMI 2025 论文SceneTracker: Long-term Scene Flow Estimation Network，国防科大提出首…

阅读更多...

推荐文章