计算机视觉

3周实验,1周报告

1 图像处理基础

1-1 图像定义

  • 图像:二维函数
  • 数字图像:由像素构成
    • 用二维矩阵描述
    • 像素值为整数
    • 原点为左上角

1-2 空间滤波

图像 * 模板

1-3 空间滤波的应用

边缘检测

  • 图像梯度
  • 通过梯度计算边缘点

1-4 Hough 变换

Hough 变换原理:

  • 利用图像空间和 Hough 参数空间的点-线对偶性
  • 把图像空间中的检测问题转换到参数空间
  • 通过检测参数空间中的极值点来估计该曲线的参数

直线

参数空间:y=mx+b,m和b为变量,x和y为参数

由此每个点(x, y)对应一条参数空间m,b上的直线

直线拟合: 多个点则得到多条参数空间中的直线,获得一或多个交点。 相交最多的参数交点即为拟合得到的直线。

还可以用极坐标:

方程式参数空间
斜截式m, b
极坐标θ, ρ

若圆的半径未知,参数空间是圆锥

方程式参数空间
半径已知a, b
半径未知a, b, r

2 相机与成像模型

2-1 小孔成像

透视投影方程:(相似三角形)

三点共线

2-2 成像特点

  1. 近大远小
  2. 不保持平行性:平面上的平行线在像平面上可能相交(铁轨)

聚焦条件:

变焦:改变焦距(移动镜头组中镜片的相对位置)

对焦:让像成在底片上,通常移动镜头来实现

薄透镜:透镜厚度在计算中可忽略不计

3 相机标定

相机标定:求解 3D 到 2D 的映射的参数


相机的几何模型

3-1 齐次坐标

用 n+1 维向量表示 n 维向量:

  • 原坐标
  • 齐次坐标

平面:

球面:

3-2 坐标系变换

世界坐标系,相机坐标系,

两个几何变换:

  • 从世界坐标系到相机坐标系的刚体变换(相机的外参数)
  • 从相机坐标系中三维坐标到成像平面上二维坐标的透视投影变换(相机的内参数)

刚体变换

刚体:形状、大小不变,内部各点的相对位置不变

刚体变换:把刚体做旋转、平移等坐标变换

是两个正交坐标系间的变换

  1. 平移变换
  2. 旋转变换
    1. 例如坐标系 A 绕 k 轴旋转:
    2. 通用旋转矩阵:
  3. 刚体变换

下标指示被表示的对象,上标指示用来表示对象的坐标系, 如是坐标系 A 下 P 的表示,是坐标系 A 在坐标系 B 中的旋转矩阵。

3-3 相机建模

虚拟成像平面:与物理成像平面平行,在光轴上距光心为 f

像素坐标尺度内参外参世界坐标

注意:r 为三维列向量

歪斜角 :相机传感器非矩形而是平行四边形

像素纵横系数,将虚拟成像平面映射到物理成像平面(像素坐标系)

3-4 参数求解

最小二乘法

时,最小化误差函数 E

若 y 均为0,则为齐次方程,解为 的最小特征根所对应的特征向量

算法步骤

  • 物点的世界坐标,像点的像素坐标)经由多组数据的最小二乘法,得到(矩阵 M 的 12 个元素值)
  • 再算出相机的内外参数之积 M

计算 M

,有 , 得

将 n 组点代入(即 n 个 u,v,P)

转为齐次方程:

则得 为矩阵 最小特征根对应的特征向量 其中 ρ 为齐次方程的系数。由此解出 M。

,且

其中 ε 表征物体与相机是否在世界坐标系的同一侧(1 为同)

估计参数

4 图像配准

4-1 图像配准

  • 图像配准可以视为源图像 I2 和目标图像 I1 关于空间和灰度的映射关系: 其中: f 为二维空间坐标变换(如仿射变换),g 为灰度变换。
  • 图像配准问题的关键:最佳几何变换 f
    • 选取图像特征
    • 估计几何变换

图像配准的模式分类

  • 按自动化程度分类:
    • 人工配准方法
    • 半自动方法
    • 全自动方法
  • 按成像模式分类:
    • 不同视角(多视角分析)
    • 不同时间(多时段分析)
    • 不同传感器(多模式分析)
    • 场景与场景模型图像配准
  • 按图像配准的应用领域分类
    • 医学、遥感、计算机视觉、军事等领域
  • 按图像的维数分类
    • 2D-2D、2D-3D、3D-3D
  • 按对图像信息的利用情况分类
    • 基于灰度信息
    • 基于特征信息

4-2 图像预处理

4-2-1 图像的灰度变换

  • 线性灰度变换
  • 对数灰度变换
  • 分段线性灰度变换
  • 直方图的均衡化

4-2-2 图像的平滑处理

  • 邻域平均法
  • 中值滤波

4-3 图像配准

4-3-1 主要方法

基于灰度的图像配准

基于特征的图像配准

  1. 特征提取
  2. 特征匹配
  3. 通过特征估计变换模型
  4. 图像重采样

图像配准的核心模块

  • 特征选取
    • 充分表达图像的内部结构
    • 消除畸变噪音的干扰
    • 降低参与计算的数据量
  • 几何变换的选取
    • 选择合适的几何变换
  • 搜索策略
    • 动态规划、牛顿法、最速下降法、共轭梯度法
  • 相似度度量

4-3-2 特征选取

  1. 找到图像特征点
  2. 特征点配对
  3. 图像拼接:通过匹配的特征点,估计参数

角点检测

  • 角点:像素值变化剧烈的点
  • 定义移动窗口的像素变化值
    • W 为窗口
    • 移动量为 (u,v)
    • 窗口内像素变化函数

Harris 角点检测

  • 假定窗口滑动微小,图像平滑,则通过泰勒展开

则:

圆括号内的 求和 记为矩阵 H

根据特征值的计算公式:

得到H的两个特征值:

  • 几何关系

    • 表示 E 的最大变化分量
    • 征表示 E 的最小变化分量
    • 方向的增量值
    • 方向的增量值
  • 平坦区域: 都很小

  • 边缘区域: 大,

  • 角点区域: 都很大

Harris 算子

Harris 无需计算特征值,算子大则检测到角点。

4-3-3 特征描述

SIFT描述子

  • 提取图像的局部特征
  • 具有平移、旋转、伸缩不变性
  • 对光照变化、仿射变换和三维投影变换具有一定的鲁棒性

SIFT描述子产生过程

  1. 方向分配
    • 在关键点为中心的邻域窗口,计算每个点的梯度
    • 用直方图统计邻域像素的梯度方向分布(每10度为一个统计区间)
    • 最大的梯度所在的方向即为关键点的主方向
  2. 产生描述
    • 将坐标轴旋转为关键点的主方向,确保旋转不变性
    • (以窗口长度为8为例)
    1. 根据预设的尺度与角度,在特征点附近取窗口
    2. 获得窗口内每点的梯度
    3. 将原始窗口分为2×2共4个子窗口,计算每个窗口内的梯度直方图(仅考虑8个方向)
    4. 这2×2×8共32个数值(4个直方图),获得特征描述
    5. 归一化以消除光照影响

4-3-4 特征匹配

  • 设特征 是与特征 最近和次近的特征
  • 计算距离比例
  • 当r小于某个阈值,则匹配成功
  • 阈值的选取需根据图像确定(建议范围:0.4到0.8)

由于图片角点十分多,因此需要用 K-d 树等数据结构来加速

K-d 树略

4-3-5 几何模型估计