跳到主要内容

数字图像基础

数字图像是由有限数量的元素组成,每个元素都有特定的位置(x,y)和幅度(x,y),这些元素称为像素。

邻域处理方法是图像增强和复原过程的核心,这一章是为其打下理解的基础。

2.1 视觉感知要素

研究分辨率和对光照变化的适应能力。

视觉的低级感知层次

2.1.1 人眼的结构

杆状体(Rods)

光线先进入角膜,再经过瞳孔。瞳孔中的虹膜。晶状体是个凸透镜,睫状体控制晶状体的伸展收缩,控制在视网膜的成像。虹膜控制进光量多少。 视网膜成像通过视神经传入大脑的枕叶。

蛋白质吸收能量,吸收过量会导致眼疾。

2.1.2 眼睛中图像的形成

光图像激活视杆体或视锥体时,发生光电化学反应,同时产生视神经脉冲,视觉系统散布

人眼对不同亮度的适应和鉴别能力:

亮 - > 暗 适应快 暗 - > 亮 适应慢

主观亮度:即由人的视觉系统感知的亮度是进入人眼的光强的对数函数。

亮度适应范围:

1010mL(106104)10^10mL(10^-6-10^4)与整个适应范围相比,人眼在某一时刻能鉴别的;亮度级别范围很小(以该环境的亮度为基准)

视觉适应性

亮度适应级(视觉系统的当前灵敏度)

辨别光强度变化的能力

人眼视觉系统对亮度的对比度敏感而非对亮度本身敏感。

韦伯比越大,亮度辨别能力越差;反之则越好。

背景光保持恒定,改变其他光源亮度,

人眼感觉亮度

人眼感觉的亮度(主观亮度)不是简单取决于光强度。

信息

韦伯-费赫涅尔定理:

信息

马赫带效应(Mach Bands):

同时对比效应:

2.2 光和电磁波谱

任何有能量的物体都可以释放电磁波。

电磁波谱可以用波长(γ\gamma)、频率(vv)或能量来描述.

γ=cv\gamma=\frac{c}{v}

E=hvE=hv

其中c是光速,h是Planck常数。

电磁波可以看成是以波长γ\gamma传播的正弦波,或没有质量的粒子流。每个无质量的粒子包含一束能量,每束能量是一个光子。能量与频率成正比,更高频率的每个光子带有更多的能量.

人从物体感受的颜色由物体反射光决定.

若所有反射的可见光波长均衡, 则物体显示白色。

彩色光源的三个基本属性:

  1. 发光强度:从光源流出的能量总量
  2. 光通量:观察者从光源感受到的能量
  3. 亮度:光感知的主观描绘子,实际上是不能度量的。

2.3 图像感知和获取

2.3.4 简单的图像形成模型

用形如f(x,y)f(x,y)的二位函数来表示图像。在空间坐标(x,y)处,f的值或幅度是一个正的标量(灰度值衡量)。

当一幅图像由物理过程产生时,其亮度值正比于物理源所辐射的能量。因此,f(x,y)f(x,y)一定是非零的和有限的。

即:

0<f(x,y)<0< f(x,y)< \infty

函数f(x,y)f(x,y)可由两个分量来表征。

  1. 入射到被观察场景的光源照射总量
  2. 场景中物体所反射的光照总量
f(x,y)=i(x,y)r(x,y)f(x,y)=i(x,y)r(x,y)

其中,

2.4 图像取样和量化

2.4.1 取样和量化

大多数物理传感器的输出是连续电压波形,为了产生一幅数字图像,需要把连续的感知数据转化为数字形式。

这包括两种处理:取样和量化。

  • 取样:图像控件坐标的数字化
  • 量化:图像函数值(灰度值)的数字化

2.4.2 数字图像表示

图像取样

图像量化

2.4.3 空间的灰度分辨率

空间分辨率可以有很多办法说明,其中每单位距离线对数和每单位距离点数(像素数)是最通用的度量。

2.4.4 图像的收缩和放大

内插是在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具。

从根本上看,内插是用已知数据来估计未知位置的数值的处理。

::: tip 最近邻内插法:

:::

2.5 像素间的一些基本关系

2.5.1 相邻像素

位于坐标(x,y)处的像素P有4个水平和垂直的相邻像素。(四邻域)

2.5.2 邻接性、连通性、区域和边界

邻接性

令集合V是用于定义邻接性的灰度值集合(相似性准则),存在三种邻接类型

  • 4邻接:如果
  • 8邻接:如果
  • m邻接(混合邻接):

通路

像素p(x0,y0)p(x_0,y_0)到像素q(xn,yn)q(x_n,y_n)的通路(path)

2.5.3 距离度量

对于坐标分别为(x,y),(s,t)和(v,w)的像素p,q和z,如果

  • D(p,q)0[D(p,q)=0 if p=q]D(p,q)\neq 0 [D(p,q)=0 \text{ if } p=q]
  • D(p,q)=D(q,p)D(p,q)=D(q,p)
  • D(p,z)D(p,q)+D(q,z)D(p,z)\leq D(p,q)+D(q,z)

则D是距离函数或度量。p和q间的欧氏距离定义如下:

D(p,q)=(xs)2+(yt)2D(p,q)=\sqrt{(x-s)^2+(y-t)^2}

p和q间的距离D4D_4(又称为城市街区距离)由下式定义:

D4(p,q)=xs+ytD_4(p,q)=|x-s|+|y-t|

在这种情况下,距(x,y)的距离D4D_4小于或等于某个值rr的像素形成一个中心在(x,y)的菱形。例如,距中心点(x,y)的距离D4D_4小于或等于2的像素,形成固定距离的下列轮廓。

2.6 数字图像处理中所用数学工具的介绍

2.6.1 阵列与矩阵操作

包含一幅或者多幅图像的阵列操作是以逐像素为基础执行的。

2.6.2 线性操作与非线性操作

线性操作:

  • 可乘性
  • 可加性

非线性操作:

2.6.3 算术操作

利用加权平均去噪

2.6.4 集合和逻辑操作

2.6.5 空间操作

2.6.6 向量与矩阵操作