数字图像基础
数字图像是由有限数量的元素组成,每个元素都有特定的位置(x,y)和幅度(x,y),这些元素称为像素。
邻域处理方法是图像增强和复原过程的核心 ,这一章是为其打下理解的基础。
2.1 视觉感知要素
研究分辨率和对光照变化的适应能力。
视觉的低级感知层次
2.1.1 人眼的结构
杆状体(Rods)
光线先进入角膜,再经过瞳孔。瞳孔中的虹膜。晶状体是个凸透镜,睫状体控制晶状体的伸展收缩,控制在视网膜的成像。虹膜控制进光量多少。 视网膜成像通过视神经传入大脑的枕叶。
蛋白质吸收能量,吸收过量会导致眼疾。
2.1.2 眼睛中图像的形成
光图像激活视杆体或视锥体时,发生光电化学反应,同时产生视神经脉冲,视觉系统散布
人眼对不同亮度的适应和鉴别能力:
亮 - > 暗 适应快 暗 - > 亮 适应慢
主观亮度:即由人的视觉系统感知的亮度是进入人眼的光强的对数函数。
亮度适应范围:
与 整个适应范围相比,人眼在某一时刻能鉴别的;亮度级别范围很小(以该环境的亮度为基准)
视觉适应性
亮度适应级(视觉系统的当前灵敏度)
辨别光强度变化的能力
人眼视觉系统对亮度的对比度敏感而非对亮度本身敏感。
韦伯比越大,亮度辨别能力越差;反之则越好。
背景光保持恒定,改变其他光源亮度,
人眼感觉亮度
人眼感觉的亮度(主观亮度)不是简单取决于光强度。
韦伯-费赫涅尔定理:
马赫带效应(Mach Bands):
同时对比效应:
2.2 光和电磁波谱
任何有能量的物体都可以释放电磁波。
电磁波谱可以用波长()、频率()或能量来描述.
其中c是光速,h是Planck常数。
电磁波可以看成是以波长传播的正弦波,或没有质量的粒子流。每个无质量的粒子包含一束能量,每束能量是一个光子。能量与频率成正比,更高频率的每个光子带有更多的能量.
人从物体感受的颜色由物体反射光决定.
若所有反射的可见光波长均衡, 则物体显示白色。
彩色光源的三个基本属性:
- 发光强度:从光源流出的能量总量
- 光通量:观察者从光源感受到的能量
- 亮度:光感知的主观描绘子,实际上是不能度量的。
2.3 图像感知和获取
2.3.4 简单的图像形成模型
用形如的二位函数来表示图像。在空间坐标(x,y)处,f的值或幅度是一个正的标量(灰度值衡量)。
当一幅图像由物理过程产生时,其亮度值正比于物理源所辐射的能量。因此,一定是非零的和有限的。
即:
函数可由两个分 量来表征。
- 入射到被观察场景的光源照射总量
- 场景中物体所反射的光照总量
其中,
2.4 图像取样和量化
2.4.1 取样和量化
大多数物理传感器的输出是连续电压波形,为了产生一幅数字图像,需要把连续的感知数据转化为数字形式。
这包括两种处理:取样和量化。
- 取样:图像控件坐标的数字化
- 量化:图像函数值(灰度值)的数字化
2.4.2 数字图像表示
图像取样
图像量化
2.4.3 空间的灰度分辨率
空间分辨率可以有很多办法说明,其中每单位距离线对数和每单位距离点数(像素数)是最通用的度量。
2.4.4 图像的收缩和放大
内插是在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具。
从根本上看,内插是用已知数据来估计未知位置的数值的处理。
::: tip 最近邻内插法:
:::
2.5 像素间的一些基本关系
2.5.1 相邻像素
位于坐标(x,y)处的像素P有4个水平和垂直的相邻像素。(四邻域)
2.5.2 邻接性、连通性、区域和边界
邻接性
令集合V是用于定义邻接性的灰度值集合(相似性准则),存在三种邻接类型
- 4邻接:如果
- 8邻接:如果
- m邻接(混合邻接):
通路
像素到像素的通路(path)
2.5.3 距离度量
对于坐标分别为(x,y),(s,t)和(v,w)的像素p,q和z,如果
则D是距离函数或度量。p和q间的欧氏距离定义如下:
p和q间的距离(又 称为城市街区距离)由下式定义:
在这种情况下,距(x,y)的距离小于或等于某个值的像素形成一个中心在(x,y)的菱形。例如,距中心点(x,y)的距离小于或等于2的像素,形成固定距离的下列轮廓。
2.6 数字图像处理中所用数学工具的介绍
2.6.1 阵列与矩阵操作
包含一幅或者多幅图像的阵列操作是以逐像素为基础执行的。
2.6.2 线性操作与非线性操作
线性操作:
- 可乘性
- 可加性
非线性操作: