图像处理之基础知识


这篇文章是图像处理相关的基础知识学习记录。

尺度空间

对于一副图像,近距离观察和远距离观察效果是不同的,前者比较清晰、比较大,能看到图像的一些细节信息;后者比较模糊、比较小,能看到图像的一些轮廓的信息,这就是图像的尺度,图像的尺度是自然存在的,并不是人为创造的。图像不同的尺度在一起称为尺度空间,量化表示即(o,s),变量o是某一八度(octave),控制的是金字塔中尺寸这个尺度,s是该八度中的某一层,区分同一尺寸尺度下的图像,控制一个八度中不同的模糊程度。尺度是在二维图像的基础上得到的图像中自然存在的一个维度。因为高斯核是唯一的线性核,也就是说使用高斯核对图像模糊不会引入其他噪声,因此就选用了高斯核来构建图像的尺度。高斯卷积核是尺度变换的唯一的线性核。

多尺度和多分辨率

金字塔多分辨率

金字塔是早期图像多尺度的表示形式,一个图像金字塔是一系列图像的集合,所有图像来源于同一张原始图像 ,通过对原始图像连续采样获得,直到达到某个终止条件才停止采样。

有两种类型的图像金字塔常常出现在文献和应用中:

  • 高斯金字塔(Gaussian pyramid): 用来向下采样,为一层一层的图像,层级越高,图像越小。
  • 拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像向上采样重建图像,高斯金字塔其逆形式。

图像金字塔化一般包括两个步骤:使用低通滤波器平滑图像(高斯平滑/高斯核模糊?一个八度内进行不同的高斯核模糊?);对平滑图像进行降采样(通常是水平,竖直方向1/2),从而得到一系列尺寸缩小的图像。对于二维图像,一个传统的金字塔中,每一层图像由上一层分辨率的长、宽各一半,也就是四分之一的像素组成。

尺度空间表达和金字塔多分辨率表达之间最大的不同是:

  • 尺度空间表达是由不同高斯核平滑卷积得到,在所有尺度上有相同的分辨率;
  • 而金字塔多分辨率表达每层分辨率减少固定比率。

所以,金字塔多分辨率生成较快,且占用存储空间少;而多尺度表达随着尺度参数的增加冗余信息也变多。

多尺度表达的优点在于图像的局部特征可以用简单的形式在不同尺度上描述;而金字塔表达没有理论基础,难以分析图像局部特征。

图像的上采样(up-sampling)和下采样(down-sampling)

缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有两个:

  • 使得图像符合显示区域的大小;

  • 生成对应图像的缩略图。

放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上。对图像的缩放操作并不能带来更多关于该图像的信息,因此图像的质量将不可避免地受到影响。然而,确实有一些缩放方法能够增加图像的信息,从而使得缩放后的图像质量超过原图质量的。

下采样原理:对于一幅图像I尺寸为M N,对其进行s倍下采样,即得到(M/s) (N/s)尺寸的得分辨率图像,当然s应该是M和N的公约数才行,如果考虑的是矩阵形式的图像,就是把原始图像s * s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值。

上采样原理:图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。

本文标题:图像处理之基础知识

文章作者:阿翔

发布时间:2018年06月21日 - 19:06

最后更新:2019年05月28日 - 21:05

原始链接:http://ttshun.com/2018/06/21/图像处理之基础知识/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

点击给我一些鼓励叭!
-------------本文结束感谢您的阅读-------------
0%