ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数字图像处理——第十一章 表示和描述

2021-06-05 23:32:11  阅读:269  来源: 互联网

标签:多边形 边界 第十一章 数字图像处理 11.2 11.3 链码 描述


文章目录

引言

继上一章将图像分割成多个区域后,分割的像素集可以分为外部特征(边界)和内部特征(区域),本章的任务是基于所选择的来表示描述区域。如,区域可由其边界表示,边界可用特征对其描述,选择用来作为描绘子的特征应尽可能地对大小、平移和旋转不敏感。

表示部分:边界表示

描述部分:边界描述、区域描述、关系描述、主分量描述

11.1 表示

边界表示:

主要分2个阶段:边界追踪(轮廓提取)、基于特定目标(精确/方便/高效)的边界表示。

边界追踪部分主要介绍Moore算法;边界表示部分主要介绍Freeman链码、边界的多边形近似、标记图、边界线段和骨架。

11.1 边界追踪

边界追踪算法也称为Moore边界追踪算法。要求一个区域边界上的点以顺或逆时针方向排序。

我们假设:

  • 处理的是二值图像(但边界未知),其目标和背景点分别标为1和0;
  • 图像使用值为0的边界填充,因为消除了目标和图像边界合并的可能性。

Moore算法:

step1: 找到图像左上角为1的点 b 0 b_0 b0​为边界起始点。 b 0 b_0 b0​左边的点为 c 0 c_0 c0​(显然值为0),从 c 0 c_0 c0​开始按顺时针方向考察 b 0 b_0 b0​的8邻域,找到的第一个值1的点为 b 1 b_1 b1​(边界的第2个点),令扫描到 b 1 b_1 b1​前的点为 c 1 c_1 c1​

step2: 赋值b= b 1 b_1 b1​,c= c 1 c_1 c1​

step3: 从c开始顺时针扫描b的8邻域,令b的8个邻点为 n 1 , n 2 , n 3 . . . n 8 n_1,n_2,n_3...n_8 n1​,n2​,n3​...n8​,找到第一个值1的点 n k n_k nk​,其之前的点 n k − 1 n_{k-1} nk−1​

step4: 赋值b= n k n_k nk​, n k − 1 n_{k-1} nk−1​

step5: 重复step3和step4,直到b= b 0 b_0 b0​且下一个边界点为 b 1 b_1 b1​

注:step5中的停止规则,经常错误得被陈述为再次遇到 b 0 b_0 b0​时停止,但如果第一个点存在毛刺则会导致结果的出错,直到b= b 0 b_0 b0​且下一个边界点为 b 1 b_1 b1​,判断的言外之意是说明 b 0 b_0 b0​只有一个邻边界点 b 1 b_1 b1​。

11.2 链码

链码被用来顺次连接具有指定长度和方向(逆时针)的直线段来表示边界,这种表示基于线段的4连接或8连接,称为Freeman编码。
在这里插入图片描述
在这里插入图片描述
边界的链码取决于起始点,我们可以将链码视为方向号码的一个循环序列,得到号码序列的最小整数值(左边0多)。

也可以使用链码的一次差分来对旋转进行归一化,仅当对旋转和尺度的变化,边界本身不变时,这些归一化才是准确的。
例:8方向链码(下图所示)
在这里插入图片描述
我们按照逆时针方向,如2到1 需要7 steps, 来得到差分码,解决旋转归一化的问题。

11.3 多边形近似

数字边界可以用多边形以任意精度来近似。对一条闭合边界,当多边形的边数等于边界上的点数时,该近似就会很精确,此时每对相邻点定义了多边形的一条边。多边形近似的目的是用尽可能少的线段获取给定边界的基本形状。实际中,很有效的近似技术是用最小周长多边形(MPP)来表示边界。

在这里插入图片描述
在这里插入图片描述
图三中的黑点是“镜像”凹顶点,目的是用最小周长多边形来近似图形。图三与多边形近似的图形形状相同。

11.4 聚合和分裂技术

在这里插入图片描述
在这里插入图片描述

11.5 标记图

标记是边界的一维表达,其基本思想是将原始的二维边界用一个一维函数来表示,以达到降低表达难度的作用。

最简单的方法是以角度函数的形式画出质心到边界的距离。
在这里插入图片描述

11.1.6 边界线段

当边界线包含一个或多个携带形状信息的明显凹度时,将边界分解为线段是很有用的。差集H-S称为集合S和凸缺D,凸壳是H,分段算法:追踪S的轮廓,并标记进入或离开一个凸缺的转变点,从打标记的位置进行分段。

实际上,由于数字化、噪声和分割变形的影响,导致在边界上有随机散布的无意义的小凸缺,应在处理之前使用平滑或者多边形近似。

在这里插入图片描述

11.2 边界描绘子

11.2.1 基础描绘子

  • 边界长度:
    对于两个方向上以单位间距定义的链码曲线,垂直分量和水平分量的像素数量加上对角分量的像素数量的根号2倍,可给出曲线的准确长度;

  • 边界直径:
    D i a m ( B ) = m a x [ D ( p i , p j ) ] Diam(B)=max[D(p_i,p_j)] Diam(B)=max[D(pi​,pj​)] p i , p j p_i,p_j pi​,pj​是边界上的点,直径的值和组成直径的两个端点的直线段的方向是边界的有用描绘子;

  • 边界的偏心率:
    由边界与两个轴(长轴与短轴)相交的4个外部点所组成的方框,称为基本矩形,长轴与短轴之比称为边界的偏心率;

  • 曲率:
    定义为斜率的变化率,近似:用相邻边界线段的斜率差作为这两条线段交点处的曲率。

11.2.2 形状数

形状数是基于4链码的边界描述符,形状数定义为最小量级的一次差分,形状数的阶定义为其表示的数字个数。

在这里插入图片描述

11.2.3 傅里叶描绘子

在这里插入图片描述
上图显示了xy平面的K点数字边界,我们将虚轴和实轴的两个坐标当作一个复数来处理:
s ( k ) = x ( k ) + j y ( k ) s(k)=x(k)+jy(k) s(k)=x(k)+jy(k) 将二维问题简化成了一维问题。

s(k)近似为 s ( k ) = 1 k ∑ u = 0 p − 1 a ( u ) e j 2 π u k P s(k)=\frac{1}{k} \sum_{u=0} ^{p-1} a(u)e^ \frac{j2\pi uk}{P} s(k)=k1​u=0∑p−1​a(u)ePj2πuk​使用前P个傅里叶系数, 其中 a ( u ) = ∑ k = 0 k − 1 s ( k ) e − j 2 π u k K a(u)=\sum_{k=0} ^{k-1} s(k)e^-\frac{j2\pi uk}{K} a(u)=k=0∑k−1​s(k)e−Kj2πuk​k=0,1,2…K-1。高频成分说明精细细节,低频成分决定全局形状,因此P越小,边界丢失的细节就越多。

在这里插入图片描述

11.2.4 统计距

边界线段的性质可用统计距来定理描述,如均值、方差和高阶矩。
在这里插入图片描述
该函数是这样获得的:先将该线段的两个端点连接起来,然后旋转该直线线段,直到该直线线段称为水平线段。此时,边界线段上的所有点的坐标也旋转相同的角度。

将g的幅度视为一个离散随机变量v,形成幅度直方图 p ( v i ) p(v_i) p(vi​),i ∈ \in ∈(0,A-1), p ( v i ) p(v_i) p(vi​)是 v i v_i vi​出现的概率统计,但n阶矩和均值通常不能区分不同形状的信号。

我们将 g ( r ) g(r) g(r)归一为单位面积,当作直方图来处理。
n 阶 矩 : μ ( v ) = ∑ i = 0 A − 1 ( v i − m ) n p ( v i ) n阶矩:\mu (v)=\sum _{i=0} ^{A-1}(v_i-m)^{n}p(v_i) n阶矩:μ(v)=i=0∑A−1​(vi​−m)np(vi​)
均 值 : m = ∑ i = 0 k − 1 r i g ( r i ) 均值:m=\sum_{i=0} ^{k-1} r_i g(r_i) 均值:m=i=0∑k−1​ri​g(ri​) K是边界的点数,n阶矩直接与 g ( r ) g(r) g(r)的性质相关,变量的一阶原始矩等价于数学期望(expectation)、二至四阶中心矩被定义为方差(variance,度量曲线关于r的均值的扩展程度)、偏度(skewness,度量曲线关于均值的对称性)和峰度(kurtosis)。

11.3 区域描绘子

主要讨论区域的纹理描述、不变矩描述和其他简单描述

11.3.1 简单区域描绘子

  • 圆形度:
    R C = 4 π A P 2 R_C=\frac{4 \pi A}{P^2} RC​=P24πA​

  • 致密度
    致 密 度 = P 2 A 致密度=\frac{P^2}{A} 致密度=AP2​
    P为周长,A为面积。

  • 灰度值
    灰度的均值和中值,最小灰度值和最大灰度值。

11.3.2 拓扑描述子

与距离或基于距离度量概念的任何特性无关,对于图形区域的整体描述是很有用的,与孔洞数量、连通分量的数量、欧拉数有关。

基本元素:
在这里插入图片描述
孔洞数量H,连通分量C,可用于定义欧拉数E:
E = C − H (1) E=C-H \tag{1} E=C−H(1) V − Q + F = C − H = E (2) V-Q+F=C-H=E \tag{2} V−Q+F=C−H=E(2) V是顶点数,Q表示边数,F表示面数。
在这里插入图片描述

11.3.3 纹理

纹理描述主要有三种方法:统计方法、结构方法、频谱方法。

  • 统计方法考察纹理的平滑、粗糙、粒状等特征;
  • 结构方法考察纹理的排列描述;处理图像像元的排列;
  • 频谱方法考察纹理的周期性。基于傅里叶频谱的特性。

纹理反映像素灰度的空间分布属性,表现为局部不规则但宏观有规律性。

11.3.4 不变矩

根据归一化中心矩可获得7个不变矩,其对同一区域的平移、缩放、旋转、镜像都不敏感。
在这里插入图片描述
在这里插入图片描述

11.4 使用主成分进行描述

主成分变换,是指由原始图像数据协方差矩阵的特征值和特征向量建立起来的变换核,将光谱特征空间原始数据向量投影到平行于地物集群椭球体各结构轴的主成分方向,突出和保留主要地物类别信息,用来进行图像增强、特征选择和图像压缩的处理方法。

霍特林变换:
y = A ( x − m x ) y=A(x-m_x) y=A(x−mx​) m x m_x mx​为x的均值,A为特征向量为 C x C_x Cx​(正交)作为行向量组成的矩阵,可处理y重建x的问题。

x 1 = A k T y + m x x_1=A_k^ T y+m_x x1​=AkT​y+mx​
均 方 差 e m s = ∑ j = k + 1 n λ j 均方差e_{ms}=\sum _{j=k+1} ^{n} \lambda_j 均方差ems​=j=k+1∑n​λj​若k=n(使用了所有的特征向量),误差为0,由于 λ j \lambda_j λj​单调递减,通过选取与最大特征值相对应的k个特征向量,可使得误差最小,霍特林变换为主成分变换,达到最佳效果。

实验部分

总结

标签:多边形,边界,第十一章,数字图像处理,11.2,11.3,链码,描述
来源: https://blog.csdn.net/weixin_44395365/article/details/117597851

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有