ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

多媒体信息与通信期末复习

2021-05-30 15:31:18  阅读:120  来源: 互联网

标签:编码 颜色 复习 信号 语音 灰度 多媒体信息 图像 期末


此为张晶老师出版的《多媒体信息与通信》的书所整理出的知识点
第一章
1.媒体是指信息的载体
2.媒体有两种含义:
(1)信息的存储实体,如磁盘、光盘、磁带、半导体存储器等
(2)传递信息的基本元素,如文字、声音、图形、动画和图像
3.常见的媒体形式
(1)文本
(2)图形:多媒体中的静态可视元素之一,一般是以采用算法语言或某些应用软件生成的矢量图的形式来表达
(3)图像:多媒体中的一种静态可视元素,其基本形式为位图
(4)视频:属于动态可视元素。图像与视频是两个既有联系又有区别的概念
(5)音频:频率大约为15Hz~20Hz的声音
(6)动画:采用计算机动画软件创作并生成的一系列可提供实时演播的连续画面,属于一种动态可视媒体元素
4.媒体的分类
(1)感知媒体:人的感知器官能够直接感知的一类媒体。这类媒体有声音、乐音、动画、运动图像、图像噪音等
(2)表示媒体:胃口为了更有效地加工、处理和传输感知媒体而人为研究和构造出的一种媒体
(3)呈现媒体:将媒体信息的内容呈现出来,在转换中用于信息的输入和输出的媒体
(4)存储媒体:用于存储表示媒体的物理介质
(5)传输媒体:用来表示媒体从一处传输到另一处的物理传输介质
5.多媒体信息
目前能用bit表示的
(1)文本信息
(2)图信息
(3)动态信息
(4)音频信息
(5)触觉信息
(6)其他信息
(7)多媒体信息
6.多媒体通信技术是多媒体技术与通信技术的有机结合,突破了计算机、通信、电视等传统产业间相对独立发展的界限,是计算机、通信和电视领域的一次革命,简单来说,多媒体通信技术就是在计算机的控制下,对多媒体信息的采集、处理、表示、存储和传输
7.多媒体信息的特点
①信息的多样性和数据的海量性
②信息的同步性
③多媒体信息的应用特性
8.多媒体通信的特征
①集成性
②交互性
③同步性
9.智能信息处理的发展目标是要制造出具有学习、理解和判断能力的人工智能系统。
本质:研究一些算法用来提取出信号中的有用信息,从而实现系统的智能控制。
10.智能信息处理的一个非常重要的目标,就是要制造出一种能看会说、有感情思维的机器人。
11.语音处理的目的是对人们发出的语音的规律及特点进行研究,以便让计算机能够“说话”和听懂人的语言
12.图像处理技术研究的目的是让计算机具有视觉功能

第二章
任务2.1音频信号噪声检测及噪声去除
1.噪声物理学的概念:无规律的不具周期性特征的声响
卫生学:泛指干扰睡眠休息和交谈思考,给人以烦恼的感受,造成听觉危害的一切声响。
因此可按照噪声源的物理特性、时间特性及频率成分分布等方式进行分类
2.语音信号的特点
①在频域内。语音信号的频谱分量主要集中在300~3400Hz的范围内。
②在时域内。语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间的变化而变化的,但在一段较短的时间间隔内会保持平稳。语音信号在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征
3.语音信号的时域分析
(1)窗口的选择
在550ms的范围内,语音频谱特性和一些物理特性参数基本不变。我们将每个短时的语音称为一个分析帧,一般取帧长为1030ms。采用一个长度有限的窗函数来截取语音信号形成的分析帧,通常会采用矩形窗和汉明窗。在语音频谱分析时常采用汉明窗,在计算短时能量和平均幅度时通常采用矩形窗
(2)短时能量
短时能量函数可以区分清音段和浊音段
En值大对应浊音段,En值小对应清音段
(3)时域分析方法的应用
①可用于基音频率的估计
②可用于语音端点的检测与估计
4.语音信号的频率分析
①短时傅里叶变化
②语谱图的水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短时谱。语谱图反映了语音信号的动态频率特性,在语音分析中具有重要的实用价值,被视为可视语言
语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。时间分辨率高,可以看出世家波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨率由于激励所形成的细微结构,称为宽带语谱图;而窄带语谱图正好与之相反
宽带语谱图可以获得较高的时间分辨率,清晰地显示共振峰结构和语谱包络,反映频谱的快速时变过程;窄带宽语谱图可以清晰地显示谐波的结构,反映基频的时变过程,放映频谱的精细结构。两者相结合,可以提供与语音信号相关的特性。
③复倒谱和倒谱
复倒谱是x(n)的Z变换取对数后的逆Z变换,其表达式如下:

倒谱c(n)定义为:对x(n)取Z变换后的幅度求对数,在取逆Z变换,即

在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积
④基音周期估计
浊音信号的倒谱中存在峰值,它的出现位置等于该语音段的基音周期,而清音的到谱中则不存在峰值。如果倒谱峰值超过预设门限,则判断输入为浊音,反之判断为清音
⑤共振峰估计
对于浊音的声道特性,可以采用前三个共振峰来描述;清音则不具备共振峰特点
5.噪声硬件系统主要可由传声器、功率放大电路、交直流转换电路、V/F 变换电路、单片机和液晶显示系统构成。
6.功率放大器主要由LM386构成,其作用是对声音信号进行功率放大以满足设计要求
7.交直流转换电路主要由AD536A构成,其作用是完成电信号由交流到直流的转换。AD536A可直接计算任何复杂输入波形的均方值,并测量误差大小。
8.V/F变换电路主要使用LM331芯片来完成电压频率的转换。LM331主要由输入比较器、定时比较器、RS触发器、电子开关和输出驱动管组成。该电路抗干扰能力强,非线性失真小,系统测量范围大。
9.单片机集成了cpu、存储器、定时/计数器。
10.液晶显示系统由lcd1602构成
11.在噪声检测系统中可能出现以下故障
①电源电压错误
②硬件电路焊接错误
③软件程序编写错误
12.去噪算法设计
①谱减法:增强语音和减小噪声是处理带噪语音的两种方法,谱减法是一种增强语音
的方法。
②滤波法
13.滤波器的设计
①窗函数法:设计FIR数字滤波器的最简单的方法是窗函数,通常也称为傅里叶级数法
②频率采样法:从频域出发,根据频域采样定理,对给定的理想滤波器的频率响应H(e)加以等间隔的抽样
③切比雪夫逼近法:是最佳一致逼近法
14.小波去噪原理
首先对带噪语音信号进行小波变换,得到各尺度的小波系数,然后对得到的小波系数进行噪声估计。进行噪声估计的方法比较多,可以针对每一层分解得到的系数进行估计,也可以只是对近似部分的系数进行估计,还可以针对所有得到的系数进行估计。
使用小波变换进行去噪的关键在于阈值的选取。
15.遗传算法去噪
特点:直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐蔽性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。
过程:(1)初始化(2)个体评价(3)选择运算(4)交叉运算(5)变异运算(6)终止条件判断

任务2.2 颜色空间模型及转换
1.颜色是通过眼、脑和人们的生活经验所产生的一种对光的视觉效应。人们对颜色的感觉不仅仅由光的物理性质所决定,比如人类对颜色的感觉还往往受周围其他颜色的影响。有时人们也将物质产生不同颜色的物理特性直接称为颜色
2.光是一种电磁波
3.色彩的三要素:亮度、色调、色饱和度
4.亮度反映光的明亮程度
5.色调反映颜色的类别
6.色饱和度反映彩色光(色调)深浅的程度
7.三基色原理:绝大多数单色光可以分解成红、绿、蓝三种色光。这三种颜色必须是独立的,任何一种颜色都不能由其他两种颜色合成。
8.相加混色原理
(1)空间混色法:它将三种色光投射到同一表面上彼此相距很近的三个点上,由于人眼的分辨力有限,故产生一种基色光混合的色彩感觉。
(2)时间混合法:它把三种基色光轮流投射到同一平面上,只要轮流速度足够快,就能达到相加混色的效果(人的视觉惰性)
红色+绿色=黄色
绿色+蓝色=青色
红色+蓝色=品红
9.相减混色原理:吸收三基色比例不同而形成不同的颜色的。所以又把青色、品红、黄色称为颜料三基色
10.RGB颜色空间模型
在RGB颜色空间模型中,对任意彩色光F,其配色方程可写为
F=r[R]+g[G]+b[B]
其中,r、g、b为三色系数,r[R]、g[G]、b[B]为F色光的三色分量,RGB颜色空间可以用一个三维的立方体来描述,R、G、B这3个分量分别为三维空间的3个坐标轴
11.YUV颜色空间模型
YUV是PLA制彩色电视系统所采用的一种颜色空间模型,其中Y表示亮度,U表示蓝色色差,V表示红色色差
亮度信号Y和色度信号U、V是分离的,完成了色彩和黑白电视的对接,使带颜色的图像能在所有电视机上显示;U、V为色差并且能完全显示所有彩色。
12.YIQ颜色空间模型
YIQ模型中Y也为所有电视提供亮度信号,I和Q表示色度,即图像的色调及饱和度。YIQ颜色空间是由YUV推到而来的。I代表“相同”,Q代表“正交”,它们指的是用于发射颜色信息的调制方法;I、Q是通过将U、V轴逆时针旋转33°获得的。
传送Q信号时可以用较窄的频带,而传送分辨率较强的I信号时,可以用较宽的频带
13.YCbCr颜色空间模型
YCbCr是由YUV颜色空间派生出的一种颜色空间模型。其中Y是亮度。色度信息完全存储在Cb和Cr中,Cb代表蓝色信息,Cr代表红色信息。基本上,YCbCr和YUV代表相同的颜色空间,但YCbCr中的各成分是YUV颜色空间中各成分比例的补偿数值
14.CIELAB颜色空间模型
LAB是一种不常用的色彩空间,它是一种与设备无关的颜色系统,也是一种基于生理特性的颜色系统。它用数字化的方法来描述人的视觉感应。L分量用于表示像素的亮度,取值范围是[0,100],表示从纯黑到纯白;A表示从红色到绿色的范围,取值范围是[127,-128];B表示从黄色到蓝色的范围,取值范围是[127,-128]。LAB颜色空间比计算机显示器、打印机甚至比人类视觉的色域都要大,在获得同样的精度时,LAB位图比RGB或CMYK位图需要的像素数要多。
RGB无法直接转换成LAB,需要先转换成XYZ再转换成LAB,即RGB-XYZ-LAB。

任务2.3 车牌图像的预处理
1.图像是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意画面。静止的图像可以用一个矩阵来表示,矩阵列中的各个元素用来描述构成图像的各个点(称为像素)的强度和颜色等信息,这种图像也称为位图。
2.位图图像的技术指标
(1)分辨率
①显示分辨率:确定屏幕上显示图像区域的大小。
②图像分辨率:确立组成一幅图像的像素数目,即该图像在水平和垂直方向上的像 素个数,用dpi表示
③打印分辨率:打印机输出图像时采用的分辨率。
(2)像素深度:描述图像中每个像素所占的二进制位数。
(3)真彩色,伪彩色与间接色
(4)调色板:在生成一幅位图图像时,图像处理软件要对图像中不同的色调进行采样, 产生包含在此幅图像中各种颜色的颜色表,即一组(R、G、B)组合值。
(5)显示深度:显示缓存中记录屏幕上一个点的二进制位数,即显示器可显示的颜色数
(6)位图图像的数据量=图像的总像素*像素深度/8
3.位图的特点
(1)表达图像逼真
(2)对硬件要求高
(3)文件数据量大
(4)缺乏灵活性能
4.位图文件的结构:文件头、文件体、文件尾
文件头:包括产生或编辑该图像文件的软件信息以及图像本身的参数
文件体:包括图像数据以及颜色变换查找表或调色板数据
文件尾:包含一些用户信息,是可选项
5.矢量图是一种抽象化的图像
6.矢量图的原理在于它用数学方式来描述一幅图形
7.矢量图的特点
(1)压缩后不变形
(2)局部可处理性
(3)文件数据量小
(4)不易描述复杂图
8.矢量图和位图的特点比较
文件内容 文件容量 显示速度 应用特点
矢量图 图形指令 与图的复杂程度有关 图形越复杂,执行指令越多,显示越慢 易于编辑
位图 图像点阵数据 与图尺寸及彩色有关 与图内容有关 适合获取和复制

9.彩色图像的灰度化处理
灰度图只有亮度,不含其他颜色,它的值在0~255之间,且数值越大越亮,数值越小越暗,最亮为白色,最暗为黑色。灰色图像处理速度快、操作简单、存储空间小。每个像素等于三个基色的加权平均值
10.图像增强处理的目的:一是改善图像的视觉效果,二是将图像转换成一种更适合让人活着机器进行分析和处理的形式
11.有两大类处理方法:
基于空间域的方法:直接在图像所在的空间进行处理
基于频率域的方法:在图像变换域间接进行间接处理
12.图像的二值化处理
就是将像素点上的灰度值设置成0或255,也就是将整个图像呈现出明显的黑白效果
常用的图像二值化阈值的选取方法有双峰法、P参数法、最大类间方差法、最大熵阈值法、迭代法。该任务中采用最大类间方差法实现图像的二值化处理。
13.图像的边缘检测
边缘时图像上灰度化最明显的地方,传统边缘检测利用此特点,对图像各像素点进行求微分或二阶微分来定位边缘像素点。
由于灰度变化的特点,可将边缘类型分为阶梯状、脉冲状、屋顶状
对于阶梯状的边缘,图像边缘点对应一阶微分图像的峰值和二阶微分图像的零交叉处;对于脉冲状和屋顶状边缘,边缘点对应一阶导数的零交叉和二阶导数的峰值
处理图像时常采用差分代替导数运算。
图像梯度最重要的性质是梯度的方向在图像灰度最大变化率上,恰好可以反映出图像边缘上的灰度变化。边缘检测算子是利用图像边缘的突变性质来检测边缘的。
①差分边缘检测:通过求图像灰度迅速变化处的一阶导数算子的极值来检测奇异点。
②Roberts算子:利用局部差分算子寻找边缘的算子,它采用对角线方向相邻的像素之差近似梯度幅值检测边缘,梯度幅值可根据任意一对相互垂直方向上的差分来计算。
③Sobel算子:是滤波算子的形式,用于提取图像边缘。对数字图像{f(i,j)}的每个像素,考察它上、下、左、右四邻域灰度值的加权差,与之接近的邻域的权值最大。
④Prewitt算子:其中一种时使用方法同Sobel算子相同,可对图像进行差分和滤波运算,但是模板不同
⑤Laplace算子:一个二阶微分算子,它利用边缘点处的二阶导函数出现零交叉的原理检测边缘。
15.数学形态运算
①腐蚀运算:一种消除边界点的过程,目的是使目标缩小,空洞增大,以有效地消除孤立噪声点。腐蚀运算可以把小于结构元素的物体去除。
②膨胀运算:将与目标体接触的所有背景点合并到物体中的过程,目的是使目标增大,空洞减小,以填补目标物体中的空洞
③开运算:先对图像进行腐蚀,然后再对图像进行膨胀,最后得到结果。开运算通常用于去掉小对象物体,以及去掉目标外的孤立点。开运算在平滑目标物体边界的同时并不明显改变其面积
④闭运算:先对图像进行膨胀,然后再对图像进行腐蚀,最后得到结果。闭运算主要用来填充物体内细小空洞,可以去掉目标内的孔。闭运算在连接邻近物体、平滑其边界的同时并不明显改变其面积
主要目地是填充物体内的细小空洞,在连接临近物体、平滑其边界的同时并不明显改变其面积

任务2.4 雾霾图像的增强处理
1.直方图均衡化算法:经过某种变换之后能使图像灰度的概率变得更均匀化,使其信息熵能够达到最大值
2.直方图是一种能反映图像灰度分布情况的图表。图像的不同灰度值出现的概率和像素数量的多少,反映了图像的信息内容。
3.改进的直方图均衡算法
直方图均衡化的主要理论是针对连续函数,然而对具有离散灰度值的数字图像进行处理时,就需要在函数变换过程中,灰度值经历从连续到离散的近似。
直方图均衡化存在的问题:
(1)量化误差,损失了原图中的某些灰度信息
(2)由于原图像中的低灰度层像素过多,概率密度及其不均匀,从而导致整个图像的灰度动态范围未能有效改善,在进行直方图均衡化的过程中,图像高低灰度的转变导致图像信息转化不均衡,导致一些信息被覆盖
改进的直方图均衡算法的基本思想:通过变换函数对原图像的直方图进行灰度拉伸,使其生成具有“平坦”概率分布的直方图,再用新的均衡化后的直方图去校正图像
4.具体改进方法
(1)减少原图像的低灰度层在生成图像中的概率,进而减少其对生成图像的影响,使生成图像的灰度分布范围更广。
(2)由于原来图像的低灰度层范围的像素较密,分布不均匀,从整体观察,相近区域亮度相差较大,不利于对中间细节信息的观察,为此需要对生成图像做适当的调整,对亮度参数进行调整
5.实现直方图均衡算法的主要函数
(1)Newmap=rgb2gray(map)
(2)imwrite(rgb2gray(PS),PicScampleGray.bmp)表示将彩色图片灰度化并保存
(3)PS=rgb2gray(PS):表示将灰度化后的数据存入数组。
(4)size函数:获取矩阵的行数和列数
(5)zeros函数:功能是返回一个mnp*。。。。的零矩阵
6.传统Retinex图像增强算法及存在的缺陷:对图像进行高通滤波处理的过程,目的是为了增强图像的高频范围,同时去除掉一些信息量较小的低频,结果导致了图像的某些信息的丢失,不能正确反映图像的原本内容
7.改进多尺度Retinex算法:Retinex理论认为所有图像的来源都可以看成其介质的入射分量和反射分量的合成,Retinex算法的目的就是计算其反射分量,因此就需要寻找一种合适的途径得出反射分量,通过改变反射分量的参数实现对图像的增强。Retinex算法认为影响物体表色的因素是物体表面材质的反射性质,而与入射无关,因此去除入射分量并计算出反射分量,求出最终的增强图像,其色彩保真度明显较好
8.实现Retinex算法的主要函数
(1)mat2gray函数:用于将图像矩阵归一化
(2)Im2double函数:又称为归一化函数
(3)Imfilter函数:对数组或图像进行滤波
(4)cat函数:在matlab中用来连接数组
9.基于小波变换域增强算法:首先对待增强图像进行分解,得到一系列系数,称为小波系数。再对这些系数进行压缩存储,设置图像尺寸,对小波系数进行阈值处理,最后进行重构。

第三章 多媒体信息的压缩编码技术及标准
任务3.1 基于预测方法的音频信号
1.音频信号作为多媒体的一种表现形式,是自然界声音中的部分体现,可以通过音频采集设备得到。
2.声音通过空气传播的一种连续的波
3.对声音的质量评价主要体现在音调、音强和音色
4.声音是在空气传播的一种连续的波
5.音调指声音的频率,频率高则音调高,频率低则音调低。
6.音强即音量,与声波的振动幅度有关,反映了声音的大小和强弱
7.音色体现了声音提起来的优美程度。基音和泛音决定了特色声音的音色或音质
8.次声波:频率低于20Hz的声波
9.超声波:频率高于20kHz的声波
10.音频信号:20Hz~20kHz
11.人类发声器官发出的声音80~3400Hz
12.语音信号:300~3400Hz
13.音频信号的数字化:在模数转化的过程中,需要遵循奈奎斯特抽样定理,才能保证采样之后的数字信号完整地保留原始信号中的信息
14.音频信号的时间冗余主要表现为幅度分布的非均匀性、样值间的相关性、周期之间的相关性以及静止系数。
15.音频信号的频域冗余主要指时长功率谱密度的非均匀性和语音特有的短时功率谱密度
16.音频压缩技术分为:无损压缩和有损压缩
17.对于不同的压缩编码方法,其算法的评定可以从以下四方面:
①算法复杂度:包括运算复杂度和内存要求。
②重构音频信号的质量:信噪比
③编码效率:压缩比
④编解码时延
18.无损压缩:在解压后能逐位恢复原始数据信息。它通过预测过去样本中的值,消除存在于音频信号中的统计冗余。无损压缩可以实现小压缩比,最好可使压缩比达到大约2:1,具体取决于原始语音信号的复杂性。时域预测编码技术使无损压缩成为可行
19.有损压缩:使用压缩后的数据进行重构,重构后的数据与原来的 数据有所不同,不会使人对原始信号表达的信息造成误解;有损压缩适用于重构信号与原始信号无需完全相同的场合,有损压缩的压缩比具体取决于编码/解码过程的复杂性和音频质量要求
20.有损编码又分为:
①波形编码:直接对音频信号产生的时域波形采样值或其频域变换系数进行编码,主要利用音频样值的幅度分布规律和相邻样值间的相关性进行压缩,编码系统源于信号原始样值,波形与原始声音波形尽可能地一致,保留了信号的细节变化和各种过渡特征。此类压缩技术的共同特点是算法复杂度低,声音质量易班,压缩比小,编解码延时最短,一般多用于语音压缩、低码率的场合。
②参数编码:首先根据不同的信号源,如语音信号、自然信号等形式建立特征模型,通过提取特征参数和编码处理,使重建的声音信号尽可能高地保持原声音的语意,但重建信号的波形同原声信号的波形可能会有相当大的差别。常用的特征参数有共振峰、线性预测系数、频带划分滤波器
③混合编码:将波形编码和参数编码组合起来的编码,克服了原有波形编码和参数编码的弱点,力图保持波形编码的高质量和参数编码的低速率。
21.音频信号压缩原理步骤:首先对信号进行分帧操作,然后去除帧内各样值间的冗余,最后再利用熵编码算法进行编码
22.音频信号的分帧:分帧是大多数音频压缩算法的共同特点,它可以提供快速且便捷处理音频信息流的能力。
23.预测编码:是建立在信号的相关性之上
若想真正实现预测编码还要进一步考虑以下三个方面的问题:
(1)预测误差准则的选取 ①最小均方误差(MMSE)准则。②功率包络匹配
(PSEM)准则。③预测系数不变性(PCIV)准则。④最大误差(ME)准则
(2)预测函数的选取。
(3)预测输入数据的选取
24.熵编码
常见的信息熵编码有:霍夫曼编码、香农编码、游程编码、算术编码、Rice
编码。
Rice编码码字由以下部分组成:符号位、若干连续的0、分隔位、k位二进
制码
25.左右声道联合差分编码:对音频信号进行线性预测编码来实现数据压缩,主要是靠去除数据的相关性来实现的。
任务3.2
1.变换编码主要由映射变换、量化及编码几部分操作组成。
2.一维CT的核变换定义为3

3.采用MDCT的优点:
在用MDCT时,为了追求由M个采样构成的第一组数据频谱,首先把这M个采样和与其相邻两个组的各一半叠加,取出2M个采样,在加上窗口,变成频谱数据。这样就得到了2M个频谱系数,不过其中有一半是由剩下一半的频谱系数符号反转得到的。故独立的频谱系数只得到M个。即对于由M个采样构成的每一组,可以将M个实数值数据进行编码。
4.提升的基本原理 提升运算、提升矩阵
5.对时域重叠抵消的一个充分条件是窗函数必须满足对称性

任务3.3 图像/视频信息的霍夫曼编码
1.图像/视频信息的压缩主要是依靠削弱甚至消除组成图像像素点、视频连续帧之间的相关性质,从而减少图像的像素比特。这种相关性被称为图像/视频的冗余
2.冗余主要分为以下六类:
①空间冗余:是静态图像中存在的最主要的一种数据冗余
②时间冗余:是序列图像中经常包含的冗余
③结构冗余:是在某些场景中,存在着明显的图像分布模式,这种分布模式称作结构
④视觉冗余:是因为人类的视觉系统对图像的敏感程度不同而产生的一种冗余
⑤符号冗余:也称为编码表示冗余
⑥知识冗余
3.关于编码的基础物理量
①熵
②平均码长
③编码效率:编码效率为熵和平均码长的比值
④压缩比:未压缩编码前存储位数与压缩后的比值
4.最佳变长编码的方法:凡是能载荷一定的信息量,且平均码长最短,可分离的变字长编码的码字。
5.能获得最佳编码的方法主要有:香农编码、费诺编码、哈夫曼编码
6.香农编码的步骤:
①将信源消息按其出现的概率大小依次排列
②确定满足下列不等式的整数码长K
③为了编成唯一可译码,计算第i个消息的累加概率
④将累加概率pi变成二进制数
⑤取pi二进制数的小鼠点后K位即为该消息符号的二进制码字
7.费诺编码的步骤:
①将信源消息符号按其出现的该路大小依次排列
②将依次排列的信源消息符号按概率值分为两大组,使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”
③将每一大组的信源消息符号再分成两组,同样使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”
④如此重复,直至每个组只剩下一个信源符号为止
8.霍夫曼编码是一种基于统计的无损压缩方法,概率小的码字长度长,概率大的码字长度短
9.霍夫曼编码的具体方法:先按不同字符出现的概率大小排队,把两个最小的概率相加,作为新的概率,并与剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变两个概率相加和为1
10.霍夫曼二叉树的建立
11.霍夫曼编码的特点:
①霍夫曼编码的构造方法是确定的,但得出来的编码结果确实不确的。
②由于霍夫曼编码采用的是变长编码,码字不等长,就导致硬件实现很困难,而且再抗误码方面能力也比较弱。
③霍夫曼编码后,会形成一个霍夫曼编码表,解码时需要参照这一编码表才可以正确解码
12.算术编码步骤:
①定义当前区间为[0,1)
②对输入流的每个符号s,重复下面的两步骤:
(1)把当前区间分割为长度正比于符号概率的子区间
(2)为s选择一个子区间,并将其定义为新的当前区间
③按照以上步骤把整个输入流处理完之后,输出位于当前区间中的任何数字,并且该数字能够唯一确定当前区间

任务3.4 多媒体信息的游程编码
1.游程的概念:针对一些文本数据的特点而设计的,主要是去除文本中的冗余字符或字节中的冗余位,从而达到减少数据文件所占用存储空间的目的。
2.游程编码具有以下特点:
(1)游程编码仍是变长码,需要大量的缓冲和优质的信道。
(2)游程长度可以从1一直到无限,这在码字的选择和码表的建立方面都有困难,尚需采用某些措施来改进。
(3)游程长度越长,其概率越小。对于小概率的码字,其长度为达到概率匹配或较长时,损失不会太大。
(4)游程编码对平均码字长度影响较小。
3.游程编码算法存在以下缺点:
(1)游程算法一般不直接应用于灰度图像,比较适合于二值图像的编码。
(2)游程编码要想达到较好的压缩效果,图像中就必须出现连续的0或者连续的1,假如一旦用于编码的数组不出现这种连续的0或者连续的1时,游程编码就难以实现压缩效果。
(3)游程编码算法一般不单独使用,与霍夫曼编码混合使用的时候较多。

标签:编码,颜色,复习,信号,语音,灰度,多媒体信息,图像,期末
来源: https://blog.csdn.net/qq_45740354/article/details/117398778

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有