ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

《 Real-Time Compressive Tracking 》的个人理解

2021-09-09 15:34:55  阅读:174  来源: 互联网

标签:Real Tracking 提取 Compressive 特征 样本 分类器 作者 理解


这是对《Real-Time Compressive Tracking 》论文与作者提供代码的理解要点,是个人的浅显理解。

论文要干嘛

对视频每一帧提取到的n个样本框进行分类,并提取最优值所对应的样本框作为跟踪结果,便能从前到后依次跟踪目标。其中分类器在不断地学习更新使其能对物体目标的轻微改变(比如亮度、形状上不是很大的改变)具有一定的鲁邦性。

说到底就是想训练一个分类器,识别待跟踪帧中最优的目标位置。然而,特征是什么样子的呢?

作者提取什么特征?

作者提取的是类似Haar-like的特征(haar-like可以百度了解)。作者会对一帧视频的一个样本框的图片内采用不同尺寸的“rectangle
filter ”来提取,然后就组成了一维的特征矩阵。

然而,一个重要的问题来了。小filter的数量太多了,比如作者提到的数量m可能是“10^6 to 10^10 ”(作者没有给出参考图片尺寸,暂时理解图片的尺寸是正常数据集中的图片尺寸)。

因此,就需要压缩技术了。

压缩思想

假如利用一个稀疏矩阵R,可以将x的维度m降到v的维度n(m>>n),这里的维度可以理解为数量。假如v可以极大地保留x中的特征信息,那么就可以利用v代表x来进行分类了。

那么,

R中的一个元素会和一个样本“特征”框的特征值相乘,因此可以在一开始就记下R中的这个元素和这个框的位置(作者c++代码中不容易理解的部分)。

因此,当R非常稀疏时(0很多),就可以只记录R中非0的元素和其对应的rectangle filters 的位置。这样可以存储很少量的数据。

特征提取了怎么放入分类器呢?

作者指出这些一个图片提取的特征满足gauss分布,因而能利用gauss分布将特征v计算成一个个的概率值。

有了概率,再利用朴素贝叶斯分类器计算分数,分数最高的即是跟踪的最佳结果位置了。

怎么更新分类器呢?

挑选接近目标框的正样本(红),和远离目标框的负样本(绿)。这两种样本,每一个样本框内可以提取特征,计算均值mu与方差sigma,代入下面公式进行更新就行了。

完整更新示意图如下:

读者感受

实时感知压缩(《Real-Time Compressive Tracking 》)构思非常巧妙,降低了很多计算量。

但是其并不能解决一些比较明显的遮挡等问题,应对遮挡等问题有很多新的研究论文,读者在知网上就找到了很多篇。

标签:Real,Tracking,提取,Compressive,特征,样本,分类器,作者,理解
来源: https://www.cnblogs.com/lmh1282/p/15247229.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有