首页 > 其他分享> 文章详细

PatchMatch小详解

2019-05-20 12:50:28 阅读：263 来源： 互联网

标签：begin right end PatchMatch 详解 delta aligned left

最近发了两片patch match的，其实自己也是有一些一知半解的，找了一篇不知道谁的大论文看了看，又回顾了一下，下面贴我的笔记。

The PatchMatch Algorithm

patchmatch一开始被应用于结构化的图片编辑。

是一个随机性的算法。
致力于找到近似的最近领匹配。

patchmatch的假设：

邻近的像素有一样的模型参数\(p\in R^n\)
有一个cost function可以计算给定一个\(p\)的代价

PatchMatch三大步：

随机初始化
传播
随机搜索

PatchMatch for Motion Estimation

因为有些像素可能会被遮挡，我们需要舍弃他们的估计。有一种方法叫forward-backward consistency check.

这个移动也不能是无限大的，在这个论文里如果大于400像素我们就舍弃。

Motion Models

有各种translation motion model.

The Translational Motion Model

\[ \begin{aligned} x_{2} &=x_{1}+b_{1} \\ y_{2} &=y_{1}+b_{2} \end{aligned} \]

The Affine Motion Model

\[ \begin{aligned} x_{2} &=a_{1} x_{1}+a_{2} y_{1}+b_{1} \\ y_{2} &=a_{3} x_{1}+a_{4} y_{1}+b_{2} \end{aligned} \]

The Projective Motion Model

也就是个Homography.
\[ \omega \left( \begin{array}{c}{x_{2}} \\ {y_{2}} \\ {1}\end{array}\right)=\left( \begin{array}{lll}{h_{1}} & {h_{2}} & {h_{3}} \\ {h_{4}} & {h_{5}} & {h_{6}} \\ {h_{7}} & {h_{8}} & {h_{9}}\end{array}\right) \left( \begin{array}{l}{x_{1}} \\ {y_{1}} \\ {1}\end{array}\right) \]
也可以简化一下:
\[ \begin{aligned} x_{2} &=\frac{h_{1} x_{1}+h_{2} y_{1}+h_{3}}{h_{7} x_{1}+h_{8} y_{1}+h_{9}} \\ y_{2} &=\frac{h_{4} x_{1}+h_{5} y_{1}+h_{6}}{h_{7} x_{1}+h_{8} y_{1}+h_{9}} \end{aligned} \]

The Quadratic Motion Model

\[ \begin{array}{l}{x_{2}-x_{1}=a_{1}+a_{2} x_{1}+a_{3} y_{1}+a_{7} x_{1}^{2}+a_{8} x_{1} y_{1}} \\ {y_{2}-y_{1}=a_{4}+a_{5} x_{1}+a_{6} y_{1}+a_{7} x_{1} y_{1}+a_{8} y_{1}^{2}}\end{array} \]

PatchMatch for Stereo Reconstruction

有几个模型，比如:eipipolar constraint model, projective planar model, the slanted plane model.

Pipeline

有４个步骤:

camera calibration

相机标定是拿内外参，也就是内参和相机位姿都要知道。

image rectification

简化下一步骤，因为只需要在横坐标上搜索。

disparity estimation (aka stereo matching)
depth reconstruction

有了相机内外参和dispairty,深度很容易估计。

1558322695040

\[Z=\frac{f \cdot b}{x_{1}-x_{2}}, Y=\frac{y_{1} \cdot Z}{f}, X=\frac{x_{1} \cdot Z}{f}\]

这里\(b\)是baseline, disparity　\(d=x_1-x_2\),所以\((X, Y, Z)\)都和disparity成倒数。

Models for Stereo Matching

The Epipolar Constraint Model

\[ \tilde{\mathbf{x}}_{2}^{\top} \mathbf{F} \tilde{\mathbf{x}}_{1}=0 \]

当只有x轴上的移动，也就是在rectified image的时候，\(F\)会退化成如下:
\[ \mathbf{F}=\left[ \begin{array}{ccc}{0} & {0} & {0} \\ {0} & {0} & {-1} \\ {0} & {1} & {0}\end{array}\right] \]
这样的话，\(y_2=y_1\)。

The Projective Planar Model

\[ \begin{aligned} x_{2} &=\frac{h_{1} x_{1}+h_{2} y_{1}+h_{3}}{h_{4} x_{1}+h_{5} y_{1}+h_{6}} \\ y_{2} &=y_{1} \end{aligned} \]

The Slanted Plane Model

这个模型假设\((x, y, d)\)和一个法向量\((n_x, n_y, n_z)\)在一个3D平面上，这里\(d\)表示视差。一个穿过点\(\left(x_{1}, y_{1}, d_{1}\right)\)的平面方程如下:
\[ n_{x}\left(x-x_{1}\right)+n_{y}\left(y-y_{1}\right)+n_{z}\left(d-d_{1}\right)=0 \]
这个公式其实挺容易理解的，从这个点发射的向量如果和法向量乘积是0，那就在这个平面上。

那么根据上式，视差的表达式也可以很容易推导出来:
\[ d=\frac{n_{x} x_{1}+n_{y} y_{1}+n_{z} d_{1}}{n_{z}}-\frac{n_{x}}{n_{z}} x-\frac{n_{y}}{n_{z}} y \]

代价函数 Cost Function

公式:
\[ \begin{aligned} \mathcal{C}\left(\mathbf{p} ; x_{1}, y_{1}\right)=\sum_{\delta_{x}=-m}^{m} \sum_{\delta_{y}=-m}^{m}\left(\mathcal{W}\left(f\left(x_{1}, y_{1}\right), f\left(x_{1}+\delta_{x}, y_{1}+\delta_{y}\right)\right)\right.\\ \cdot & \rho\left(f\left(x_{1}+\delta_{x}, y_{1}+\delta_{y}\right), g\left(x_{1}+\delta_{x}-\mathcal{D}\left(\mathbf{p} ; x_{1}+\delta_{x}, y_{1}+\delta_{y}\right), y_{1}+\delta_{y}\right)\right) ) \end{aligned} \]
和公式:
\[ \begin{aligned} \mathcal{C}\left(\mathbf{p} ; x_{2}, y_{2}\right)=\sum_{\delta_{x}=-m}^{m} \sum_{\delta_{y}=-m}^{m}\left(\mathcal{W}\left(g\left(x_{2}, y_{2}\right), g\left(x_{2}+\delta_{x}, y_{2}+\delta_{y}\right)\right)\right.\\ & \cdot \rho\left(g\left(x_{2}+\delta_{x}, y_{2}+\delta_{y}\right), f\left(x_{2}+\delta_{x}+\mathcal{D}\left(\mathbf{p} ; x_{2}+\delta_{x}, y_{2}+\delta_{y}\right), y_{2}+\delta_{y}\right)\right) ) \end{aligned} \]
这里\(m\)是patch的大小，而\(\mathcal{W}\)是一个权重函数:
\[ \mathcal{W}\left(f(x, y), f\left(x^{\prime}, y^{\prime}\right)\right)=\exp \left(-\frac{\left\|f(x, y)-f\left(x^{\prime}, y^{\prime}\right)\right\|_{1}}{\gamma}\right) \]
而\(\rho(.)\)函数计算像素\(f(x,y)\)和它的投影点\(g(x-d,y)\)的不相似度:
\[ \begin{aligned} \rho(f(x, y), g(x-d, y))=&(1-\beta) \cdot \min \left(\|f(x, y)-g(x-d, y)\|_{1}, \tau_{c o l}\right) \\ &+\beta \cdot \min \left(\|\nabla f(x, y)-\nabla g(x-d, y)\|_{1}, \tau_{g r a d}\right) \end{aligned} \]
这里\(\beta\)就是衡量两个不同项的权重参数，\(\nabla\)是计算梯度的负号。第一项是在RGB空间里的差异，这里第二项计算的是灰度梯度的绝对值差异。

View Propagation

除了spatial propagation（假设邻近的像素有相似的模型参数），有一个人还加了另一个假设，认为说对应点的邻近也有相似的模型参数。

Post-Processing

有三个步骤: 外点剔除，invalid pixels handling和weighted median filter。

Outlier Removal: 用forward-backward consistency check来移除被遮挡的点。
Invalid Pixels Handling: 在移除了遮挡的点以后，我们在这个像素的左右各找一个最近的点，然后根据邻近点的参数计算视差，然后选一个小的视差来作为它的模型参数。
Weighted Median Filter: 是最后作为refinement的一步，这个只会对在forward-backward consistency check失败的点来操作。

标签：begin,right,end,PatchMatch,详解,delta,aligned,left
来源： https://www.cnblogs.com/tweed/p/10893548.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9