ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

n维空间下两个随机向量的夹角分布

2021-10-23 21:01:30  阅读:194  来源: 互联网

标签:cos frac 维空间 varphi theta 2n 夹角 sin 向量


文章目录


昨天群里大家讨论到了 n n n维向量的一些反直觉现象,其中一个话题是“ 一般 n n n维空间下两个随机向量几乎都是垂直的”,这就跟二维/三维空间的认知有明显出入了。要从理论上认识这个结论,我们可以考虑两个随机向量的夹角 θ \theta θ分布,并算算它的均值方差。

概率密度

首先,我们来推导 θ \theta θ的概率密度函数。呃,其实也不用怎么推导,它是n维超球坐标的一个直接结论。

要求两个随机向量之间的夹角分布,很显然,由于各向同性,所以我们只需要考虑单位向量,而同样是因为各向同性,我们只需要固定其中一个向量,考虑另一个向量随机变化。不是一般性,考虑随机向量为
x = ( x 1 , x 2 , … , x n ) (1) x=(x_1,x_2,\dots,x_n)\tag{1} x=(x1​,x2​,…,xn​)(1)
而固定向量为
y = ( 1 , 0 , ⋯   , 0 ) (2) y=(1,0,\cdots,0)\tag{2} y=(1,0,⋯,0)(2)
将 x x x变换为超球坐标(关于 n n n维球的知识可以参考维基百科):
{ x 1 = cos ⁡ ( φ 1 ) x 2 = sin ⁡ ( φ 1 ) cos ⁡ ( φ 2 ) x 3 = sin ⁡ ( φ 1 ) sin ⁡ ( φ 2 ) cos ⁡ ( φ 2 )     ⋮ x n − 1 = sin ⁡ ( φ 1 ) … sin ⁡ ( φ n − 2 ) cos ⁡ ( φ n − 1 ) x n = sin ⁡ ( φ 1 ) … sin ⁡ ( φ n − 2 ) sin ⁡ ( φ n − 1 ) (3) \begin{cases} x_1=\cos(\varphi_1) \\[0.01ex] x_2=\sin(\varphi_1)\cos(\varphi_2) \\ x_3=\sin(\varphi_1)\sin(\varphi_2)\cos(\varphi_2) \\ \quad\:\:\,\vdots\\ x_{n-1}=\sin(\varphi_1)\dots\sin(\varphi_{n-2})\cos(\varphi_{n-1}) \\ x_{n}=\sin(\varphi_1)\dots\sin(\varphi_{n-2})\sin(\varphi_{n-1}) \\ \end{cases} \tag{3} ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​x1​=cos(φ1​)x2​=sin(φ1​)cos(φ2​)x3​=sin(φ1​)sin(φ2​)cos(φ2​)⋮xn−1​=sin(φ1​)…sin(φn−2​)cos(φn−1​)xn​=sin(φ1​)…sin(φn−2​)sin(φn−1​)​(3)
其中 φ n − 1 ∈ [ 0 , 2 π ) \varphi_{n−1}\in[0,2\pi) φn−1​∈[0,2π)而剩下的 φ \varphi φ范围是 [ 0 , π ] [0,π] [0,π]。此时, x x x和 y y y的夹角是:
arccos ⁡ ⟨ x , y ⟩ = arccos ⁡ cos ⁡ φ 1 = φ 1 (4) \arccos{\langle x,y\rangle}=\arccos{\cos{\varphi_1}}=\varphi_1\tag{4} arccos⟨x,y⟩=arccoscosφ1​=φ1​(4)
也就是说两者的夹角正好是 φ 1 \varphi_1 φ1​。那么, x x x和 y y y的夹角不超过 θ \theta θ的概率是:
P n ( φ 1 ≤ θ ) = n 维 超 球 面 上 φ 1 不 超 过 θ 的 积 分 n 维 超 球 面 上 的 全 积 分 (5) P_n(\varphi_1\leq\theta)=\cfrac{n维超球面上\varphi_1不超过\theta的积分}{n维超球面上的全积分}\tag{5} Pn​(φ1​≤θ)=n维超球面上的全积分n维超球面上φ1​不超过θ的积分​(5)
而 n n n维超球面上的积分微元 sin ⁡ n − 2 ( φ 1 ) sin ⁡ n − 3 ( φ 2 ) ⋯ sin ⁡ ( φ n − 2 ) d φ 1 d φ 2 ⋯ d φ n − 1 \sin^{n-2}{(\varphi_1)}\sin^{n-3}{(\varphi_2)}\cdots\sin{(\varphi_{n-2})}d{\varphi_1}d{\varphi_2}\cdots d{\varphi_{n-1}} sinn−2(φ1​)sinn−3(φ2​)⋯sin(φn−2​)dφ1​dφ2​⋯dφn−1​(可在维基百科找到),所以
P n ( φ 1 ≤ θ ) = ∫ 0 2 π ⋯ ∫ 0 π ∫ 0 θ sin ⁡ n − 2 ( φ 1 ) sin ⁡ n − 3 ( φ 2 ) ⋯ sin ⁡ ( φ n − 2 ) d φ 1 d φ 2 ⋯ d φ n − 1 ∫ 0 2 π ⋯ ∫ 0 π ∫ 0 π sin ⁡ n − 2 ( φ 1 ) sin ⁡ n − 3 ( φ 2 ) ⋯ sin ⁡ ( φ n − 2 ) d φ 1 d φ 2 ⋯ d φ n − 1 = ( n − 1 ) 维 单 位 超 球 的 表 面 积 × ∫ 0 θ sin ⁡ n − 2 φ 1 d φ 1 n 维 单 位 超 球 的 表 面 积 = Γ ( n 2 ) Γ ( n − 1 2 ) π ∫ 0 θ sin ⁡ n − 2 φ 1 d φ 1 ( n 维 球 面 的 表 面 积 S n = 2 π n 2 R n − 1 Γ ( n 2 ) ) (6) \begin{aligned} P_n(\varphi_1\leq\theta) & = \frac{\int_0^{2\pi}\cdots \int_0^{\pi}\int_0^{\theta}\sin^{n-2}(\varphi_1)\sin^{n-3}(\varphi_2)\cdots\sin(\varphi_{n-2})d\varphi_1d\varphi_2\cdots d\varphi_{n-1}}{\int_0^{2\pi}\cdots \int_0^{\pi}\int_0^{\pi}\sin^{n-2}(\varphi_1)\sin^{n-3}(\varphi_2)\cdots\sin(\varphi_{n-2})d\varphi_1d\varphi_2\cdots d\varphi_{n-1}} \\ & = \frac{(n−1)维单位超球的表面积\times\int_0^{\theta}\sin^{n-2}\varphi_1d\varphi_1}{n维单位超球的表面积} \\ & = \frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\int_{0}^{ \theta}\sin^{n-2}\varphi_1d\varphi_1 \quad(n维球面的表面积S_n=\frac{2\pi^{\frac{n}{2}}R^{n-1}}{\Gamma(\frac{n}{2})}) \end{aligned} \tag{6} Pn​(φ1​≤θ)​=∫02π​⋯∫0π​∫0π​sinn−2(φ1​)sinn−3(φ2​)⋯sin(φn−2​)dφ1​dφ2​⋯dφn−1​∫02π​⋯∫0π​∫0θ​sinn−2(φ1​)sinn−3(φ2​)⋯sin(φn−2​)dφ1​dφ2​⋯dφn−1​​=n维单位超球的表面积(n−1)维单位超球的表面积×∫0θ​sinn−2φ1​dφ1​​=Γ(2n−1​)π ​Γ(2n​)​∫0θ​sinn−2φ1​dφ1​(n维球面的表面积Sn​=Γ(2n​)2π2n​Rn−1​)​(6)
这表明 θ \theta θ的概率密度函数就是
p n ( θ ) = Γ ( n 2 ) Γ ( n − 1 2 ) π sin ⁡ n − 2 θ (7) p_n(\theta)=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\sin^{n-2}\theta\tag{7} pn​(θ)=Γ(2n−1​)π ​Γ(2n​)​sinn−2θ(7)
有时候我们想关心 η = cos ⁡ θ \eta=\cos{\theta} η=cosθ的分布,这时候需要应用第二积分换元法做一下概率密度的换元
p n ( θ ) = Γ ( n 2 ) Γ ( n − 1 2 ) π sin ⁡ n − 2 ( arccos ⁡ η ) ∣ d θ d η ∣ = Γ ( n 2 ) Γ ( n − 1 2 ) π ( 1 − η 2 ) n − 2 2 ( 1 − η 2 ) 1 2 = Γ ( n 2 ) Γ ( n − 1 2 ) π ( 1 − η 2 ) n − 3 2 (8) \begin{aligned} p_n(\theta) &=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\sin^{n-2}(\arccos{ \eta})\bigg\lvert \frac{d\theta}{d\eta}\bigg\rvert \\ &=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}(1-\eta^2)^{\frac{n-2}2}(1-\eta^2)^{\frac12}\\ &=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}(1-\eta^2)^{\frac{n-3}2} \end{aligned} \tag{8} pn​(θ)​=Γ(2n−1​)π ​Γ(2n​)​sinn−2(arccosη)∣∣∣∣​dηdθ​∣∣∣∣​=Γ(2n−1​)π ​Γ(2n​)​(1−η2)2n−2​(1−η2)21​=Γ(2n−1​)π ​Γ(2n​)​(1−η2)2n−3​​(8)

分布情况

(7)(8)我们可以看到,当 n = 2 n=2 n=2时,夹角 θ \theta θ的分布是一个均匀分布,而当 n = 3 n=3 n=3时,夹角余弦 cos ⁡ θ \cos\theta cosθ的分布是均匀分布。这两个结果说明在我们所能感知到的二维和三维空间中,角度的分布是比较均匀的。但是 n n n比较大的时候呢?比如 n = 20 , 50 n=20,50 n=20,50?

从 p n ( θ ) ∼ sin ⁡ − 2 n θ p_n(\theta)\sim \sin^{-2n}\theta pn​(θ)∼sin−2nθ的形式可以发现,当 n ≥ 3 n\geq3 n≥3时,最大概率是 θ = π 2 \theta=\cfrac\pi2 θ=2π​(即90度),另外 sin ⁡ n − 2 θ \sin^{n−2}\theta sinn−2θ也是关于 θ = π 2 θ=\cfrac{\pi}{2} θ=2π​对称的,所以它的均值也是 π 2 \cfrac\pi2 2π​。但这还不能充分描述分布情况,我们还需要考虑方差
V a r n ( θ ) = Γ ( n 2 ) Γ ( n − 1 2 ) π ∫ 0 π ( θ − π 2 ) 2 sin ⁡ n − 2 θ d θ (9) Var_n(\theta)=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\int_0^{\pi}(\theta-\frac\pi2)^2\sin^{n-2}\theta d\theta\tag{9} Varn​(θ)=Γ(2n−1​)π ​Γ(2n​)​∫0π​(θ−2π​)2sinn−2θdθ(9)
这个积分有解析解,但是形式很麻烦(喜欢看的话可以自己用Mathematica去算),我们来看部分数值解就好:

n方差
30.467401
100.110661
200.0525832
500.0204053
1000.0101007
2000.00502508
10000.001001

可以看到,随着 n n n的增大,方差越来越小,这意味着高维空间中任意两个向量的夹角几乎都集中在 π 2 \cfrac\pi2 2π​附近,换言之,高维空间中任意两个向量几乎都是垂直的。

当然,从图像也可以看出:
在这里插入图片描述
如果想要近似解析解的读者,可以考虑用拉普拉斯方法,用一个高斯分布去近似 p n ( θ ) p_n(\theta) pn​(θ):在 θ = π 2 \theta=\cfrac\pi2 θ=2π​处对 ln ⁡ sin ⁡ n − 2 θ \ln\sin^{n−2}\theta lnsinn−2θ进行展开
ln ⁡ sin ⁡ n − 2 θ = 2 − n 2 ( θ − π 2 ) 2 + O ( ( θ − π 2 ) 4 ) (10) \ln\sin^{n-2}\theta=\cfrac{2-n}{2}(\theta-\frac\pi2)^2+\mathscr{O}\big((\theta-\frac\pi2)^4\big) \tag{10} lnsinn−2θ=22−n​(θ−2π​)2+O((θ−2π​)4)(10)

sin ⁡ n − 2 θ ≈ exp ⁡ [ − n − 2 2 ( θ − π 2 ) 2 ] (11) \sin^{n-2}\theta\approx \exp[-\cfrac{n-2}{2}(\theta-\frac\pi2)^2] \tag{11} sinn−2θ≈exp[−2n−2​(θ−2π​)2](11)
从这个近似形式看,我们可以近似地认为 θ \theta θ服从均值为 π 2 \cfrac\pi2 2π​、方差为 1 n − 2 \cfrac1{n−2} n−21​的正态分布,即当 n n n较大时,方差近似为 1 n − 2 \cfrac1{n−2} n−21​,这也能看出 n n n越大,方差越小。

转载

本文转载自苏神的 n维空间下两个随机向量的夹角分布

标签:cos,frac,维空间,varphi,theta,2n,夹角,sin,向量
来源: https://blog.csdn.net/weixin_40548136/article/details/120923888

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有