统计学习方法读书笔记（九）-EM算法及其推广

2021-01-20 13:31:46 阅读：251 来源： 互联网

EM算法用于含有隐变量（hidden variable）的概率模型参数的极大似然估计，或极大后验概率估计。EM算法的每次迭代由两步组成：E步，求期望（expectation) ; M步，求极大（maximization）。

一、EM算法的引入

三硬币模型

假设有三枚硬币，分别记为A、B、C。这些硬币正面的概率分别为 π , p , q π,p,q π,p,q，进行如下的抛硬币实验：先掷硬币A，根据其结果选出硬币B或者硬币C，正面选硬币B，反面选硬币C，然后掷选出的硬币，掷硬币的记录，出现正面记作1，出现反面记作0，独立地重复n次实验（这里n=10），然后观测结果如下：

1，1，0，1，0，0，1，0，1，1

假设只能观测到掷硬币的结果，不能观测掷硬币的过程，问如何估计三硬币正面出现的概率，即三硬币模型的参数 π , p , q π,p,q π,p,q。

y j y_j yj为第 j j j次实验的观测数据
Z Z Z为隐变量，表示掷硬币A出现的结果，该变量只有两个取值（0/1）
z j z_j zj为第 j j j次实验时，掷硬币A出现的结果，其中 z j = 1 z_j=1 zj=1表示正面
θ \theta θ为参数集合 π , p , q π,p,q π,p,q
θ ( i ) \theta^{(i)} θ(i)为第 i i i次迭代时， π , p , q π,p,q π,p,q的估计值

对于后验概率 P ( z j ∣ y j , θ ( i ) ) P(z_j | y_j, \theta^{(i)}) P(zj∣yj,θ(i))，可以写成 μ j ( i + 1 ) = P ( y j , z j = 1 ∣ θ ( i ) ) P ( y j ∣ θ ( i ) ) \mu_j^{(i+1)} = \frac{P(y_j, z_j=1 | \theta^{(i)})}{P(y_j | \theta^{(i)})} μj(i+1)=P(yj∣θ(i))P(yj,zj=1∣θ(i))，这样子思考，给定条件 θ ( i ) \theta^{(i)} θ(i)， z j = 1 z_j=1 zj=1的概率为 π ( i ) \pi^{(i)} π(i)，留意 θ ( i ) \theta^{(i)} θ(i)已发生，那么 P ( z j = 1 ∣ θ ) P(z_j=1|\theta) P(zj=1∣θ)就等于 π ( i ) \pi^{(i)} π(i)。

标签：EM,yj,zj,硬币,正面,读书笔记,算法,theta
来源： https://blog.csdn.net/qq_41485273/article/details/112862578

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

统计学习方法读书笔记（九）-EM算法及其推广

一、EM算法的引入

三硬币模型