标签:day12 类间 投影 判别分析 距离 类内 线性 图片
线性判别分析
线性判别分析(Linear Discriminant Analysis,LDA)是一种监督学习算法,常常用于数据降维。
LDA是为分类问题服务的,因此需要先找到一个投影方向图片,使得投影后的样本尽可能按照原始类别分开。
简单的二分类问题,存在两个类别的样本,图片。两个类别的均值分别为图片
我们则希望投影之后,尽可能把这两个数据集分开,即在投影上距离越大越好。距离表示:
图片
其中图片表示两类的中心在图片方向上的投影向量,图片。需要优化以下问题
图片
我们需要找到尽可能大的类间距离投影方式,但是又同时使得类内方差最小。
图片
因此有
图片
其中图片为单位向量,图片分别表示两类投影后的方差
图片
图片
然后定义类间散度矩阵图片,类内散度矩阵图片
化简得
图片
图片
图片
一般二分类,图片和图片是两个数,令图片
图片
图片
从最大化类间距离和最小化类内距离出发,拥有较好对噪声的鲁棒性,模型也很简单。
标签:day12,类间,投影,判别分析,距离,类内,线性,图片 来源: https://blog.51cto.com/15069488/2578596
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。