标签:SVM Support 分类 决策 Machine Vector 超平面 最优 间隔
原创转载请注明出处:
SVM
SVM 作为有监督的学习模型,通常可以帮我们模式识别、分类以及回归分析。
- SVM 实际上适用于任何维度,在不同维度下, SVM 寻找类似二维直线的东西
- 在三维情形下, SVM 寻找一个 平面(plane)
- 在更高维度下, SVM 寻找一个 超平面(hyperplane) 这也正是支持向量得名的由来。在高维下,数据点是多维向量,间隔的边界也是超平面。支持向量位于间隔的边缘,“支撑”起间隔边界超平面。
- 可以被一条直线(更一般的,一个超平面)分割的数据称为线性可分(linearly separable)数据。超平面起到线性分类器(linear classifier)的作用。
概念引入
桌子上放了红色和蓝色两种球,用一根棍子将这两种颜色的球分开
可以很快想到解决方案,在红色和蓝色球之间画条直线
这次难度升级,桌子上依然放着红色、蓝色两种球,但是它们的摆放不规律。如何用一根棍子把这两种颜色分开
一根棍子是分不开的。除非把棍子弯曲
所以这里直线变成了曲线。如果在同一个平面上来看,红蓝两种颜色的球是很难分开的
猛拍一下桌子,这些小球瞬间腾空而起。在腾起的那一刹那,出现了一个水平切面,恰好把红、蓝两种颜色的球分开。
在这里,二维平面变成了三维空间。原来的曲线变成了一个平面。
分类间隔
实际上,我们的分类环境不是在二维平面中的,而是在多维空间中,这样直线 C 就变成了决策面 C。
在保证决策面不变,且分类不产生错误的情况下,我们可以移动决策面 C,直到产生两个极限的位置:如图中的决策面 A 和决策面 B。极限的位置是指,如果越过了这个位置,就会产生分类错误。这样的话,两个极限位置 A 和 B 之间的分界线 C 就是最优决策面。极限位置到最优决策面 C 之间的距离,就是“分类间隔”,英文叫做 margin。
如果我们转动这个最优决策面,你会发现可能存在多个最优决策面,它们都能把数据集正确分开,这些最优决策面的分类间隔可能是不同的,而那个拥有“最大间隔”(max margin)的决策面就是 SVM 要找的最优解。
Reference
https://time.geekbang.org/column/article/79975
标签:SVM,Support,分类,决策,Machine,Vector,超平面,最优,间隔 来源: https://www.cnblogs.com/agilestyle/p/12777788.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。