ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

NLP学习笔记-支持向量机

2022-08-17 15:04:48  阅读:168  来源: 互联网

标签:NLP 样本 支持 笔记 https 线性 向量 超平面


 

  支持向量机(Support Vector Machine, SVM)算法也是一种处理二分类问题的线性分类器,是一种监督学习的方法,是用来解决样本求解的最大边距超平面的问题,是边界决策中常见的分类方法。

 

最大间隔

  SVM听上去高深且难以理解,不妨举个来了解SVM的思想。小学时,同桌之间经常会用铅笔在课桌的中间画一条先,俗称“三八线”,于是就通过这条线将课桌分成了两部分,每一部分属于不同的人,而画这条线时最大的特点就是公平,即两个人分配到的面积是均等的。“三八线”可以看作是二维空间中支持向量机的解释,SVM正是在特征空间中寻找一个间隔最大的超平面将两种样本分隔开来。

               

  正如在上面这张图中,想要把这两类样本区分开,有很多的线满足要求,即有很多的超平面,然而需要找到一个最优的超平面能最贴切的将两类样本分隔开,这就是支持向量机所求的超平面。

               

  如上面这张图中红线代表的超平面,其满足的要求是使两组样本中距离超平面最近的样本的距离最大。在上图中d1和d2是距离超平面最近的样本的,我们要想找到尽可能知识两类样本分隔开的最优超平面,就要让这两个最小距离的和最大,即最大间隔。

 

支持向量

  介绍完了支持向量机的作用,那么到底什么是支持向量呢?其定义为距离分类的超平面距离最近的样本点即为支持向量。

                 

  如上图,中间的红线为分类的超平面,旁边两条虚线上的三个橙色点和两个蓝色点即为支持向量。这些支持向量的样本点非常重要,以至于这些点之外的点都可以忽略不计。支持向量机正是通过这些点来计算出超平面,实现对样本数据一分为二的。

 

间隔计算

  支持向量机要找到使间隔最大的超平面,就是要计算该平面的函数表达式,在高维空间中,超平面的表达式可以写成wTx+b=0,其中w为超平面的法向量,决定超平面的方向。b为他的截距,决定超平面的位置。

       

  假设已经任意找到了一个可以分隔的超平面,为了方便计算,如图所示将两侧的数据的值取1或-1,通常称做是正负样本数据。假设正样本a中有点x1,负样本b中有点x2,计算原点到这两点的向量并求差,就可以计算出间隔d的长度如下。

               

  于是发现将问题从求最大的间距,简化为了求||w||的最小值,即求解w的二阶范数的最小值。

 

线性分类

      

  通过以上对支持向量机的描述不难发现,SVM解决的样本数据要求为线性可分的,如上图中在二维和三维空间中的两组数据,可以用一条分割线或分割超平面将样本分隔开。

      

  但实际情况往往并非如此,正如上面的左图,两组样本交叉混杂在一起,无法用一个超平面分隔开,那么必然也无法用支持向量机来解决此类问题。所以如何对样本进行一定的预处理,使之变为线性可分的呢?我们不妨将目光放的更开阔些,即将之前的样本,根据其某些特征,向更高的维度进行映射,将原先线性不可分的样本映射成支持向量机可以解决的线性可分的数据。

 

核函数

  核函数(Kernel Function)正是用来将线性不可分的样本映射成线性可分的,其作用为计算两个向量在隐式映射后空间的内积,通过对特征向量做内积,然后使用函数K转换。

     

  在实际应用中,通常会根据样本的特点决定使用哪种核函数,上图中的映射正是使用高斯核函数完成的。使用核函数可以很好的转化线性不可分的问题。在实际使用中,如果样本数据量过大,支持向量的个数会很多,在训练过程中可能耗时较长,速度较慢。

 

回归型支持向量机

  回归型支持向量机(Suport Vector Machine for Regression,SVR)是利用支持向量机来解决回归拟合方面的问题,其思想是寻找一个最优的超平面使得所有的样本距离该最优超平面的距离最小,达到回归的效果。

     

  如上图所示,SVR与传统回归方法不同的是,其可以容忍f(x)与y之间有 ϵ的偏差,即以超平面为中心,样本距离小于 ϵ 的均为预测正确。

                 

    

 

  求解方法是在SVM的基础上加一个不敏感损失函数,即用不敏感损害函数用来描述上图中可以接受的ϵ内的偏差。确定为SVR回归后,其后的推到过程与支持向量机相同。

 

参考文献:

  https://blog.csdn.net/qq_42363032/article/details/107210881

  https://blog.csdn.net/qq_42363032/article/details/121019360

  https://blog.csdn.net/weixin_46161549/article/details/118555035

  https://baijiahao.baidu.com/s?id=1671535528667762528&wfr=spider&for=pc&qq-pf-to=pcqq.c2c

  https://blog.csdn.net/weixin_44657251/article/details/123882018

  https://www.mstx.cn/support-vector-machine/distance-from-point-to-plane.html

  https://zhuanlan.zhihu.com/p/30596284

 

标签:NLP,样本,支持,笔记,https,线性,向量,超平面
来源: https://www.cnblogs.com/wisdom-jie/p/16595198.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有