贝叶斯模型
贝叶斯模型
通过已知类别的训练数据,计算样本的先验概率,然后利用贝叶斯概率公式测算未知类别别样本属于某个类别的后验概率,最终以最大后验概率对应的类别作为样本的预测位
高斯贝叶斯分类器
适用自变量为连续的数值类型的情况
多项式贝叶斯分类器
适用于自变量为离散型类型的情况(非数字类型)
伯努利贝叶斯分类器
适用于自变量为二元值的情况
SVM模型
超平面
将样本点的划分为不同的类别(三种形式:点、线和面)
超平面
1.随机选择一条线
2.分别计算两边到线距离最短的点,取最小举例点的距离
3.以该距离左右两边做分离带
4.依次直线上述步骤得出多个分隔带,最宽的隔离带越好
线性可分和非线性可分
线性可分:简单的理解为就是一条直线划分类别
非线性可分:一条直线无法直接划分 需要升一个维度再做划分
''' 核函数:高斯核函数>>>:支持无穷维数据 '''
补充知识
有监督学习于无监督学习
有监督:有明确需要研究的因变量Y
无监督:没有明确需要研究的因变量Y
Kmeans聚类
属于无监督学习
K值的求解(K表示分成几类)
1.拐点法
计算不同K值下类别中离差平凡和(斜率变化)
2.轮廓系数法
计算轮廓系数(看大小、越大越好)
Kmeans聚类(K均值聚类)的缺点:
- 聚类效果容易受到异常样本带你的印象
- 无法准确的将非球形进行合理的聚类
# 可以采用DBASAN密度聚类解决上诉问题
DBSCAN聚类
核心概念
图文结合讲
异常点
GBDT模型
标签:模型,样本,贝叶斯,分类器,聚类,类别 来源: https://www.cnblogs.com/20wod/p/15458079.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。