统计分析 -- 聚类算法模型

2022-08-23 17:34:24 阅读：178 来源： 互联网

统计分析 -- 聚类算法模型

距离分析

聚类分析1.png

数据标准化

欧氏距离与量纲有关，因此，有时需要对数据进行预处理，
如标准化等。
在MATLAB中的命令是zscore，调用格式

Z = zscore(X)
输入X表示N行p列的原始观测矩阵，行为个体，列为指标。

输出Z为X的标准化矩阵:
Z = (X–ones(N,1)*mean(X)) ./(ones(N,1)* std(X))，

mean(X)为行向量，表示各个指标的均值估计，
std（X）表示指标的标准差估计。./表示对应元素相除，
ones(N,1)表示元素全为1的行向量，向量的长度为N。

K-means聚类

K-means聚类的算法流程：

指定需要划分的簇的个数K值（类的个数）
随机地选择K个数据对象作为初始的聚类中心（不一定要是我们的样本点）
计算其余的各个数据对象到这K个初始聚类中心的距离，把数据对象划归到距离它最近的那个中心所处在的簇类中；
调整新类并且重新计算出新类的中心；
循环步骤3和4，看中心是否收敛（不变）如果敛或达到迭代次数则停止循环；
结束。

K-means聚类特点

聚类分析2.png

K-means++聚类算法

聚类分析3.png

SPSS软件使用

聚类分析spss.png

code

%% 
% K-means 算法MATLAB实现
%-------------------------------------------------------------
%{
利用Matlab软件中的命令: kmeans,可以实现k-means聚类
对于要处理的数据 构造矩阵，矩阵X的每一行为每个个体的实际数据，每一列都是不同的指标
如果提供的数据不是按照规范模式，需要进行矩阵转置
x=y';     %矩阵x的行为个体，列为指标  
[a,b]=kmeans(x,2)　　%分为2类，输出:  a为聚类的结果，b为聚类重心, 每一行表示一个类的重心
使用kmeans进行处理 
%}
%% 数据准备和初始化
clc
clear
load kdata.mat


[a,b]=kmeans(x,3);  %%分为3类输出
x1=x(find(a==1),:)   %提取第1类里的样品
x2=x(find(a==2),:)   %提取第2类里的样品
x3=x(find(a==3),:)   %提取第3类里的样品
sd1=std(x1)
sd2=std(x2)　 
sd3=std(x3)　 % 分别计算第1类和第2类第3类的标准差
plot(x(a==1,1),x(a==1,2),'r.',x(a==2,1),x(a==2,2),'b.',x(a==3,1),x(a==3,2),'g.','MarkerSize',10)  %作出聚类的散点图
title('k-means聚类分析散点图');

title__k-means聚类分析散点图___.png

标签：std,统计分析,means,--,矩阵,kmeans,算法,聚类
来源： https://www.cnblogs.com/delehub/p/16617091.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

统计分析 -- 聚类算法模型

统计分析 -- 聚类算法模型

距离分析

数据标准化

K-means聚类

K-means聚类的算法流程：

K-means聚类特点

K-means++聚类算法

SPSS软件使用

code