ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

【Clemetine】基于判别分析的电信客户分类

2021-10-08 22:34:58  阅读:187  来源: 互联网

标签:客户 变量 判别函数 判别分析 Clemetine 实验 电信 判别


一、实验目的及要求、
实验目的:1、用判别分析对于电信客户完成分类。
2、通过本次实验加深对判别分析的理解,为以后熟练的使用判别分析打好基础。
实验要求:1、熟练地了解判别分析的原理。
2、深入分析数据从中挖掘获取更有价值的客户信息。
3、实验结论必须符合事实。

二、实验仪器设备
计算机,打印机。
三、实验内容
(一)实验背景
该示例主要关注于使用人口统计数据预测使用模式。目标字段客户类别具有四个可能的值,分别对应四个客户组,如下所示:
在这里插入图片描述
电信业是典型的数据密集型行业,长期积累的大量客户行为数据是运营商的重要资源和财富。然而,电信业务数据量庞大,业务系统众多,在电信业中引入数据挖掘技术,以帮助理解商业行为、识别电信模式、更好地利用资源和提高服务质量,具有重要的应用价值。假设某个电信提供商根据服务使用模式对它的客户群进行了分段,将这些客户分为了四个组。如果人口统计数据可用于预测组成员,则您可以为不同的准客户定制产品。
(二)实验的相关知识点
1、判别分析常见方法:(1)距离判别法(2)Bayes判别(3)Fisher判别(4)二次判别
2、作判别分析时,样品分为几类已经事先明确,需要做的主要工作是利用训练样本建立判别准则,对新样品所属的类别进行判定。
(三)实验原理
判别分析是一项根据输入字段值对记录进行分类的统计技术。它与线性回归相似,但它采用的是分类目标字段,而不是数字目标字段。根据观察和测量到的若干变量值判断研究对象如何分类。已知一定数量案例的一个分组变量和这些案例的一些特征变量,确定分组变量和特征变量之间的数据关系,建立判别函数,然后便可以利用这一数量关系对其他已知特征变量信息、但未知分组类型所属的案例进行判别分析。

四、实验实施步骤
(一)实验调试步骤
创建数据流:
在这里插入图片描述
类型节点设置,将gender类型更改为集合,multline,voice,pager,internet,called,callwait,forward,confer,ebill的类型改为标志,custcat的方向改为输出:在这里插入图片描述
添加过滤节点,过滤节点以选取相关字段(地区、年龄、婚姻状况、地址、收入、教育程度、行业、退休、性别、居住地和客户类别)。其他字段可以排除在此分析之外。42个已输入,31个已过滤,0个已重命名,11个已输出:
在这里插入图片描述
建立判别式模型,将方法改为逐步法,众数选择专家,先验概率选择所有组都相等,使用组内协方差矩阵,在“高级输出”对话框中,选择汇总表、区域图和步骤汇总在这里插入图片描述
在这里插入图片描述

表1:各组统计量的描述在这里插入图片描述
由表1可以看出,各组的均值差异较大,且各组的方差也有所差异。
表2:检验判别函数的显著水平在这里插入图片描述
表2中第一栏表示每步中判别函数被移去后的的数值。原假设为各组中所有判别函数的总体均值相等。如果显著,表示第二个判别函数也显著。本例中该判别函数对不同的两组有贡献。因为它的概率值远小于0.05。
表3:标准典型判别函数系数在这里插入图片描述
标准化判别函数系数可以看出预测变量在组成判别函数时的贡献率
本例中的判别函数时:Level of education(x1)Years with current employer(x2),Number of people in household(x3)。
由此得到典型判别函数:
Y1=0.958x1+0.066x2+0.261x3
Y1=0.136x1+1.026x2+0.239x3
Y1=-0.250x1-0.119x2+0.947x3
如下,当存在多个判别式函数时,用星号来标记每个变量与某典范函数的最大绝对相关度。在每个函数内部,这些标记星号 (*) 的变量将按相关度大小排序。
区域图有助于研究组与判别式函数之间的关系。结合结构矩阵的结果,区域图能够对预测变量和组之间的关系提供图形化的解释。

添加数据审核字段:
在这里插入图片描述
在这里插入图片描述
创建矩阵节点:在这里插入图片描述
在这里插入图片描述
(二)实验原始数据记录在这里插入图片描述
(三)实验调试过程中存在的问题、解决问题的思路及办法
可能出现的问题:数据类型设置不合理影响判别结果
解决办法:区分并明确集合、连续、标志等不同数据类型适用的数据

五、实验总结

利用结构矩阵和区域图,能够鉴别出那些最有助于分割客户群的变量。最后,分类结果显示模型对电子服务用户进行分类时表现欠佳。需要进一步研究来确定另一个预测变量,以便更好地对这些用户进行分类,但该模型是否可以完全能够满足我们的需求,取决于希望预测的内容。

标签:客户,变量,判别函数,判别分析,Clemetine,实验,电信,判别
来源: https://blog.csdn.net/qq_44762986/article/details/120661206

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有