聚类分析

【点宽专栏】国信证券——关于量化选股之聚类分析的探讨2021-05-17 11:54:44

前言本文基于《国信技术面量化选股系列：价格路径对收益的影响》（国信证券：20160909）和《基于k-means聚类的多因子特征检验》（国信证券：20161205）两份研报（研报见评论一附件）的思路进行实证和探讨。上述两份研报在下文中分别简称为《价格》和《聚类》。研报内容简述 1.《价格》一文探讨了
Q-matrix构建2021-05-16 16:05:15

Q-matrix构建 qmatrix是一个二元矩阵，显示了测试项目与潜在或潜在的属性或概念之间的关系(Birenbaum, et al.， 1993)。学生根据他们的测试答案和构造的q矩阵被分配知识状态。 Exp: 1992年，Hubal研究了专家推导出的q矩阵与学生数据之间的对应关系，发现这两者并不一定一致。1996年，Brewer
利用Word2Vec模型训练Word Embedding,并进行聚类分析2021-05-13 20:32:42

问题描述利用Word2Vec模型训练Word Embedding，根据小说中人物、武功、派别或者其他你感兴趣的特征，基于Word Embedding来进行聚类分析。实验原理 Word Embedding Harris 在 1954 年提出的分布假说（ distributional hypothesis）为这一设想提供了理论基础：上下文相似的词，其语义也
R语言中的SOM(自组织映射神经网络)对NBA球员聚类分析2021-05-12 13:54:24

原文链接：http://tecdat.cn/?p=19077 导入自组织映射（SOM）是一种工具，通过生成二维表示来可视化高维数据中的模式，在高维结构中显示有意义的模式。通过以下方式使用给定的数据（或数据样本）对SOM进行“训练”：定义了网格的大小。网格中的每个单元都在数据空间中分配了一个初始化向
Python数模笔记-Sklearn（2）样本聚类分析2021-05-10 15:02:56

1、分类的分类分类的分类？没错，分类也有不同的种类，而且在数学建模、机器学习领域常常被混淆。首先我们谈谈有监督学习（Supervised learning）和无监督学习（Unsupervised learning），是指有没有老师，有没有纪委吗？差不多。有老师，就有正确解法，就有标准答案；有纪委，就会树学习榜样，还有反面
聚类分析（一）：相似性度量2021-04-07 23:03:35

1.欧式距离衡量样本间相似性和差异性的方法就是计算两个样本之间的距离。对于距离，我们最熟悉的莫过于欧式距离，设\(a=(x_1,x_2,\cdots,x_n),b=(y_1,y_2,\cdots,y_n)\),那么\(a\)和\(b\)的欧式距离定义为： \[ d(a,b)=\sqrt{\sum_{i=1}^n(x_i-y_i)^2} \tag{1} \] 欧
聚类分析（二）：系统聚类法2021-04-07 23:02:15

目录一、类和类的特征1.均值（重心）2.样本离差阵和协方差阵3.直径，有多种定义二、类间距离1.最短距离法2. 最长距离法3.重心法二、系统聚类法1.流程2.示例一、类和类的特征设G为一个类，类中有m个元素，分别记为\(x^{(1)},x^{(2)},\cdots,x^{(m)}\), 常用到的特征有三个： 1.均值（重心
聚类分析算法对文本分类之分词和构建词袋模型2021-03-23 22:52:20

聚类分析是一种无监督机器学习（训练样本的标记信息是未知的）算法，它的目标是将相似的对象归到同一个簇中，将不相似的对象归到不同的簇中。如果要使用聚类分析算法对一堆文本分类，一般需要确定几个关键的问题：（1）怎样来判断两个对象的相似与否（2）怎样权衡比较
聚类分析—最大最小距离算法实现2021-03-18 22:01:06

聚类分析（最大最小距离算法实现）（第一次在这个平台分享知识，很多地方描述可能不恰当，多多包含。我将为大家分享一种关于聚类分析的最大最小距离算法实现方式。这个方式可能不是较佳的实现方式，仅供大家参考。）一、算法描述（1）：任意选取一个样本模式作为第一聚类中心Z1。（2）：选择离
聚类分析-层次聚类（Hierarchical Clustering）在生物信息学中的应用2021-02-04 10:58:29

聚类分析-层次聚类（Hierarchical Clustering）解析层次聚类层次聚类(Hierarchical Clustering)是聚类算法的一种，通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。层次聚类可以被分为两类：自上而下和自下而上，其中常用的自下而上算法（Bottom-up algorithms），也称为h
【数据分析师 Level 1 】18.聚类分析2021-01-26 18:03:44

【数据分析师 Level 1 】18.聚类分析层次聚类法层次聚类法通常分为自底向上和自顶向下。两种方法的运算原理其实是相同的。只不过实际计算是方向相反自底向上，又叫做合并法。这种方法是先将每个样本分别作为一个独立的类，然后通过距离计算，将距离相近的两个样本合并为一类，其他样
使用树状图做层次聚类分析2021-01-03 22:52:14

一、实验目的如果您以前从未使用过树状图，那么使用树状图是查看多维数据如何聚集在一起的好方法。在这本笔记本中，我将简单探索通过层次分析，借助树状图将其可视化。二、层次分析层次分析是聚类分析的一种，scipy有这方面的封装包。 linkage函数从字面意思是链接，层次分析就是不断链
使用树状图做层次聚类分析2021-01-03 22:51:58

一、实验目的如果您以前从未使用过树状图，那么使用树状图是查看多维数据如何聚集在一起的好方法。在这本笔记本中，我将简单探索通过层次分析，借助树状图将其可视化。二、层次分析层次分析是聚类分析的一种，scipy有这方面的封装包。 linkage函数从字面意思是链接，层次分析就是不断链
机器学习-聚类分析之DBSCAN2020-11-22 22:02:15

DBSCAN聚类 DBSCAN官方文档： https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html GitHub文档地址：https://github.com/gao7025/cluster_dbscan.git 基本概念 DBSCAN（Density-Based Spatial Clustering of Applications with Noise，具有噪声的基于
DBSCAN聚类分析2020-11-20 15:02:39

模型介绍 Kmeans聚类存在两个致命缺点，⼀是聚类效果容易受到异常样本点的影响；⼆是该算法⽆法准确地将⾮球形样本进⾏合理的聚类。基于密度的聚类则可以解决⾮球形簇的问题，“密度”可以理解为样本点的紧密程度，如果在指定的半径领域内，实际样本量超过给定的最⼩样本量阈值，则认为是
使用k-means及k-prototype对混合型数据集进行聚类分析2020-06-16 14:39:53

1. 分析目标本项目旨在使用聚类算法对110个城市进行分类与排序，以寻找客观真实的城市分层方法、支持业务运营与决策。 2. 数据集数据集来源于某互联网公司，特征值标签已做脱敏处理。数据集尺寸为111行×5列，第一行为标题行，其余110行为实例。第一列：城市名，将作为index不参与模型
文彤老师带你学SPSS--聚类分析与因子分析视频课程2020-05-26 18:58:28

文彤老师带你学SPSS--数值预测模型视频课程文彤老师带你学SPSS--中级篇文彤老师带你学SPSS--类别预测模型文彤老师带你学SPSS--聚类分析与因子分析视频课程 1-1 SPSS的python扩展插件安装.mp41-2 SPSS的R插件安装与配置.mp42-1 聚类分析的基本原理.mp42-2 聚类分析的方法分类.m
《多元统计分析》学习笔记之聚类分析2020-03-12 21:37:06

鄙人学习笔记 PS:对不起，原本想简单写写，总结一下，不想截那么多图，但写着写着觉得都挺想写的，就越写越多，越截越多。。。。文章目录聚类分析聚类分析的基本思想相似性度量类和类的特征系统聚类法K-均值聚类有序样本的聚类聚类分析聚类分析将个体或对象分类，使得同一类中的对象
[数据仓库与商业智能核心技术笔记--day1]聚类分析2020-03-02 09:39:02

无监督学习无监督学习中训练集是没有标签的。它会给定一些数据或者例子。无监督学习应用学习没有标签的聚类或者群组数据分组图像压缩（图像都是没有标签的数据）无监督学习分类：建模：对一些模型的概率或者参数的估计学习翻译词典学习语言语法学习社交图谱聚类原
【机器学习】k-means——航空用户聚类分析案例2019-12-29 20:02:26

1 import pandas as pd 2 import numpy as np 3 from sklearn.cluster import KMeans 4 import matplotlib.pyplot as plt 5 6 7 def stand_sca(data): 8 """ 9 标准差标准化 10 :param data:原数据 11 :return: 标准差之后的数据 12
【机器学习】机器学习入门08 - 聚类与聚类算法K-Means2019-12-23 12:03:26

时间过得很快，这篇文章已经是机器学习入门系列的最后一篇了。短短八周的时间里，虽然对机器学习并没有太多应用和熟悉的机会，但对于机器学习一些基本概念已经差不多有了一个提纲挈领的了解，如分类和回归，损失函数，以及一些简单的算法——kNN算法、决策树算法等。那么，今天就用聚类和K-Mea
Python使用RMF聚类分析客户价值2019-12-07 20:02:37

投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值，再针对不同群体提供不同的营销策略。用户分析指标根据美国数据库营销研究所Arthur Hughes的研究，客户数据库中有三个神奇的要素，这三个要素构成了数据分析最好的指标
聚类分析与判别分析的区别与联系2019-10-17 16:02:02

背景松哥常言统计分三级：“初级说一说，中级比一比，高级找关系”；今天所言之题，即为高级找关系之一法。聚类与判别，所谓天下合久必分、分久必合，合则聚类，分则判别。 1.聚类分析根据研究对象特征对研究对象进行分类的一种多元分析技术, 把性质相近的个体归为一类, 使得同一类中的个体都具
k-means聚类分析范例程序2019-09-13 18:02:33

K-Means聚类算法原理参考以下链接： https://www.cnblogs.com/pinard/p/6164214.html 2. 传统K-Means算法流程　　　　在上一节我们对K-Means的原理做了初步的探讨，这里我们对K-Means的算法做一个总结。　　　　首先我们看看K-Means算法的一些要点。　　　　1）对于K-Means算法，首先
8.最佳电影聚类分析2019-08-14 19:03:20

8.最佳电影聚类分析将使用电影简介作为原始数据，将总共 100 部流行电影进行聚类分析。IMDb 也称为互联网电影数据库（www.imdb.com），是一个在线的数据库，它提供有关电影、电子游戏和电视节目的大量详细信息。它聚集了电影和电视节目的评论以及简介，并有几个精选影片清单。原始数据地址 h

首页 < 1 2 3 > 尾页

ICode9

【点宽专栏】国信证券——关于量化选股之聚类分析的探讨2021-05-17 11:54:44

Q-matrix构建2021-05-16 16:05:15

利用Word2Vec模型训练Word Embedding,并进行聚类分析2021-05-13 20:32:42

R语言中的SOM(自组织映射神经网络)对NBA球员聚类分析2021-05-12 13:54:24

Python数模笔记-Sklearn（2）样本聚类分析2021-05-10 15:02:56

聚类分析（一）：相似性度量2021-04-07 23:03:35

聚类分析（二）：系统聚类法2021-04-07 23:02:15

聚类分析算法对文本分类之分词和构建词袋模型2021-03-23 22:52:20

聚类分析—最大最小距离算法实现2021-03-18 22:01:06

聚类分析-层次聚类（Hierarchical Clustering）在生物信息学中的应用2021-02-04 10:58:29

【数据分析师 Level 1 】18.聚类分析2021-01-26 18:03:44

使用树状图做层次聚类分析2021-01-03 22:52:14

使用树状图做层次聚类分析2021-01-03 22:51:58

机器学习-聚类分析之DBSCAN2020-11-22 22:02:15

DBSCAN聚类分析2020-11-20 15:02:39

使用k-means及k-prototype对混合型数据集进行聚类分析2020-06-16 14:39:53

文彤老师带你学SPSS--聚类分析与因子分析视频课程2020-05-26 18:58:28

《多元统计分析》学习笔记之聚类分析2020-03-12 21:37:06

[数据仓库与商业智能核心技术笔记--day1]聚类分析2020-03-02 09:39:02

【机器学习】k-means——航空用户聚类分析案例2019-12-29 20:02:26

【机器学习】机器学习入门08 - 聚类与聚类算法K-Means2019-12-23 12:03:26

Python使用RMF聚类分析客户价值2019-12-07 20:02:37

聚类分析与判别分析的区别与联系2019-10-17 16:02:02

k-means聚类分析范例程序2019-09-13 18:02:33

8.最佳电影聚类分析2019-08-14 19:03:20