sklearn

sklearn 估计器(estimator)接口2021-11-03 12:31:08

sklearn 估计器(estimator)接口的简单介绍 Scikit-learn 努力在为所有方法建立统一的接口。给定名为model的 scikit-learn 估计器对象，可以使用以下方法（并非每个模型都有）： 1. 适用于所有估计器 model.fit()：拟合训练数据。对于监督学习应用，它接受两个参数：数据X和标签y（例如model.fit(
5 K-近邻算法实现鸢尾花种类预测2021-11-03 10:00:48

1 再识K-近邻算法API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') n_neighbors： int,可选（默认= 5），k_neighbors查询默认使用的邻居数 algorithm：{‘auto’，‘ball_tree’，‘kd_tree’，‘brute’} 快速k近邻搜索算法，默认参数为auto，可以理解为算法自己
sklearn 决策树使用2021-10-30 14:36:46

sklearn 中的决策树模块sklearn.tree 1 DecisionTreeClassifier class sklearn.tree.DecisionTreeClassifier (criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, rando
sklearn——转换器（Transformer）与预估器（estimator）2021-10-29 09:34:13

sklearn——转换器（Transformer）与预估器（estimator）文章目录 sklearn——转换器（Transformer）与预估器（estimator）转换器 Transformerfit 与 fit_transform 与 transform值得注意的是扒拉了下源码（可以不看这部分，看上面结论就够了）预估器 Estimator 在我之前接触的sklearn中，有
AI-机器学习-自学笔记（三）逻辑回归算法2021-10-27 01:35:11

逻辑回归（Logistic）是二分类任务的首选方法。它输出一个 0 到 1 之间的离散二值结果。简单来说，它的结果不是 1 就是 0。所以逻辑回归解决的是分类问题，不是回归问题。它就是通过拟合一个逻辑函数（Logit Function ）来预测一个事件发生的概率所以它预测的是一个概率值。它的输出值应该
算法-sklearn特征工程2021-10-26 19:58:33

from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer from sklearn.feature_extraction import DictVectorizer import jieba from sklearn.preprocessing import MinMaxScaler, StandardScaler from sklearn.impute import Simpl
Pycluster和sklearn：聚类分析库2021-10-25 16:33:38

使用Pycluster包进行聚类分析实例：https://blog.csdn.net/allenlu2008/article/details/46351733 机器学习框架之sklearn简介：https://zhuanlan.zhihu.com/p/33420189 聚类算法：DBSCAN
机器学习Sklearn实战——KNN算法2021-10-24 16:57:59

KNN鸢尾花分类 import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier from sklearn import datasets import numpy as np X,y = datasets.load_iris(True) #返回x、y X = X[:,:2] plt.scatter(X[:,0],X[:,1],c=y) knn = KNeighborsClassifi
scikit-learn笔记4 SKLearn模型选择与评估数据集划分2021-10-24 10:00:11

数据集划分方法 k折交叉验证 1、将全部训练集S分成k个不相交的子集，假设S中的训练样例个数为m，那么每一个子集有m/k个训练样例，，相应的子集称作{s1,s2,… ,sk}。 2、每次从分好的子集里面，拿出一个作为测试集，其它k-1个作为训练集 3、在k-1个训练集上训练出学习器模型。 4、把
sklearn的学习笔记--决策树(1)2021-10-23 16:33:01

1、决策树 1.1 分类树在sklearn中所有的机器模型算法都可以简化为三行代码。对应的代码如下所示： # 第一步骤：实例化一个决策树的模型，其中criterion代表决策树进行决策的准则，有gini和entropy两种方法 clf = tree.DecisionTreeClassifier(criterion="entropy") # 第二步骤：将
python利用sklearn对企业数据分析并预测2021-10-21 22:33:51

题目大概就是利用企业发票的信息分析出企业是否为异常企业，其中企业一共有3万多家，发票数大约有400多万条信息，发票明细信息有1000多万条信息因为之前已经采用一些分析的方法找到了321家异常企业，所以对发票表进行分析，利用sklearn建立决策树模型，并利用训练集对其进行训练，最后对测试数
DataWhale-树模型与集成学习-Task03-集成模式-2021102021-10-20 17:04:34

一、侧边栏练习题 1. 练习1 解答：由于是白噪声，所以最后一项推导如下：根据上面的推导，很容易看出第四个等号
python：决策树分类模型2021-10-16 17:33:01

决策树分类模型 iris_dtree.py import numpy as np from sklearn import datasets from sklearn.metrics import confusion_matrix,accuracy_score from sklearn.model_selection import train_test_split from sklearn import preprocessing # 加载鸢尾花数据集 iris_X,iris
sklearn数据集的导入及划分2021-10-16 16:00:07

鸢尾花数据集的导入及查看： ①鸢尾花数据集的导入： from sklearn.datasets import load_iris ②查看鸢尾花数据集： iris=load_iris()print("鸢尾花数据集：\n",iris)print("查看数据集描述：\n", iris.DESCR)print("查看特征值的名字：\n",iris.feature_names)print("查看特征数据：\n",ir
机器学习sklearn----初识KMeans2021-10-16 14:32:46

文章目录概述KMeans中几个概念KMeans工作过程KMeans使用示例导入相关模块生成原始数据通过KMeans分类KMeans常用属性分类结果展示 KMeans中的predict方法总结概述 KMeans是一种无监督学习的方法。他是一种分类算法。用于探索原始数据，将原始数据中相同属性的样本归为一
机器学习算法基础-sklearn数据集与机器学习组成2021-10-14 17:34:39

sklearn数据集与机器学习组成开发机器学习应用程序的步骤scikit-learn数据集sklearn.datasetsdatasets.load_*()datasets.fetch_*()datasets.make_*() 开发机器学习应用程序的步骤（1）收集数据我们可以使用很多方法收集样本护具，如：制作网络爬虫从网站上抽取数据、从RSS
房态预测2021-10-14 16:33:22

import os import time import pandas as pd import numpy as np import matplotlib.pyplot as plt # 模型处理模块 from sklearn.model_selection import train_test_split from sklearn.model_selection import GridSearchCV from sklearn.preprocessing import StandardScal
机器学习基础12021-10-13 13:32:24

决策树信息量越大信息熵越大信息和消除不确定性是相联系的决策树的划分依据是信息增益不确定性 sklearn选择基尼系数作为分类依据，该系数划分更加仔细 class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None) 决策树的结构，本
机器学习应用开发的典型步骤2021-10-12 20:33:19

目录 1.数据采集和标记 2.特征选择 3.数据清洗 4.模型选择 5.模型训练 6.模型测试 7.模型保存与加载 8.实例（手写数字识别） 1.数据采集和标记 2.特征选择 3.模型训练 4.模型测试 5.模型保存与加载 6.上述sk-learn模型以及模型参数 1.数据采集和标记先采集数据，再将数据进行标记
Golang调用Python32021-10-12 10:59:52

Golang调用Python请参考Golang调用Python-阿里云开发者社区 and https://github.com/DataDog/go-python3。 Python是时髦的机器学习御用开发语言，Golang是大红大紫的新时代后端开发语言。Python很适合让搞算法的写写模型，而Golang很适合提供API服务，两位同志都红的发紫，这里就介
使用sklearn对比各种机器学习方法：SVM，XGBoost...2021-10-11 13:02:47

sklearn常用机器学习算法总结（附python代码） - 简书 (jianshu.com)https://www.jianshu.com/p/641707e4e72c 注意：在使用XGBoost算法的时候，需要将X_train,y_train等Tensor类型变量数据类型置为nd array类型，而其他算法可以直接使用Tensor数据类型，即： features = features.numpy() l
机器学习——Week32021-10-10 18:34:33

文章目录一、逻辑回归1.前言引入2.简单介绍3.线性回归算法的选择4.多项式回归5.代码演示二、分类器项目案例1.简单介绍2.代码演示提示：以下是本篇文章正文内容，下面案例可供参考一、逻辑回归多元线性回归（Ridge、Lasso、ElasticNet）是做回归预测的逻辑回归（Logistic R
sklearn绘制回归树图形2021-10-07 17:32:08

1、依赖于matplotlib, sklearn.tree.plot_tree 2、第一步先把生成的分类树模型传入plot_tree(tree_model)中 3、第二步调用matplotlib的pyplot.show()显示图形 4、plot_tree()参数列表 def plot_tree(decision_tree, *, max_depth=None, feature_names=None, class_
机器学习数据集2021-10-07 14:01:43

机器学习数据：文件csv mysql：1、性能瓶颈，读取速度；2、格式不太符合机器学习要求 pandas：读取工具，基于numpy，读取速度较快，释放GIL锁实现真正的多线程可用数据集：kaggle、UCI、scikit-learn 数据集结构：特征值+目标值机器学习：重复值不需要进行去重特征工程：将原始数据转换为能更好的
鸢尾花数据集《sklearn入门》2021-10-07 09:02:31

引言：不得不说，鸢尾花数据集是入门的基础数据集，相当于是数据处理分析者必会的入门圣经开篇。 1.数据库的导入。 import numpy as np import matplotlib.pyplot as plt from sklearn import svm, datasets from sklearn.model_selection import train_test_split from sklearn.

首页 < 2 3 4 5 6 7 8 > 尾页

ICode9

sklearn 估计器(estimator)接口2021-11-03 12:31:08

5 K-近邻算法实现鸢尾花种类预测2021-11-03 10:00:48

sklearn 决策树使用2021-10-30 14:36:46

sklearn——转换器（Transformer）与预估器（estimator）2021-10-29 09:34:13

AI-机器学习-自学笔记（三）逻辑回归算法2021-10-27 01:35:11

算法-sklearn特征工程2021-10-26 19:58:33

Pycluster和sklearn：聚类分析库2021-10-25 16:33:38

机器学习Sklearn实战——KNN算法2021-10-24 16:57:59

scikit-learn笔记4 SKLearn模型选择与评估 数据集划分2021-10-24 10:00:11

sklearn的学习笔记--决策树(1)2021-10-23 16:33:01

python利用sklearn对企业数据分析并预测2021-10-21 22:33:51

DataWhale-树模型与集成学习-Task03-集成模式-2021102021-10-20 17:04:34

python：决策树 分类模型2021-10-16 17:33:01

sklearn数据集的导入及划分2021-10-16 16:00:07

机器学习sklearn----初识KMeans2021-10-16 14:32:46

机器学习算法基础-sklearn数据集与机器学习组成2021-10-14 17:34:39

房态预测2021-10-14 16:33:22

机器学习基础12021-10-13 13:32:24

机器学习应用开发的典型步骤2021-10-12 20:33:19

Golang调用Python32021-10-12 10:59:52

使用sklearn对比各种机器学习方法：SVM，XGBoost...2021-10-11 13:02:47

机器学习——Week32021-10-10 18:34:33

sklearn绘制回归树图形2021-10-07 17:32:08

机器学习数据集2021-10-07 14:01:43

鸢尾花数据集《sklearn入门》2021-10-07 09:02:31

scikit-learn笔记4 SKLearn模型选择与评估数据集划分2021-10-24 10:00:11

python：决策树分类模型2021-10-16 17:33:01