ICode9

精准搜索请尝试: 精确搜索
  • sklearn——支持向量机2021-12-18 17:32:31

    "线性SVM" import numpy as np import matplotlib.pyplot as plt from sklearn import svm data = np.array([ [0.1, 0.7], [0.3, 0.6], [0.4, 0.1], [0.5, 0.4], [0.8, 0.04], [0.42, 0.6], [0.9, 0.4], [0.6, 0.5], [0.7, 0.2

  • 机器学习调用代码2021-12-15 13:04:15

    1 scikit-learn中数据集API介绍 获取数据集 sklearn.datasets 获取小规模数据集:sklearn.datasets.laad_*    (注意:该数据从本地获取) 获取大规模数据集:sklearn.datasets.fetch_*   (注意:该数据从网上下载) 1.1 sklearn大数据集 sklearn.datasets.fetch_20newsgroups(dat

  • sklearn中SVC和SVR的参数说明2021-12-13 14:35:36

    SVC 转载于:机器学习笔记(3)-sklearn支持向量机SVM–Spytensor 官方源码 sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None,

  • DataWhale sklearn学习笔记(一)2021-12-13 13:02:41

    线性回归 数据生成: 生成数据的思路是设定一个二维的函数(维度高了没办法在平面上画出来),根据这个函数生成一些离散的数据点,对每个数据点我们可以适当的加一点波动,也就是噪声,最后看看我们算法的拟合或者说回归效果。 import numpy as np import matplotlib.pyplot as plt def

  • 机器学习数据集划分总结2021-12-11 20:58:41

    机器学习数据集划分总结 参考文章 参考文章 【机器学习】机器学习中训练集、验证集和测试集的划分及交叉验证 机器学习库sklearn之怎么划分训练集和测试集 scikit-learn机器学习笔记——sklearn数据集,数据集划分,估计器

  • 基于sklearn框架下的knn分类器实现2021-12-06 22:30:44

    from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier import csv csvFile = open("D:\datacsv.csv", "r") reader = csv.reader(csvFile) iri_X=[] iri_y=[] for item in reader: # 忽略第一行

  • 【练习/sklearn库基础】导入sklearn库自带的乳腺癌数据集,分别使用GaussianNB、MultinomialNb、BernouliNB、SVM及KNN5种分类器进行分类预测2021-12-05 20:58:30

    声明: 1、 学生刚开始学习python,代码会有很多不严谨,也较为粗糙,单纯用于广大网友参考,希望能起到一定的帮助 2、 如果要转载,请标记出来源 3、本文纯粹用于技术练习,请勿用作非法途径 4、如果有问题请在评论区指出,虚心接受立马改正 做题途中所遇问题: 无 代码块: 在这里插入代码片 #

  • sklearn学习之:sklearn实现混淆矩阵2021-12-02 23:33:38

    文章目录 得到特征和标签训练自己的模型构造混淆矩阵加上合适的标签混淆矩阵传递出的信息 import pandas as pd import numpy as np import os from imblearn.over_sampling import SMOTE from sklearn.preprocessing import MinMaxScaler, StandardScaler from sklearn

  • 基于SVM算法预测澳大利亚是否降雨,绘制混淆矩阵及ROC曲线2021-12-02 17:02:29

    基于SVM算法预测澳大利亚是否降雨,绘制混淆矩阵及ROC曲线 代码控制台结果ROC曲线 代码 import matplotlib.pyplot as plt import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.preprocessing import LabelEncod

  • [机器学习]Kmeans聚类算法和性能指标2021-12-01 21:34:44

    文章目录 一、Kmeans算法及其优缺点1.简单介绍2.K-means的优点与缺点 二、性能指标1.选择K值手肘法轮廓系数CH指标sklearn提供的方法2.其他性能指标 资料整理 一、Kmeans算法及其优缺点 跳过算法原理 1.简单介绍 Kmeans算法是基于划分的聚类算法,其优化目标是同类的点

  • sklearn入门机器学习总结2021-12-01 12:00:53

    sklearn入门机器学习总结 1、sklearn中模型的使用流程1.1 机器学习模型1.2 预处理模型 2、KNN3、 线性回归4、SVM 1、sklearn中模型的使用流程 1.1 机器学习模型 1.2 预处理模型 2、KNN 1、思想:寻找距离待分类点最近的k个点进行投票 2、通常为分类算法,但sklearn中也有回

  • 信用卡评分模型(五)2021-11-29 17:34:22

    最近在探索xgboost 调参事情,现在存在着几点问题: 1.调参方式,网上有多种调参方式,但是基本都是一个一个参数去调,贪心算法,只能满足局部最优,但是我们的参数都是相互影响的,局部最优,组合起来并非是最优的。 2.我基本都是确定几个参数的固定形式,比如说树的深度=3,最小叶节点=样本*5%,scale_p

  • sklearn实现决策树2021-11-28 23:03:36

    导入包 from sklearn.datasets import load_iris, load_wine from sklearn import tree from sklearn,model_selection import train_test_split from sklearn.metrics import accuracy_score import pandas as pd import numpy as np import matplotlib.pyplot as plt 导入红酒

  • sklearn学习笔记---继上一篇的函数总结2021-11-25 18:31:43

    1、数据处理 (1)原始数据 y_train=['male','male','male','male','famale','famale','famale','famale','famale'] [out]: (2)LableBinarizer()的fit_transform()方法---将数据标签二值化 from sklea

  • 《Python数据科学手册》学习笔记及书评2021-11-17 13:31:30

    《Python数据科学手册》学习笔记 目录《Python数据科学手册》学习笔记写在前面1. 食谱数据库数据找不到的问题2.Seaborn马拉松可视化里时分秒转化为秒数的问题3. scikit-learn使用fetch_mldata无法下载MNIST数据集的问题4. GridSearchCV.grid_scores_和mean_validation_score报错5

  • sklearn实现k-means算法2021-11-15 18:06:49

    from sklearn.cluster import KMeans import numpy as np import matplotlib.pyplot as plt # 载入数据 data = np.genfromtxt("kmeans.txt", delimiter=" ") # 设置k值 k = 4 # 训练模型 model = KMeans(n_clusters=k) model.fit(data) # 分类中心点坐标 centers = m

  • sklearn常用函数整理2021-11-14 10:03:25

    乱序 from sklearn.model_selection import ShuffleSplit K折交叉验证 from sklearn.model_selection import cross_val_score cross_val = cross_val_score(KNN, iris.data, iris.target, cv=4,scoring='neg_mean_squared_error') 拆分数据集 from sklearn.model_selecti

  • sklearn SVM的应用-山鸢花分类python代码2021-11-13 11:06:04

    ''' 导入sklearn自带数据集:山鸢鸟数据集 数据集包括 150 条鸢尾花的四个特征 (萼片长/宽和花瓣长/宽) 和三个类别。 是从 csv 文件读取的,本工程从 Sklearn 里面的 datasets 模块中引入,代码如下: ''' from sklearn.datasets import load_iris iris = load_iris() import numpy

  • SVM深入理解2021-11-12 19:33:29

    目录 一、SVM算法二、基于SVM处理月亮数据集分类1. 基于线性核函数2. 基于多项式核3. 基于高斯核 三、重做例子代码四、参考文献 一、SVM算法 支持向量机(Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。它是将向量映射到

  • sklearn中 K近邻 简易使用2021-11-10 23:03:25

    K近邻算法是如果一个样本在特征空间的K个最相邻(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 他的原理就是求两点之间的距离,看距离谁是最近的,以此来区分我们要预测的这个数据是属于哪个分类。计算距离的公式为欧式距离公式。 from sklearn.nei

  • 基于sklearn机器学习2021-11-10 07:02:08

    目录1. 基本概念1.1. 算法分类1.2. 基本流程1.3. Pipeline 1. 基本概念 1.1. 算法分类 回归算法(药物反应,股票价格): 线性回归 逻辑回归 岭回归 分类算法(垃圾邮件检测,图像识别): k近邻(KNN) 贝叶斯 支持向量机(SVM) 决策树 随机森林 聚类,无监督学习算法(客户细分,分组实验结果): 聚类(k-

  • 基于逻辑回归的天猫优惠券使用情况预测2021-11-08 19:02:43

    文章目录 前言 一、数据预处理 二、变量选择 查看特征值与目标值之间的相关关系 ​选取特征值 进行one-hot编码后目标值与特征值的相关关系 ​查看类别型变量的所有类别及类别分布概率情况 对数值型变量绘制直方图 查看数据分布 将未进行独热编码的特征删除 三、建模(训练逻辑

  • sklearn代码23 6-线性回归岭回归 套索回归比较2021-11-08 10:33:36

    # LinearRegression,Ridge,Lasso import numpy as np from sklearn.linear_model import LinearRegression,Ridge,Lasso,RidgeCV,LassoCV import matplotlib.pyplot as plt %matplotlib inline # 50个样本 200个特征 # 无解,无数个解 X = np.random.randn(50,200) w = np

  • Untitled42021-11-05 21:02:44

    LDA及SVM算法sklearn学习记录 一.LDA算法1.导入所需库2.生成并划分数据集3.拟合并测试 二.SVM算法1.导入所需库2.生成并划分数据集3.svm算法通过不同内核实现拟合 一.LDA算法 1.导入所需库 from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LD

  • 机器学习Sklearn实战——手写线性回归2021-11-04 22:59:49

    手写线性回归 import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression X = np.linspace(2,10,20).reshape(-1,1) y = np.random.randint(1,6,size = 1)*X + np.random.randint(-5,5,size = 1) #噪声 加盐 y += np.random.randn

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有