ICode9

精准搜索请尝试: 精确搜索
  • python数据分析之分类模型与回归模型-第七次笔记2021-07-13 20:31:13

    python数据分析之分类模型与回归模型-第七次笔记 1.分类模型 – *1.1KNN 算法 – *1.2朴素贝叶斯 算法 – *1.3支持向量机SVM 算法 – *1.4集成方法—随机森林算法 – *1.5集成方法—Adaboost 算法 – *1.6决策树 2.回归模型 – *2.1线性回归 – *2.2岭回归 – *2.3Lasso回

  • 泰坦尼克号生存预测-----基于决策树模型(机器学习- sklearn)2021-07-13 13:01:58

    """主要是存储本人的笔记为主,但是希望和各位进行交流"" 简介:该代码主要会用 train_test_split 及 cross_val_score验证模型的有效度。 此外,还会用GridSearchCV找出模型最优的参数。 step 1:对数据进行处理,比如填补或者删除缺失值。此外, 决策树无法处理文字,所以,我们需要把性别(se

  • 机器学习Sklearn系列:(二)逻辑回归2021-07-12 23:01:31

    逻辑回归可以用来做分类任务,通俗理解,就是讲输入映射到到概率区间0-1,从而实现分类功能,逻辑回归的公式推导如下: 假设函数为: \[\hat{y} = h_\theta(x,g(\theta^Tx))=\frac{1}{1+e^{-\theta^Tx}} \]其中,\(g(z) = \frac{1}{1+e^{-z}}\) 在这种情况下,损失函数可以通过最大似然估计推导出

  • 如何使用机器学习在一个非常小的数据集上做出预测2021-07-11 09:05:00

    朴素贝叶斯是一系列简单的概率分类器,它基于应用贝叶斯定理,在特征之间具有强或朴素的独立假设。它们是最简单的贝叶斯模型之一,但通过核密度估计,它们可以达到更高的精度水平。 朴素贝叶斯基于贝叶斯定理,该定理根据可能与事件相关的条件的先验知识来描述事件的概率。这方面的一

  • 天池-车辆产品聚类分析-积累笔记2021-07-09 22:30:52

    文章目录 1 LabelEncoder方法`sklearn.preprocess.LabelEncoder``pd.get_dummies(data)` 2 特征之间关联性分析`sns.pairplot(data=data)``train_corr=x_train.corr()` 3 聚类评估方法`(kmeans.inertia_)`簇内误差平方和轮廓系数 `sklearn.metrics.silhouette_score` 4 层

  • 人工智能基础(十六)模型的保存与加载2021-07-09 12:05:16

    模型的保存与加载 from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, RidgeCV from sklearn.m

  • 支持向量机(乳腺癌案例)2021-07-08 10:33:51

    # z支持向量机 from sklearn.svm import SVC import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from sklearn.prepro

  • 机器学习从入门到死亡(下)2021-07-07 21:35:03

    机器学习 六、经典机器学习方法1. 支持向量机(Support Vector Machines)1.1 支持向量机的简介和由来1.2 支持向量机的数学原理1.3 支持向量机的优缺点1.4 支持向量机在python中的分类应用1.5 支持向量机在python中的回归应用 2. 隐式马尔可夫链(Hidden Markov Model)2.1 序列数

  • 机器学习之逻辑回归实践2021-07-05 14:03:43

    购买意向预测与其他预测 今天使用逻辑回归做了个购买意向的预测。 数据集如下 4个特征,这里我们不使用ID和性别,只使用年龄和收入两个特征): 代码如下 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScale

  • 2021-07-042021-07-04 15:00:46

    超参随机搜索原理及核心实现 文章目录 超参随机搜索原理及核心实现是什么怎么用使用步骤代码示例 什么原理为什么有效源码解析 参考资料 是什么 随机搜索是一种常用的机器学习超参优化的方法。随机搜索就是在给定的参数范围之类进行(伪)随机抽样产生参数值,然后对多个抽样

  • 机器学习sklearn(85):算法实例(42)分类(21)朴素贝叶斯(四) 不同分布下的贝叶斯(三) 多项式朴素贝叶斯以及其变化2021-07-03 21:35:31

    1 多项式朴素贝叶斯MultinomialNB               1. 导入需要的模块和库 from sklearn.preprocessing import MinMaxScaler from sklearn.naive_bayes import MultinomialNB from sklearn.model_selection import train_test_split from sklearn.datasets import make_

  • 机器学习sklearn(82):算法实例(39)分类(18)朴素贝叶斯(一) 概述2021-07-03 20:02:04

    1 真正的概率分类器     2 朴素贝叶斯是如何工作的       2.1 瓢虫冬眠:理解P(Y|X)                                      2.2 贝叶斯的性质与最大后验估计         2.3 汉堡称重:连续型变量的概率估计                       3 skl

  • 机器学习sklearn(79):算法实例(三十六)回归(八)线性回归大家族(六)非线性问题:多项式回归(一)2021-07-03 09:33:55

    1 重塑我们心中的“线性”概念 1.1 变量之间的线性关系     1.2 数据的线性与非线性         1.3 线性模型与非线性模型     1. 导入所需要的库  import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sk

  • 机器学习sklearn(78):算法实例(三十五)回归(七)线性回归大家族(五)多重共线性:岭回归与Lasso(二)Lasso2021-07-02 23:03:09

    3 Lasso 3.1 Lasso与多重共线性             3.2 Lasso的核心作用:特征选择     import numpy as np import pandas as pd from sklearn.linear_model import Ridge, LinearRegression, Lasso from sklearn.model_selection import train_test_split as TTS from sklear

  • 机器学习sklearn(75):算法实例(三十二)回归(四)线性回归大家族(二)多元线性回归LinearRegression2021-07-02 21:03:53

    1 多元线性回归的基本原理           2 最小二乘法求解多元线性回归的参数 https://en.wikipedia.org/wiki/Matrix_calculus         3 linear_model.LinearRegression class sklearn.linear_model.LinearRegression (fifit_intercept=True, normalize=False, cop

  • 机器学习sklearn(74):算法实例(三十一)回归(三)线性回归大家族(一)概述2021-07-02 20:31:40

    1 线性回归大家族   2 sklearn中的线性回归                            

  • sklearn模型使用贝叶斯优化调参2021-07-02 16:04:12

    文章目录 1. 构造数据源2. 构造黑盒目标函数3. 确定取值空间4. 构造贝叶斯优化器5. 运行,导出结果与最优参数全部代码 贝叶斯优化github地址:https://github.com/fmfn/BayesianOptimization paper地址:http://papers.nips.cc/paper/4522-practical-bayesian%20-optimizatio

  • 机器学习sklearn(65):算法实例(二十二)聚类(五)KMeans (三) 总结2021-06-29 20:31:55

    1 KMeans参数列表     2 KMeans属性列表 3 KMeans接口列表         

  • 机器学习sklearn(60):算法实例(十七)分类(十)逻辑回归(五)附录2021-06-27 19:02:58

    1 逻辑回归的参数列表             2 逻辑回归的属性列表 3 逻辑回归的接口列表   

  • Win10下 python3.9安装sklearn2021-06-27 10:29:28

    首先,安装sklearn之前,需要安装以下包,注意按顺序安装: Numpy库Scipy库matplotlib库sklearn库 具体的包可以从这个网址取得:Python Extension Packages for Windows - Christoph Gohlke (uci.edu); 一、安装Numpy库 下载python39 64位的包:numpy-1.21.0+mkl-cp39-cp39-win_amd64.whl Wi

  • Sklearn库,一个神奇的瑞士军刀02021-06-26 20:06:28

    pip install scikit-learn Qhttps://blog.csdn.net/qq_39355550/article/details/82792460 0.机器学习与sklearn的知识图谱 1.逻辑回归 (1)最小二乘法 最小二乘法拟合一次函数(身高)为例。 import numpy as np import numpy as np import scipy as sp import matplotlib.pyplot as

  • 三年我才想明白,最能影响机器学习算法效果的是特征工程2021-06-26 15:31:51

    文章目录 特征工程什么是特征工程 数据预处理缺失值的处理删除法填补法Pandas填充Sklearn填充 数据归一化什么是归一化归一化原理为什么要用归一化什么算法需要进行归一化sklearn库归一化处理归一化存在的问题 数据标准化什么是标准化标准化原理为什么要用标准化sklearn库

  • python+sklearn实现均值漂移算法2021-06-22 14:59:58

    本文所用文件的链接 链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ 提取码:p57s 均值漂移算法   首先嘉定样本空间中的每个聚类均服从某种已知的概率分布规则, 然后用不同的概率密度函数拟合样本中的统计直方图, 不断移动密度函数的中心位置, 直到获得最佳拟合效果

  • DW-动手学数分05(数据建模及模型评估)2021-06-21 21:02:07

    目录 1 建模1.1 数据分析流程1.2 模型搭建准备工作1.2.1 导入库1.2.2 载入数据 1.3 模型搭建1.3.1 选择模型1.3.2 切割训练集和测试集1.3.3 模型创建1.3.4 输出模型预测结果 2 评估2.1 评估的准备工作2.2 模型评估2.2.1 交叉验证2.2.2 混淆矩阵2.2.3 ROC曲线 1 建模 1

  • 机器学习sklearn(二十一): 模型评估(一)交叉验证:评估估算器的表现(一)简介2021-06-19 21:34:59

    学习预测函数的参数,并在相同数据集上进行测试是一种错误的做法: 一个仅给出测试用例标签的模型将会获得极高的分数,但对于尚未出现过的数据它则无法预测出任何有用的信息。 这种情况称为 overfitting(过拟合). 为了避免这种情况,在进行(监督)机器学习实验时,通常取出部分可利用数据作为

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有