ICode9

精准搜索请尝试: 精确搜索
  • sklearn.datasets2022-01-28 12:31:50

        sklearn.datasets.load_iris() 参数: return_X_y ;  bool, default=False   :If True, returns (data, target) instead of a Bunch object. See below for more information about the data and target object. as_frame ;  bool, default=False  :If True, the

  • ImportError: /usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.22‘2022-01-21 23:30:40

    报错原因:https://blog.csdn.net/u011961856/article/details/79644342 (根据我的报错,说是import sklearn中有问题) 解决方法: 1、安装相应版本libstdc 2、更换报错的import包的代码位置(例如报错显示是import sklearn有问题,将该行代码放第一行试试)

  • Datawhale组队学习——数据分析Task05 模型建立与评估2022-01-20 18:01:31

    以下学习笔记来自Datawhale组队学习的数据分析课程第二章,此次数据分析课程主要是完成kaggle上泰坦尼克的任务,实战数据分析全流程。 链接:https://github.com/datawhalechina/hands-on-data-analysis 模型建立与评估 数据导入 导入基本库和plt配置 import pandas as pd import

  • SKLEARN-2 回归树2022-01-18 20:32:19

    回归树目录 1.重要的参数、属性、接口criterion 2. 交叉验证3.一维回归的图像绘制1.导入库2.噪声曲线![在这里插入图片描述](https://img-blog.csdnimg.cn/cf32a2eb4fd8448c8fb6b2a3071f701a.png)![在这里插入图片描述](https://img-blog.csdnimg.cn/e9d0370191eb4f74a8855

  • 随机森林-sklearn2022-01-16 11:31:16

    随机森林:就是字面意思,在一个地方,有多个树一起组成的森林。也就是由多棵决策树来组成对于问题的判断。 树林的形成: 对于每一个树木,他的训练集和特征要不一样才可以发挥数的特性,否则就是将一颗决策树多次复制。因此,对于训练集的选择,使用bootstrap的抽样方法,就是不放回随机抽样。特

  • 机器学习-朴素贝叶斯算法2022-01-15 14:59:02

    联合概率:包括多个条件,且所有的条件都成立的概率:P(a, b) 条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率 P(a | b) 相互独立:如果P(A , B) = P(A) * P(B)那么称事件A和事件B相互独立 贝叶斯公式: P(C | W) = P(W | C) * P(C) / P(W) 下面拿一个实例来举例子:(A,B,C分别

  • 机器学习神器Scikit-Learn保姆级入门教程2022-01-12 23:31:42

    公众号:尤而小屋作者:Peter编辑:Peter 大家好,我是Peter~ Scikit-learn是一个非常知名的Python机器学习库,它广泛地用于统计分析和机器学习建模等数据科学领域。 建模无敌:用户通过scikit-learn能够实现各种监督和非监督学习的模型功能多样:同时使用sklearn还能够进行数据的预处理

  • 机器学习——集成学习2022-01-07 09:59:43

    一、介绍 集成学习: 三个臭皮匠顶个诸葛亮。相当于是多个相同或者不同的模型使用相同或者不同的训练集进行“并行或递进”式的进行模型集成,达到“1+1>2”的效果。 多模型投票: n个分类器进行结果预测,预测的结果少数服从多数然后输出最后结果。bagging: 对于每个分类器使用的训练

  • sklearn机器学习(八)2022-01-05 23:30:48

    Task08 本次学习参照Datawhale开源学习:https://github.com/datawhalechina/machine-learning-toy-code/tree/main/ml-with-sklearn 内容安排如下,主要是一些代码实现和部分原理介绍。 8. 可视化 机器学习可视化有助于我们分析模型效果、理解模型原理、对比模型优劣。本章将介

  • 基于机器学习和TFIDF的情感分类算法,详解自然语言处理2022-01-05 11:00:00

    摘要:这篇文章将详细讲解自然语言处理过程,基于机器学习和TFIDF的情感分类算法,并进行了各种分类算法(SVM、RF、LR、Boosting)对比 本文分享自华为云社区《[Python人工智能] 二十三.基于机器学习和TFIDF的情感分类(含详细的NLP数据清洗)》,作者: eastmount。 在数据分析和数据挖掘中,通

  • Adaboost算法的sklearn实践2022-01-02 22:00:31

    集成学习 一、理论部分 1. 集成学习 bagging 通过降低方差的方式减少预测误差 boosting 最终的预测效果是通过不断减少偏差的形式 Adaptive Boosting Gradient Boosting 变体 Xgboost LightGBM Catboost 2.Boosting思想 弱学习 把准确率不高但在50%以上(比如60%)的算法称

  • 主成分分析PCA的sklearn实践2022-01-02 18:31:10

    主成分分析 一、理论部分 主成分分析 无监督学习 背景:当变量数量多的时候,很难通过可视化看到4维及以上的变量的关系 保留原始数据中尽可能多的信息,保留最小数据空间——解决方法:主成分分析(数据降维) 主成分分析:一种将原始数据投影到低维线性空间上的降维技术;将一组相关变量转换

  • sklearn下载方法,如果pycharm下载失败的话,你可以看看这里2022-01-01 13:33:51

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、sklearn下载方法是什么? 一、sklearn下载方法是什么? 示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 **注意:**直接在终端运行就可以了 pip install scikit-learn -

  • sklearn进行简单的线性回归以及求切线2021-12-29 13:59:42

    目录 需求分析关键代码升维部分求导部分 全部代码 需求分析 处理一段数据,需要求某点切线的斜率。想法是先用线性回归拟合出曲线的解析式,然后根据高中学的导数的定义求出某点的导数。 数据很整齐,但是是一条曲线,应该先把x进行升维然后进行更高次的线性回归,输出曲线解析式。

  • 集成算法--sklearn2021-12-29 12:00:41

    集成算法 投票法 1.少数服从多数 2.多模型一致(硬投票) 3.更高把握(置信度)原则,以最高执行度的模型预测结果为准 4.把握程度汇总进行投票(软投票) 基于多个优化模型的投票分类器 from sklearn.ensemble import VotingClassifier # 导入投票分类器 from sklearn.datasets import loa

  • 机器学习 基础理论 学习笔记 (8)特征选择(feature selection)(一)2021-12-28 14:30:11

    0.说明 本文也许比较乱,请看目录再食用。 后续会 出文 机器学习 基础理论 学习笔记 (8)特征选择(feature selection)(二) 将 分类问题 和 回归问题 分开总结。 以及或将出文 机器学习 基础理论 学习笔记 (8)特征选择(feature selection)(三) 将sklearn上面实现的特征选择API和方法 总结。

  • sklearn机器学习(五)2021-12-27 20:31:29

    Task05 本次学习参照Datawhale开源学习:https://github.com/datawhalechina/machine-learning-toy-code/tree/main/ml-with-sklearn 内容安排如下,主要是一些代码实现和部分原理介绍。 5. k均值聚类 无监督学习训练样本的标签信息是未知的,目标是通过对无标签训练样本的学习来

  • sklearn机器学习:高斯朴素贝叶斯GaussianNB2021-12-26 11:35:36

    认识高斯朴素贝叶斯class sklearn.naive_bayes.GaussianNB (priors=None, var_smoothing=1e-09)如果Xi是连续值,通常Xi的先验概率为高斯分布(也就是正态分布),即在样本类别Ck中,Xi的值符合正态分布。以此来估计每个特征下每个类别上的条件概率。对于每个特征下的取值,高斯朴素贝叶斯有如

  • sklearn学习2021-12-22 22:33:00

    数据获取    数据返回值    数据划分API  

  • 第一个机器学习项目--简单分类问题多算法比较全流程Python实现2021-12-22 00:02:39

    第一个机器学习项目–分类问题 像一个优秀的工程师一样使用机器学习,而不要像一个机器学习专家一样使用机器学习方法。–Google 定义问题 数据理解 数据准备 评估算法:分离测试集和训练集 优化模型:调参、集成算法 结果部署:完成模型、执行模型、预测展示 1.导入数据 # 导入类

  • 机器学习sklearn-决策树2021-12-21 20:31:38

    机器学习sklearn-决策树 sklearn的基本建模流程 DecisionTreeClassifier分类树 一、重要参数 1.criterion 为了要将表格转化为一棵树,决策树需要找出最佳节点和最佳的分枝方法,对分类树来说,衡量这个“最佳”的指标叫做“不纯度”。通常来说,不纯度越低,决策树对训练集的拟合越好

  • 统计学习:模型评估与选择--查准率与查全率(python代码)2021-12-20 13:05:01

    对于模型的性能度量存在多种方式,评价分类器性能的指标一般是分类准确率,其定义是:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。 对于二分类问题常用的评价指标是精确率(precision)与召回率(recall),通常以关注的类为正类,其余类为负类。分类器在测试数据集上的预

  • sklearn中简单逻辑回归2021-12-20 12:03:02

    使用鸢尾花数据集来测试逻辑回归。由于鸢尾花数据集是三个类别,而简单逻辑回归解决的是二分类,故只取鸢尾花数据集的前两个类别,而且为了可视化方便,只取数据集的前两个特征。 1.首先导入数据 #导入数据 import numpy as np import matplotlib.pyplot as plt from sklearn import data

  • 使用sklearn PCA主成分分析对图像特征进行降维2021-12-19 14:58:18

    本文是利用Python K-means实现简单图像聚类的后续分析。 上文我们提到过,利用ResNet可以进行图像特征的抽取,进而帮助我们去进行聚类。但是其实这里面有个问题,拿resnet提取到的特征高达114688维,如果样本数量上去来的话,会变得非常耗时。 容易想到,那么多维特征,并不是每种特征都"

  • sklearn机器学习(二)2021-12-18 21:59:05

    Task02 本次学习参照Datawhale开源学习:https://github.com/datawhalechina/machine-learning-toy-code/tree/main/ml-with-sklearn 内容安排如下,主要是一些代码实现和部分原理介绍。 2. 支持向量机 支持向量机(Support Vector Machine, SVM)是监督学习方式对数据进行二元分类

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有