ICode9

精准搜索请尝试: 精确搜索
  • 数据挖掘实践(30):算法基础(七)梯度提升2021-02-13 12:36:06

    0 简介 0.1 主题 0.2 目标 1) 能够掌握传统的集成框架的类型 2) 能够掌握GBDT的算法过程 3) 能够掌握GBDT的残差 1 提升的概念       2 基本函数   所有可行的弱函数集合(基函数) 3 目标函数 3.1 目标函数策略  3.2 损失函数   4 最优求解思路     5 最优函数 5.1 过程

  • 机器学习笔记(不定时更新)2021-02-03 22:29:04

    pandas 函数 pandas.get_dummies() 对one-hot编码 #以kaggle titanic 里面的片段为例 features = ["Pclass", "Sex", "SibSp", "Parch"] X = pd.get_dummies(train_data[features]) print(X) pandas.DataFrame() 可以用字典方式创建 output = pd.DataFram

  • Datawhale组队学习21期_异常检测_Task5:高维异常2021-01-24 23:32:15

    异常检测——高维数据异常检测主要内容包括:Feature Bagging孤立森林 1、引言 在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。

  • 五、异常检测——高维数据异常检测2021-01-24 17:30:45

    1. 引言 在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函数来定义局部性,但是,在高

  • 23、深度学习之决策树学习2021-01-20 13:33:37

    具体参考决策树基本原理和讲解: 信息熵的学习参考:链接:https://pan.baidu.com/s/1_AF7xoUhm3XgcYGfGrk5ng  提取码:kztu 决策树的学习参考:https://sklearn.apachecn.org/docs/master/11.html 代码使用的csv参考:链接:https://pan.baidu.com/s/1IxbFuwET7qMbJyEu76WROg  提取码:g7f7

  • 【笔记】KNN之网格搜索与k近邻算法中更多超参数2021-01-14 13:05:01

    网格搜索与k近邻算法中更多超参数 网格搜索与k近邻算法中更多超参数 网络搜索 前笔记中使用的for循环进行的网格搜索的方式,我们可以发现不同的超参数之间是存在一种依赖关系的,像是p这个超参数,只有在 weights="uniform"才有意义 在sklearn中有一种封装好的网格搜索,grid search 我们

  • task1 异常检测介绍2021-01-12 23:00:25

    task1 异常检测介绍 一、什么是异常检测 异常检测,顾名思义是识别与正常数据不同的数据,与预期⾏为差异⼤的数据。识别如信⽤卡欺诈,⼯业⽣产异常,⽹络流⾥的异常(⽹络侵⼊)等问题,针对的是少数的事件。异常检测的场景有故障检测、物联⽹异常检、测欺诈检测、⼯业异常检测、时间序列

  • 常用的异常检测代码2021-01-12 22:57:33

    对于异常检测的定义,网上文章汗牛充栋,作为经常copy paster的 我只能大概了解一下常用的使用场景,仅以此文记录一下一些经典的常用的异常检测代码 。 感谢 O-A-A 大佬 原文: https://blog.csdn.net/u012194696/article/details/112531362 svm EllipticEnvelope IsolationForest L

  • 机器学习--支持向量机模型2021-01-09 18:05:22

    SVM简介 通俗的解释: 给定两组不同类别的数据点,找一个超平面把他们分割开,并希望这个超平面离这两组数据点的距离尽可能大。这样,我们就认为超平面一侧是一个类别。另一侧则是另一个类别。当新来一个数据点时,只需看它在这个分割平面的那一侧,就可以预测其类别。 任务类型: 通常用

  • 决策树2021-01-08 19:01:55

    决策树常用参数调优 sklearn-决策树 sklearn基本建模流程 1、实例化,建立评估模型对象—>2、通过模型接口训练模型—>3、通过模型接口提取需要的信息 决策树一种非参数的有监督学习方法,能从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分

  • 2020-12-192020-12-19 22:01:15

    基于贝叶斯对鸢尾花数据进行分类 python3.7numpy >= ‘1.16.4’sklearn >= ‘0.23.1’ import base package import warnings warnings.filterwarnings(‘ignore’) import numpy as np from sklearn import datasets from sklearn.naive_bayes import GaussianNB from sklea

  • 笔记 task12020-12-17 13:01:54

    学习完成,内容不难。 Step1:库函数导入 ## 基础函数库 import numpy as np ## 导入画图库 import matplotlib.pyplot as plt import seaborn as sns ## 导入逻辑回归模型函数 from sklearn.linear_model import LogisticRegression Step2:模型训练 ##Demo演示LogisticReg

  • openface源码理解2020-12-16 22:01:27

    OpenFace(0) 《OpenFace: A general-purpose face recognition library with mobile applications》 原文地址:http://elijah.cs.cmu.edu/DOCS/CMU-CS-16-118.pdf 源码地址:https://github.com/cmusatyalab/openface demos/classifier.py 执行命令 ./demos/classifier.py infer ./ge

  • 数据科学技术与应用第五章机器学习建模分析2020-12-08 20:05:15

    基于Keras建立深度神经网络模型,在bankpep数据集上训练神经网络分类模型,将训练模型的耗时以及模型性能,与XGBoost、SVM、朴素贝叶斯等方法进行比较。   import pandas,datetime,xgboost,numpy from sklearn import model_selection,preprocessing,metrics,tree,naive_bayes,svm fr

  • 实验一 使用sklearn的决策树实现iris鸢尾花数据集的分类2020-10-02 19:02:03

    使用sklearn的决策树实现iris鸢尾花数据集的分类 要求: 建立分类模型,至少包含4个剪枝参数:max_depth、min_samples_leaf 、min_samples_split、max_features和criterion参数。 运用GridSearchCV,寻找出最优参数。 绘制出在不同的max_depth下的学习曲线。 步骤: 一、导入各种我们需要的

  • Python网页分析,分析网站的日志数据2020-08-27 22:04:26

    前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 以下文章来源于大话数据分析,作者:尚天强 网站的日志数据记录了所有Web对服务器的访问活动,本节通过Python第三方库解析网站日志,利用pandas对网站日志数

  • 虚拟机的使用2020-07-06 21:37:49

                                                              虚拟机的使用                            是基于虚拟化实现的   1.快照   开机状态    速度慢    挂起状态   基于开机和关机之间的一种状态    关机状

  • 机器学习实战基础(二十八):决策树(一)概述2020-06-02 11:55:08

    概述 决策树是如何工作的  决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。 决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种

  • 11.分类与监督学习,朴素贝叶斯分类算法2020-05-13 21:01:19

    1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。  答:简述分类与聚类的联系与区别:聚类:在没有训练的条件下把样本划分为若干类。分类:已知存在哪些类,即对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属

  • 鸢(yuan)尾花分类任务2020-05-04 12:03:27

    一个机器学习的小应用:鸢尾花分类 鸢尾花有很多种,我们今天具体分类三种: 1.山鸢尾: 维吉尼亚鸢尾: 变色鸢尾: 看的出来,每个都很beautiful

  • 第一个机器学习scikit-learn可视化例子2020-03-18 21:57:40

    scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。http://scikit-learn.org/stable/index.html https://sklearn.apachecn.org/ 安装必要的包:

  • Python 随机森林的实现与参数优化2020-03-14 18:39:08

    关注微信公共号:小程在线 关注CSDN博客:程志伟的博客 通过n_estimators,random_state,boostrap和oob_score这四个参数了解袋装法的基本流程和重要概念。 estimators_ 和 .oob_score_ 这两个重要属性。 随机森林也有.feature_importances_这个属性。   Python 3.7.3 (default, Apr

  • 机器学习29:Sklearn库常用分类器及效果比较2020-03-05 14:04:18

    机器学习29:Sklearn库常用分类器及效果比较 1.Sklearn库常用分类器: #【1】 KNN Classifier # k-近邻分类器 from sklearn.neighbors import KNeighborsClassifier clf = KNeighborsClassifier() clf.fit(train_x, train_y) #【2】 Logistic Regression Classifier

  • 多类分类及误差分析2020-03-03 11:53:38

    1、多类分类 二分类器只能区分两个类别,多分类器则可以区分多余两个类别 一些算法(比如随机森林分类器或者朴素贝叶斯分类器)可以直接处理多分类问题,而其他的一些算法(比如SVM分类器或者线性分类器)择时严格的二分类器。当然也有许多策略让二分类器去执行多分类问题 "一对所有"(OvA)策略:

  • sklearn中predict_proba用法(注意和predict的区别)2020-01-26 16:42:34

      predict_proba返回的是一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。 predict返回对应的分类 # conding :utf-8   from sklearn.linear_model import LogisticRegression   import numpy a

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有