clf

数据挖掘实践（30）：算法基础（七）梯度提升2021-02-13 12:36:06

0 简介 0.1 主题 0.2 目标 1）能够掌握传统的集成框架的类型 2）能够掌握GBDT的算法过程 3）能够掌握GBDT的残差 1 提升的概念 2 基本函数　　所有可行的弱函数集合（基函数） 3 目标函数 3.1 目标函数策略 3.2 损失函数 4 最优求解思路 5 最优函数 5.1 过程
机器学习笔记（不定时更新）2021-02-03 22:29:04

pandas 函数 pandas.get_dummies() 对one-hot编码 #以kaggle titanic 里面的片段为例 features = ["Pclass", "Sex", "SibSp", "Parch"] X = pd.get_dummies(train_data[features]) print(X) pandas.DataFrame() 可以用字典方式创建 output = pd.DataFram
Datawhale组队学习21期_异常检测_Task5：高维异常2021-01-24 23:32:15

异常检测——高维数据异常检测主要内容包括：Feature Bagging孤立森林 1、引言在实际场景中，很多数据集都是多维度的。随着维度的增加，数据空间的大小（体积）会以指数级别增长，使数据变得稀疏，这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战，对距离的计算，聚类都带来了难题。
五、异常检测——高维数据异常检测2021-01-24 17:30:45

1. 引言在实际场景中，很多数据集都是多维度的。随着维度的增加，数据空间的大小（体积）会以指数级别增长，使数据变得稀疏，这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战，对距离的计算，聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函数来定义局部性，但是，在高
23、深度学习之决策树学习2021-01-20 13:33:37

具体参考决策树基本原理和讲解：信息熵的学习参考：链接：https://pan.baidu.com/s/1_AF7xoUhm3XgcYGfGrk5ng 提取码：kztu 决策树的学习参考：https://sklearn.apachecn.org/docs/master/11.html 代码使用的csv参考：链接：https://pan.baidu.com/s/1IxbFuwET7qMbJyEu76WROg 提取码：g7f7
【笔记】KNN之网格搜索与k近邻算法中更多超参数2021-01-14 13:05:01

网格搜索与k近邻算法中更多超参数网格搜索与k近邻算法中更多超参数网络搜索前笔记中使用的for循环进行的网格搜索的方式，我们可以发现不同的超参数之间是存在一种依赖关系的，像是p这个超参数，只有在 weights="uniform"才有意义在sklearn中有一种封装好的网格搜索，grid search 我们
task1 异常检测介绍2021-01-12 23:00:25

task1 异常检测介绍一、什么是异常检测异常检测，顾名思义是识别与正常数据不同的数据，与预期⾏为差异⼤的数据。识别如信⽤卡欺诈，⼯业⽣产异常，⽹络流⾥的异常（⽹络侵⼊）等问题，针对的是少数的事件。异常检测的场景有故障检测、物联⽹异常检、测欺诈检测、⼯业异常检测、时间序列
常用的异常检测代码2021-01-12 22:57:33

对于异常检测的定义，网上文章汗牛充栋，作为经常copy paster的我只能大概了解一下常用的使用场景，仅以此文记录一下一些经典的常用的异常检测代码。感谢 O-A-A 大佬原文： https://blog.csdn.net/u012194696/article/details/112531362 svm EllipticEnvelope IsolationForest L
机器学习--支持向量机模型2021-01-09 18:05:22

SVM简介通俗的解释：给定两组不同类别的数据点，找一个超平面把他们分割开，并希望这个超平面离这两组数据点的距离尽可能大。这样，我们就认为超平面一侧是一个类别。另一侧则是另一个类别。当新来一个数据点时，只需看它在这个分割平面的那一侧，就可以预测其类别。任务类型：通常用
决策树2021-01-08 19:01:55

决策树常用参数调优 sklearn-决策树 sklearn基本建模流程 1、实例化，建立评估模型对象—>2、通过模型接口训练模型—>3、通过模型接口提取需要的信息决策树一种非参数的有监督学习方法，能从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分
2020-12-192020-12-19 22:01:15

基于贝叶斯对鸢尾花数据进行分类 python3.7numpy >= ‘1.16.4’sklearn >= ‘0.23.1’ import base package import warnings warnings.filterwarnings(‘ignore’) import numpy as np from sklearn import datasets from sklearn.naive_bayes import GaussianNB from sklea
笔记 task12020-12-17 13:01:54

学习完成，内容不难。 Step1:库函数导入 ## 基础函数库 import numpy as np ## 导入画图库 import matplotlib.pyplot as plt import seaborn as sns ## 导入逻辑回归模型函数 from sklearn.linear_model import LogisticRegression Step2:模型训练 ##Demo演示LogisticReg
openface源码理解2020-12-16 22:01:27

OpenFace（0）《OpenFace: A general-purpose face recognition library with mobile applications》原文地址：http://elijah.cs.cmu.edu/DOCS/CMU-CS-16-118.pdf 源码地址：https://github.com/cmusatyalab/openface demos/classifier.py 执行命令 ./demos/classifier.py infer ./ge
数据科学技术与应用第五章机器学习建模分析2020-12-08 20:05:15

基于Keras建立深度神经网络模型，在bankpep数据集上训练神经网络分类模型，将训练模型的耗时以及模型性能，与XGBoost、SVM、朴素贝叶斯等方法进行比较。 import pandas,datetime,xgboost,numpy from sklearn import model_selection,preprocessing,metrics,tree,naive_bayes,svm fr
实验一使用sklearn的决策树实现iris鸢尾花数据集的分类2020-10-02 19:02:03

使用sklearn的决策树实现iris鸢尾花数据集的分类要求：建立分类模型，至少包含4个剪枝参数：max_depth、min_samples_leaf 、min_samples_split、max_features和criterion参数。运用GridSearchCV，寻找出最优参数。绘制出在不同的max_depth下的学习曲线。步骤：一、导入各种我们需要的
Python网页分析，分析网站的日志数据2020-08-27 22:04:26

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。以下文章来源于大话数据分析，作者：尚天强网站的日志数据记录了所有Web对服务器的访问活动，本节通过Python第三方库解析网站日志，利用pandas对网站日志数
虚拟机的使用2020-07-06 21:37:49

虚拟机的使用是基于虚拟化实现的 1.快照开机状态速度慢挂起状态基于开机和关机之间的一种状态关机状
机器学习实战基础（二十八）：决策树（一）概述2020-06-02 11:55:08

概述决策树是如何工作的决策树（Decision Tree）是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题。决策树算法容易理解，适用各种数据，在解决各种问题时都有良好表现，尤其是以树模型为核心的各种
11.分类与监督学习，朴素贝叶斯分类算法2020-05-13 21:01:19

1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。答：简述分类与聚类的联系与区别：聚类：在没有训练的条件下把样本划分为若干类。分类：已知存在哪些类，即对于目标数据库中存在哪些类是知道的，要做的就是将每一条记录分别属
鸢（yuan）尾花分类任务2020-05-04 12:03:27

一个机器学习的小应用：鸢尾花分类鸢尾花有很多种，我们今天具体分类三种： 1.山鸢尾：维吉尼亚鸢尾：变色鸢尾：看的出来，每个都很beautiful
第一个机器学习scikit-learn可视化例子2020-03-18 21:57:40

scikit-learn，又写作sklearn，是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用，并且涵盖了几乎所有主流机器学习算法。http://scikit-learn.org/stable/index.html https://sklearn.apachecn.org/ 安装必要的包：
Python 随机森林的实现与参数优化2020-03-14 18:39:08

关注微信公共号：小程在线关注CSDN博客：程志伟的博客通过n_estimators，random_state，boostrap和oob_score这四个参数了解袋装法的基本流程和重要概念。 estimators_ 和 .oob_score_ 这两个重要属性。随机森林也有.feature_importances_这个属性。 Python 3.7.3 (default, Apr
机器学习29:Sklearn库常用分类器及效果比较2020-03-05 14:04:18

机器学习29:Sklearn库常用分类器及效果比较 1.Sklearn库常用分类器： #【1】 KNN Classifier # k-近邻分类器 from sklearn.neighbors import KNeighborsClassifier clf = KNeighborsClassifier() clf.fit(train_x, train_y) #【2】 Logistic Regression Classifier
多类分类及误差分析2020-03-03 11:53:38

1、多类分类二分类器只能区分两个类别，多分类器则可以区分多余两个类别一些算法（比如随机森林分类器或者朴素贝叶斯分类器）可以直接处理多分类问题，而其他的一些算法（比如SVM分类器或者线性分类器）择时严格的二分类器。当然也有许多策略让二分类器去执行多分类问题 "一对所有"（OvA）策略：
sklearn中predict_proba用法（注意和predict的区别）2020-01-26 16:42:34

predict_proba返回的是一个 n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。 predict返回对应的分类 # conding :utf-8 from sklearn.linear_model import LogisticRegression import numpy a

首页 < 1 2 3 4 5 > 尾页

ICode9

数据挖掘实践（30）：算法基础（七）梯度提升2021-02-13 12:36:06

机器学习笔记（不定时更新）2021-02-03 22:29:04

Datawhale组队学习21期_异常检测_Task5：高维异常2021-01-24 23:32:15

五、异常检测——高维数据异常检测2021-01-24 17:30:45

23、深度学习之决策树学习2021-01-20 13:33:37

【笔记】KNN之网格搜索与k近邻算法中更多超参数2021-01-14 13:05:01

task1 异常检测介绍2021-01-12 23:00:25

常用的异常检测代码2021-01-12 22:57:33

机器学习--支持向量机模型2021-01-09 18:05:22

决策树2021-01-08 19:01:55

2020-12-192020-12-19 22:01:15

笔记 task12020-12-17 13:01:54

openface源码理解2020-12-16 22:01:27

数据科学技术与应用第五章机器学习建模分析2020-12-08 20:05:15

实验一 使用sklearn的决策树实现iris鸢尾花数据集的分类2020-10-02 19:02:03

Python网页分析，分析网站的日志数据2020-08-27 22:04:26

虚拟机的使用2020-07-06 21:37:49

机器学习实战基础（二十八）：决策树（一）概述2020-06-02 11:55:08

11.分类与监督学习，朴素贝叶斯分类算法2020-05-13 21:01:19

鸢（yuan）尾花分类任务2020-05-04 12:03:27

第一个机器学习scikit-learn可视化例子2020-03-18 21:57:40

Python 随机森林的实现与参数优化2020-03-14 18:39:08

机器学习29:Sklearn库常用分类器及效果比较2020-03-05 14:04:18

多类分类及误差分析2020-03-03 11:53:38

sklearn中predict_proba用法（注意和predict的区别）2020-01-26 16:42:34

实验一使用sklearn的决策树实现iris鸢尾花数据集的分类2020-10-02 19:02:03