ICode9

精准搜索请尝试: 精确搜索
  • 机器学习(七)——分类算法的评价2021-12-04 12:31:53

    分类准确度存在的问题 如果现在有一个癌症预测系统,输入患者的信息,可以判断是否有癌症。如果只使用分类准确度来评价模型的好坏是否合理?假如此时模型的预测准确度是99.9%,那么是否能认为模型是好的呢?如果癌症产生的概率只有0.1%,那就意味着这个癌症预测系统只有预测所有人都是健

  • 机器学习(五)——模型泛化2021-12-02 14:31:39

    引言 众所周知,考试前会刷题。但是考试大部分又不是原题,那考前刷题有什么用?我们考前做的题目的当然不是为了赌考试有一模一样的题(有可能也是。。。),我们是为了从题目中学到一般的知识,这样我们在遇到新题目的时候也可以根据知识来做出题目。其实在机器学习中,考前刷的题就是训练

  • kNN-预测2021-11-16 23:33:43

    现在进行第五步,对数据进行预测 那么要做的的是从数据集里面拿出一部分作为要预测的,剩下的去比较,书上使用的是10% # 对之前做好的kNN算法进行预测 # 首先获取之前构造好的kNN分类器、数据、规则化之后的数据 import kNN import norm # 倒完包之后先别急,目的是从规则化的数据集里面

  • hive平台Shell文件2021-11-16 11:03:55

    #!/bin/sh # for i in '020W0700' '010WE0440' '020R0100' '020WE0300' do batch_code=$i inc_day=$a before=$b sep_incday=$c echo "tt $sep_incday" hive -e " set mapreduce.job.queuename = root.ordi_predi

  • sklearn常用函数整理2021-11-14 10:03:25

    乱序 from sklearn.model_selection import ShuffleSplit K折交叉验证 from sklearn.model_selection import cross_val_score cross_val = cross_val_score(KNN, iris.data, iris.target, cv=4,scoring='neg_mean_squared_error') 拆分数据集 from sklearn.model_selecti

  • 机器学习算法(一元线性回归)2021-11-12 18:58:33

    import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn import datasets, linear_model # 读取所需数据 def get_data(file_name): data = pd.read_csv(file_name) # 获取Dataframe对象 X_parameter = [] Y_parameter = []

  • Beyond Heuristics: Learning to Classify Vulnerabilities and Predict Exploits2021-11-10 01:31:25

    一种有别于启发式的漏洞分类与利用预测的学习方法 一、摘要   在现代系统管理中,对于安全的需求是巨大的并且愈演愈烈。其中,最主要的需求是管理员必须监控着源源不断的软件漏洞披露,因为这里面的漏洞可能会以某种方式危害到他们的系统。这些漏洞包括缓冲区溢出错误、非法的验证输

  • 【深度学习笔记】-代码解读7-模型训练、验证与可视化2021-11-06 18:02:36

    转载「深度学习一遍过」必修7:模型训练、验证与可视化_荣仔的博客-CSDN博客 1 Create Dataset 生成训练集和测试集 生成验证集 import os import random#打乱数据用的 def CreateEvalData(): data_list = [] test_root = r".\testdata" for a, b, c in os.walk

  • 线性回归【机器学习笔记简摘】2021-11-04 17:03:44

    定义与公式 线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。 通用公式: h ( w

  • sklearn 估计器(estimator)接口2021-11-03 12:31:08

    sklearn 估计器(estimator)接口的简单介绍 Scikit-learn 努力在为所有方法建立统一的接口。给定名为model的 scikit-learn 估计器对象,可以使用以下方法(并非每个模型都有): 1. 适用于所有估计器 model.fit():拟合训练数据。对于监督学习应用,它接受两个参数:数据X和标签y(例如model.fit(

  • 【预测模型】基于布谷鸟算法改进SVM实现预测matlab代码2021-10-30 13:02:44

    1 简介 支持向量机(Support Vector Machine,SVM) 是 Vapnik 等人于 1995 年提出的一种基于统计学习理论的新型机器学习方法,它能较好地解决小样本、非线性等实际问题,已成为智能技术领域研究的热点,目前已广泛应用于状态评估、故障诊断、模式识别、化工建模等诸多领域。 支持向量机

  • 【预测模型】基于布谷鸟算法改进SVM实现预测matlab代码2021-10-30 13:02:21

    1 简介 支持向量机(Support Vector Machine,SVM) 是 Vapnik 等人于 1995 年提出的一种基于统计学习理论的新型机器学习方法,它能较好地解决小样本、非线性等实际问题,已成为智能技术领域研究的热点,目前已广泛应用于状态评估、故障诊断、模式识别、化工建模等诸多领域。 支持向量机

  • KNN算法实现对iris数据集的预测2021-10-29 11:01:17

    KNN算法的实现 第一次写机器学习算法,写的是KNN预测iris数据集、不会矩阵运算,实现起来很呆,但是总归还是实现了 import pandas as pd from math import dist k = int(input("请输入k值(不能输入三的倍数!):")) dataTest = pd.read_csv('iristest.csv', header=None).values trainData =

  • ML12 My_RSM_Of_Linear2021-10-23 21:05:19

    ML实战:手动实现RSM集成学习 使用了sklearn自带的波士顿房价数据集 由于自身电脑条件不足,虽然RSM是并行的,但是在实验中采用了依次训练各个基学习器的方法,因此运行时间较长 代码实现 RSM类 import numpy as np from Linear_class import LinearRegression import sys np.set_prin

  • 一个利用CNN抽取实体的工具2021-10-23 13:01:45

    CNN4IE 项目地址:https://github.com/jiangnanboy/CNN4IE 中文信息抽取工具。使用CNN的不同变体进行信息抽取,以后会持续加入不同模型。该项目使用pytorch,python开发。 CNN4IE将各种改进版本的conv进行改动用于中文信息抽取。 Guide Intro Model Evaluate Install Dataset Todo Cit

  • python机器学习-KNN算法2021-10-21 11:34:10

    K-近邻算法API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') n_neighbors:int,可选(默认= 5),k_neighbors查询默认使用的邻居数 algorithm:{‘auto’,‘ball_tree’,‘kd_tree’,‘brute’},可选用于计算最近邻居的算法:‘ball_tree’将会使用 BallTree,‘kd_t

  • python机器学习-鸢尾花决策树2021-10-21 11:31:27

    决策树API class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None) 决策树分类器 criterion:默认是’gini’系数,也可以选择信息增益的熵’entropy’ max_depth:树的深度大小 random_state:随机数种子 其中会有些超参数:max_depth:

  • python XGboost回归预测 算法实现和原理讲解(比赛青睐)2021-10-18 10:58:54

    对经典问题 波士顿房价进行回归预测 一、加载波士顿数据集并观察数据的shape。 from sklearn.model_selection import train_test_split def del_data(): #建立处理数据集的方法,便于直接带入xgboost算法 (train_data, train_targets), (test_data, test_targets) = bosto

  • ML09 My_NavieBayes2021-10-16 19:01:14

    ML实战:手动实现朴素贝叶斯分类器 使用了sklearn自带的莺尾花数据集 代码实现 NB类 import numpy as np from math import pi,e,sqrt,exp np.set_printoptions(suppress=True) class NB: def __init__(self,x,y,tag): ''' :param x: 数据集 :para

  • 人工智能第二次作业2021-10-13 09:31:43

    人工智能第二次作业 1 生成人工数据集 import numpy as np import matplotlib.pyplot as plt #训练集和验证集 n_vali,n_train,true_w, true_b = 20,80,[1.2, -3.4, 5.6], 5 X = np.random.normal(size=100) X = X.reshape(-1,1) #重新排列为一列 # print(X) poly_feature

  • 【lssvm预测】基于飞蛾扑火算法改进的最小二乘支持向量机lssvm预测matlab源码2021-10-06 10:33:13

    【lssvm预测】基于飞蛾扑火算法改进的最小二乘支持向量机lssvm预测matlab源码   1 模型介绍 1.1 LSSVM的特性 同样是对原始对偶问题进行求解,但是通过求解一个线性方程组(优化目标中的线性约束导致的)来代替SVM中的QP问题(简化求解过程),对于高维输入空间中的分类以及回归任务同样适

  • 机器学习: 聚类算法2021-10-05 23:30:26

    一、聚类算法简介 1 认识聚类算法 使用不同的聚类准则,产生的聚类结果不同 1.1 聚类算法在现实中的应用 用户画像,广告推荐,Data Segmentation,搜索引擎的流量推荐,恶意流量识别基于位置信息的商业推送,新闻聚类,筛选排序图像分割,降维,识别;离群点检测;信用卡异常消费;发掘相同功能的基

  • ML07 My_Abnormal_Detection2021-10-01 22:00:49

    ML实战:手动实现异常检测算法 这里使用了改良版本,即使用多元高斯分布函数,提高了对数据相关性的适应 代码实现 Detaction类 import numpy as np from math import exp,pow,pi np.set_printoptions(suppress=True) class Detection: def __init__(self,x): '''

  • 05-KNN 基础学习2021-09-30 21:01:44

    本文素材均来源于网络,参考黑马与网易教程 目录 一、什么是KNN算法 1.KNN 2.公式 3.小结 4.实现流程 二、KNN 与 SciKit-learn数据集 1.简单数据的KNN算法 2.SciKit-learn数据学习 3.重新封装自制KNN 1. 代码封装 2.测试 三、训练集与测试集的划分 1.查看鸢尾花数据集 2.训练集与

  • 聚类算法2-聚类算法api初步使用2021-09-26 10:36:45

    1 api介绍 sklearn.cluster.KMeans(n_clusters=8) 参数: n_clusters:开始的聚类中心数量,产生的质心数。 方法: estimator.fit(x) estimator.predict(x) estimator.fit_predict(x) fit_predict计算聚类中心并预测每个样本属于哪个类别,相当于先调用fit(x),然后再调用predi

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有