datasets

机器学习进度（二）—— 特征工程2021-01-15 17:35:12

2.1 数据集目标知道数据集的分为训练集和测试集会使用sklearn的数据集应用无 2.1.1 可用数据集 Kaggle网址：https://www.kaggle.com/datasets UCI数据集网址： http://archive.ics.uci.edu/ml/ scikit-learn网址：http://scikit-learn.org/stable/datasets/in
机器学习和数据科学中常用的公开数据集（含计算机视觉最全数据集汇总）2021-01-06 17:07:05

数据集查找器Google Dataset Search：与Google Scholar的工作方式类似，Dataset Search 可以让你在任何托管的地方找到数据集，无论是出版商的网站，还是数字图书馆，又或者是一个作者的网页。它是一个非凡的数据集查找器，包含了超过2500万个数据集。https://toolbox.google.com/datasetsearch
tensorflow.keras.datasets 中关于imdb.load_data的使用说明2021-01-02 10:01:46

在tensorflow2.x的keras中内置了7种类型的数据集: 数据集名称数据集描述boston_housing波士顿房价数据cifar1010种类别图片集cifar100100种类别图片集fashion_mnist10种时尚类别图片集imdb电影评论情感分类数据集mnist手写数字图片集reuters路透社新闻主题分类数据集这些数
08-04 细分构建机器学习应用程序的流程-数据收集2020-12-10 22:32:41

目录细分构建机器学习应用程序的流程-数据收集一、1.1 通过sklearn生成随机数据1.1 1.1.1 make_classification()1.2 1.1.2 make_multilabel_classification()1.3 1.1.3 make_regression()1.4 1.1.4 make_blobs1.5 1.1.5 make_circles()1.6 1.1.6 make_moons二、1.2 skleran自带
常见数据集搜索网站（CV方向为主）2020-12-08 19:33:06

一些公开数据集搜索网站注：括号中数字为该网站截至2020/12/08包含的数据集数量 1.Kaggle（63122）: https://www.kaggle.com/datasets 支持关键字搜索，每个数据集都有关联的讨论区 2.亚马逊数据集（203）：https://registry.opendata.aws/ 支持搜索，数据集存储在AWS上 3.UCI机器学习数据
实现鸢尾花数据的读入2020-10-22 15:04:00

1.鸢尾花数据集再介绍: 鸢尾花数据集共有数据150组每组包括花萼长、花萼宽、花瓣长、花瓣宽4个输入特征同时给出了每一组特征对应的鸢尾花类别类别包括SetosaIris(狗尾草鸢尾)，VersicolourIris(杂色鸢尾)，VirginicaIris(弗吉尼亚鸢尾)三类，分别用数字0，1，2表示 from skle
机器学习基础功能练习II2020-07-07 13:07:04

机器学习基础功能练习II 一、导入sklearn 数据集　　 from sklearn.datasets import load_diabetes diabetes = load_diabetes() """返回字典，数据集的descr，data，feature_names等关键数据 diabetes.data 是一个矩阵 sklearn.datasets.load_boston sklearn.datasets.load_breast_ca
[keras]MNIST 数据集下载不了，其他kears自带数据下载不了同理（例如imdb）2020-04-26 21:36:17

原因 keras 源码中下载MNIST的方式是 path = get_file(path, origin=‘https://s3.amazonaws.com/img-datasets/mnist.npz’)，数据源是通过 url = https://s3.amazonaws.com/img-datasets/mnist.npz 进行下载的。但是在最近的学习过程中，如果直接从官网的链接下载的话会非常的
5、实战：CIFAR-10分类2020-04-22 14:54:55

与其他教程不一样的地方是加载的本地已下载数据（代码中下载速度太慢）。关于数据集的说明点击此链接。 1、下载数据集，复制此链接到迅雷下载 http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 2、解压到E:/data目录中， 3、jupyter中撸代码【说明】 ① Dataloader是一个可
detectron2 中的coco数据集默认位置更改2020-04-10 18:04:38

detectron2 中的coco数据集默认位置更改其默认的dataset的位置是 .../detectron2/data/datasets/... 更改方式打开上述路径下的buildin.py文件 # -*- coding: utf-8 -*- # Copyright (c) Facebook, Inc. and its affiliates. All Rights Reserved """ This file registers pre-
加载load_digits样本数据集2020-02-27 14:06:33

load_digits数据集该数据集是sklearn.datasets中内置的手写数字图片数据集，这是一个研究图像分类算法的优质数据集。测试代码 from sklearn import datasets # 加载手写数字数据集 digits = datasets.load_digits() # 创建特征矩阵 feature = digits.data # 创建目标向
机器学习笔记（二）2019-12-04 21:55:47

一、机器学习基础算法是核心，数据和计算是基础。数据类型离散型数据：记录不同类别个体的数目所得到的数据，又称为计数数据，全部是整数，不能再细分，也不能进一步提高精度。连续型数据：变量可以在某个范围内取任意数，即变量的取值可以是连续的，通常是非整数。离散型是区间内不可分，连续
KNN基础代码2019-10-27 22:03:59

库 sklearn 库下的工具： datasets，model_selection，neighbors K近邻代码思路：有个数据集----对数据分割----调用KNN算法 iris = datasets.load_iris() 导入数据集数据集权重：开源数据集，重要数据集之一数据集特点：还有3个类别，所以可分类数据集描述链接：https://archive.ics.uc
机器学习库scikit-learn学习2019-10-18 15:02:17

一、获取数据 from sklearn import datasets 1.sklean自带数据集鸢尾花 from sklearn import datasets datasets.load_iris() 手写数字 from sklearn.datasets import load_digits digits = load_digits() print(digits.data.shape) print(digits.target.shape)
1 课程涵盖的内容和理念及主要技术栈2019-10-17 10:05:17

1-2 课程涵盖的内容和理念 1-3 课程所使用的主要技术栈 sklearn 官网数据集 https://scikit-learn.org/stable/datasets/index.html#toy-datasets
06-数据的划分与sklearn中的数据集介绍2019-09-19 19:35:48

""" 数据的两部分：训练集：用于训练，构建模型测试集：在模型检验时使用，用于评估模型是否有效训练集与测试集的常用数据量比：7-3、8-2、7.5-2.5（此比例较好，使用较多）划分数据的api：sklearn.model_selection.train_test_split 数据集： sklearn.datasets
logistics二分类数据集:https://archive.ics.uci.edu/ml/datasets/Glass+Identification2019-09-18 15:00:07

binaryclassification import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport sklearn import sklearn.preprocessing as pre df=pd.read_csv('data\glassi\glass.data')df.head() idRINaMgAlSiKCaBaFeclass 0 1 1.52101 13.64
《统计学习方法》第5章_决策树2019-09-03 17:35:53

书中例题5.1 # encoding:utf-8 import numpy as np import pandas as pd from math import log def create_data(): datasets = [['青年', '否', '否', '一般', '否'], ['青年', '否', '
scikit-learn Cookbook-12019-08-08 10:08:49

第一章模型预处理 [从外部源获取样本数据] [创建试验样本数据] [把数据调整为标准正态分布] [用阈值创建二元特征] [分类变量处理] [标签特征二元化] [处理缺失值] [用管线命令处理多个步骤] [用主成分分析降维] [用因子分析降维] [用核PCA实现非线性降维] [用截断奇异值
单细胞数据整合方法 | Comprehensive Integration of Single-Cell Data2019-07-25 15:53:29

Comprehensive Integration of Single-Cell Data 实在是没想到，这篇seurat的V3里面的整合方法居然发在了Cell主刊。果然：大佬+前沿领域=无限可能可以看到bioRxiv上是November 02, 2018发布的，然后Cell主刊June 06, 2019正式发表。方法的创意应该在2017年底就有了，那时候我才刚来做si
（13）不支持的操作2019-07-20 09:43:59

不支持的操作有些DataFrame / Dataset的操作是Streaming DataFrames / Datasets不支持的。其中一些如下。 ,流Datasets不支持多个流聚合（即流DF上的聚合链）。 ,流数据集不支持Limit 和取前N行。 ,不支持流dataset/dataframe的Distinct 操作。 ,只有在有聚合操作且是Complete 输
voxel 转换为 patient coordinate（python实现）2019-06-05 20:55:23

dcm 其实自己感觉还未完全理解（博客内容若有错误请指出），先记下来，等答辩、课题等事情弄好再重新学习并补充。一些基础概念别人博客已经写的很好了，我理解的关键点为： 1、病人坐标系的xyz定义方向为LPS(并非所有的，一些集成3D slice的软件用的是RAS） 2、图像坐标xy定义方向：(0,0)代
Jackson 如何解析数组类型的 JsonNode2019-04-15 10:55:19

当把JSON library 从 org.json 改为 Jackson 时，我希望用 Jackson 重现下面这段代码:JSONObject datasets = readJSON(new URL(DATASETS));JSONArray datasetArray = datasets.getJSONArray("datasets");但是 Jackson 中的 JsonNode.get(field) 方法返回的还是一个 JsonNode，但是 d
fashion datasets图像检索实践project2019-03-14 19:41:13

Using Siamese Networks and Pre-Trained Convolutional Neural Networks (CNNs) for Fashion Similarity Matching Resources Code for the project is available here. Deep Fashion dataset is available here. Data Science Virtual Machine documentation. Visual Stud

首页 < 2 3 4

ICode9

机器学习进度（二）—— 特征工程2021-01-15 17:35:12

机器学习和数据科学中常用的公开数据集（含计算机视觉最全数据集汇总）2021-01-06 17:07:05

tensorflow.keras.datasets 中关于imdb.load_data的使用说明2021-01-02 10:01:46

08-04 细分构建机器学习应用程序的流程-数据收集2020-12-10 22:32:41

常见数据集搜索网站（CV方向为主）2020-12-08 19:33:06

实现鸢尾花数据的读入2020-10-22 15:04:00

机器学习基础功能练习II2020-07-07 13:07:04

[keras]MNIST 数据集下载不了，其他kears自带数据下载不了同理（例如imdb）2020-04-26 21:36:17

5、实战：CIFAR-10分类2020-04-22 14:54:55

detectron2 中的coco数据集默认位置更改2020-04-10 18:04:38

加载load_digits样本数据集2020-02-27 14:06:33

机器学习笔记（二）2019-12-04 21:55:47

KNN基础代码2019-10-27 22:03:59

机器学习库scikit-learn学习2019-10-18 15:02:17

1 课程涵盖的内容和理念及主要技术栈2019-10-17 10:05:17

06-数据的划分与sklearn中的数据集介绍2019-09-19 19:35:48

logistics二分类 数据集:https://archive.ics.uci.edu/ml/datasets/Glass+Identification2019-09-18 15:00:07

《统计学习方法》第5章_决策树2019-09-03 17:35:53

scikit-learn Cookbook-12019-08-08 10:08:49

单细胞数据整合方法 | Comprehensive Integration of Single-Cell Data2019-07-25 15:53:29

（13）不支持的操作2019-07-20 09:43:59

voxel 转换为 patient coordinate（python实现）2019-06-05 20:55:23

Jackson 如何解析数组类型的 JsonNode2019-04-15 10:55:19

fashion datasets图像检索实践project2019-03-14 19:41:13

logistics二分类数据集:https://archive.ics.uci.edu/ml/datasets/Glass+Identification2019-09-18 15:00:07