DataWhale

Datawhale模拟面试每日打卡 day-15 20. 有效的括号2021-06-10 15:58:14

解题思路：本题只有三种括号，所以采用unordered_map（底层hash算法，不需要进行排序）来存储，注意采用右侧括号作为key值存储。还要优先判断字符串长度问题来提前返回，加快运行速度 class Solution { public: bool isValid(string s) { int n = s.size(); if (n
Datawhale模拟面试每日打卡 day-10 409. 最长回文串2021-05-24 12:32:25

解题思路：本题要求仅仅需要返回最长的回文串长度即可，所以里面的顺序问题不需要考虑。从题目中可以发现，当某一个字母是偶数个数的时候一定可以作为最长回文串中的元素，但当某一个元素是奇数个数的时候，其中偶数个一定可以作为最长回文串中的元素，而且可以选择任意一个奇数个的
Datawhale组队学习【数据挖掘-异常检测-TASK5】2021-05-23 19:01:07

Datawhale组队学习【数据挖掘-异常检测-TASK5】前言1、引言2、Feature Bagging3、Isolation Forests4、代码实践5、总结6、练习前言异常检测TASK5主要内容：学习高位数据的异常检测方法了解集成方法的思想理解feature bagging原理掌握孤立森林算法内容来自datawhal
【Datawhale第25期组队学习】Task04：基于相似度的方法2021-05-20 23:34:34

文章目录一、概念二、基于距离的度量1.基于单元的方法2.基于索引的方法三、基于密度的度量1. k-距离（k-distance(p)）2. k-邻域（k-distance neighborhood）3. 可达距离（reachability distance）4. 局部可达密度（local reachability density）5. 局部异常因子一、概念专注于有价
Datawhale组队学习【数据挖掘-异常检测-TASK4】2021-05-20 21:30:32

Datawhale组队学习【数据挖掘-异常检测-TASK4】前言一、基于距离的度量1.1 基于单元的方法1.2 基于索引的方法二、基于密度的度量2.1 k-距离（k-distance(p)）：2.2 k-邻域（k-distance neighborhood）：2.3 可达距离（reachability distance）：2.4 局部可达密度（local reachability densi
【Datawhale第25期组队学习】Task01：异常检测介绍2021-05-11 10:00:38

Task01：异常检测介绍文章目录 Task01：异常检测介绍0 写在前面1 异常检测的概念2 异常检测任务的分类2.1 有监督异常检测2.2 无监督异常检测 3 常见的异常检测算法3.1 问题定义3.2 异常检测算法综述 4 异常检测的实际应用4.1 欺诈行为检测（Fraud Detection）4.2 网络入侵检测（Net
Datawhale面试刷题打卡-第1天（20210508）2021-05-09 00:02:31

20210508打卡每日一题题目解题思路相关算法链表双指针致谢每日一题题目地址： https://leetcode-cn.com/problems/lian-biao-zhong-dao-shu-di-kge-jie-dian-lcof/ 解题思路首先回顾链表的特点。链表只能顺序地从前往后遍历，无法直接取到最后几个节点，并且如果想知道
DataWhale集成学习笔记（九）Stacking集成算法2021-05-08 10:57:47

Stacking集成算法 1 Blending集成学习算法1.1 算法流程1.2 代码实例 2 Stacking集成算法2.1 算法流程2.2 代码实例 Stacking集成算法可以理解为一个两层的集成，第一层含有多个基础分类器，把预测的结果(元特征)提供给第二层，而第二层的分类器通常是逻辑回归，他把一层分类器
DataWhale集成学习（中）——Task10前向分布算法与梯度提升决策树2021-04-23 22:58:13

目录前向分布算法（1）加法模型（2）前向分步算法（3）前向分步算法与Adaboost的关系梯度提升决策树GBDT（1）基于残差学习的提升树算法（2）梯度提升决策树算法(GBDT) 前向分布算法 Adaboost每次学习单一分类器以及单一分类器的权重。抽象出Adaboost算法的整体框架逻辑，构建集成学习的一
Datawhale 零基础入门数据挖掘二手车预测task032021-04-19 23:00:57

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1 使用语言：python Tas1 – Task5 Task2 特征工程分析目标：数据处理操作内容：异常处理、特征归一化/标准化、数据分桶、缺失值处理、特征构造、特征筛选、降维 1.学习了本次介绍的关于异常值处理的代码包装模块，感觉大佬
Datawhale 零基础入门数据挖掘-Task3 特征工程2021-04-19 13:30:27

Datawhale 零基础入门数据挖掘-Task3 特征工程三、特征工程目标赛题：零基础入门数据挖掘 - 二手车交易价格预测 3.1 特征工程目标对于特征进行进一步分析，并对于数据进行处理完成对于特征工程的分析 3.2 内容介绍常见的特征工程包括：异常处理：通过箱线图（或 3-Sigma
Datawhale组队学习-河北高校邀请赛-天天向上-天天-task22021-04-16 19:31:48

天天向上小队-天天，task2，EDA学习笔记目录数据处理总结数据探索性分析数据分布可视化name：汽车交易名称，已脱敏model：车型编码，已脱敏brand：汽车品牌，已脱敏bodyType：车身类型fuelType:燃油类型gearbox:变速箱power：发动机功率kilometers：汽车已行驶公里数notRepairedDamage:汽车有
Datawhale-Docker學習筆記03-數據管理2021-04-16 16:31:04

Docker數據管理這篇主要將docker data的概念釐清與介紹如何在 Docker 內部以及容器之間管理數據；在容器中管理數據主要有兩種方式：數據卷（Volumes）、掛載主機目錄 (Bind mounts) 鏡像來源 1 [root@docker01 ~]# docker pull registry.cn-beijing.aliyuncs.com/google_registry/n
Datawhale集成学习Task7-投票法2021-04-15 00:00:18

Datawhale集成学习Task7-投票法投票法的原理分析这里以分类问题为例解释投票法的工作机理，假设我们有m个不同的分类器 { C 1 ,
DataWhale集成学习Task6--掌握分类问题的评估及超参数调优2021-03-29 23:59:47

机器学习模型评估与超参数调优详解文章目录机器学习模型评估与超参数调优详解1. 用管道简化工作流方式1：make_pipline方式2：Pipeline两种方式的区别 2.使用k折交叉验证评估模型性能3. 使用学习和验证曲线调试算法4.通过网格搜索进行超参数调优SVM、SVC、SVR三者的区别 5.
【datawhale-集成学习】 task05 基本的分类模型2021-03-28 00:01:17

来吧鸢尾花～选择度量模型性能的指标真阳性TP:预测值和真实值都为正例;真阴性TN:预测值与真实值都为正例;假阳性FP:预测值为正，实际值为负;假阴性FN:预测值为负，实际值为正; 分类模型的指标准确率分类正确的样本数占总样本的比例 A
Datawhale集成学习笔记：基本的分类模型2021-03-26 17:30:49

使用sklearn构建完整的分类项目 1 . 收集数据集并选择合适的特征：在数据集上我们使用我们比较熟悉的IRIS鸢尾花数据集。 import pandas as pd from sklearn import datasets iris = datasets.load_iris() X = iris.data y = iris.target feature = iris.feature_names data =
DataWhale集成学习（上）——Task042021-03-23 20:03:28

目录（5）对超参数进行调优网格搜索随机搜索实例（5）对超参数进行调优参数与超参数模型参数是模型内部分配置变量，根据数据进行估计模型超参数是模型外部的配置，其值无法从数据中估计。常用的调参方法有以下两种：网格搜索思想：把所有超参数选择列出来做排列组合 class sklea
Datawhale开源集成学习笔记04-模型评估与超参数调优2021-03-22 23:58:20

模型评估与超参数调优参数与超参数模型参数是模型内部的配置变量，其值可以根据数据进行估计。 - 进行预测时需要参数。 - 它参数定义了可使用的模型。 - 参数是从数据估计或获悉的。 - 参数通常不由编程者手动设置。 - 参数通常被保存为学习模型的一部分。 - 参数是机器学习
【组队学习】【23期】Datawhale深度推荐模型2021-03-13 20:33:03

深度推荐模型开源内容：https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel 基本信息贡献人员：罗如意、吴忠强、田雨，宁彦吉，何世福、徐何军、赖敏材、刘纪川学习周期：13天学习形式：理论+实践；完成学习打卡人群定位：了解机器学习基础，了解推
DataWhale 零基础入门语义分割-地表建筑物识别-Task32021-02-26 22:01:06

文章目录语义分割模型发展一、FCN1.FCN主要特点2.反卷积(Deconvolutional)3.跳跃结构二.SegNet三.Unet三.其他语义分割模型发展语义分割网络模型的发展：FCN 、SegNet、Unet、DeepLab、RefineNet、PSPNet、GAN 语义分割。本文主要以FCN 为重点进行分析一、FCN FCN(F
Datawhale编程实践（LeetCode 腾讯精选练习50）Task142021-01-26 19:34:09

1.数组中的第k个最大元素https://leetcode-cn.com/problems/kth-largest-element-in-an-array/ 2.存在重复元素https://leetcode-cn.com/problems/contains-duplicate/ 3.二叉搜索树中第k小的元素https://leetcode-cn.com/problems/kth-smallest-element-in-a-b
Datawhale编程实践（LeetCode 腾讯精选练习50）Task132021-01-25 20:35:53

1.相交链表https://leetcode-cn.com/problems/intersection-of-two-linked-lists/ 看到这个题目没有理解示例1到底是什么意思，为什么都有1但相交的起始节点不是1那个点后来知道了是要节点本身相等（不仅包括值还包括地址）。看到官方的双指针法解答，感觉十分巧妙，长度分别为m和n
Datawhale组队学习21期_异常检测_Task5：高维异常2021-01-24 23:32:15

异常检测——高维数据异常检测主要内容包括：Feature Bagging孤立森林 1、引言在实际场景中，很多数据集都是多维度的。随着维度的增加，数据空间的大小（体积）会以指数级别增长，使数据变得稀疏，这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战，对距离的计算，聚类都带来了难题。
DataWhale组队DAY3前沿2021-01-19 23:32:11

任务论文代码统计，统计所有论文出现代码的相关统计；使用正则表达式统计代码连接、页数和图表数据。数据处理步骤确定数据出现的位置；使用正则表达式完成匹配；完成相关的统计。正则表达式具体代码 # 导入所需的package import seaborn as sns #用于画图 from bs4 import B

首页 < 2 3 4 5 6 > 尾页

ICode9

Datawhale模拟面试每日打卡 day-15 20. 有效的括号2021-06-10 15:58:14

Datawhale模拟面试每日打卡 day-10 409. 最长回文串2021-05-24 12:32:25

Datawhale组队学习【数据挖掘-异常检测-TASK5】2021-05-23 19:01:07

【Datawhale第25期组队学习】Task04：基于相似度的方法2021-05-20 23:34:34

Datawhale组队学习【数据挖掘-异常检测-TASK4】2021-05-20 21:30:32

【Datawhale第25期组队学习】Task01：异常检测介绍2021-05-11 10:00:38

Datawhale面试刷题打卡-第1天（20210508）2021-05-09 00:02:31

DataWhale集成学习笔记（九）Stacking集成算法2021-05-08 10:57:47

DataWhale集成学习（中）——Task10前向分布算法与梯度提升决策树2021-04-23 22:58:13

Datawhale 零基础入门数据挖掘二手车预测task032021-04-19 23:00:57

Datawhale 零基础入门数据挖掘-Task3 特征工程2021-04-19 13:30:27

Datawhale组队学习-河北高校邀请赛-天天向上-天天-task22021-04-16 19:31:48

Datawhale-Docker學習筆記03-數據管理2021-04-16 16:31:04

Datawhale集成学习Task7-投票法2021-04-15 00:00:18

DataWhale集成学习Task6--掌握分类问题的评估及超参数调优2021-03-29 23:59:47

【datawhale-集成学习】 task05 基本的分类模型2021-03-28 00:01:17

Datawhale集成学习笔记：基本的分类模型2021-03-26 17:30:49

DataWhale集成学习（上）——Task042021-03-23 20:03:28

Datawhale开源集成学习笔记04-模型评估与超参数调优2021-03-22 23:58:20

【组队学习】【23期】Datawhale深度推荐模型2021-03-13 20:33:03

DataWhale 零基础入门语义分割-地表建筑物识别-Task32021-02-26 22:01:06

Datawhale编程实践（LeetCode 腾讯精选练习50）Task142021-01-26 19:34:09

Datawhale编程实践（LeetCode 腾讯精选练习50）Task132021-01-25 20:35:53

Datawhale组队学习21期_异常检测_Task5：高维异常2021-01-24 23:32:15

DataWhale组队DAY3前沿2021-01-19 23:32:11