ICode9

精准搜索请尝试: 精确搜索
  • Datawhale模拟面试每日打卡 day-15 20. 有效的括号2021-06-10 15:58:14

    解题思路: 本题只有三种括号,所以采用unordered_map(底层hash算法,不需要进行排序)来存储,注意采用右侧括号作为key值存储。还要优先判断字符串长度问题来提前返回,加快运行速度 class Solution { public: bool isValid(string s) { int n = s.size(); if (n

  • Datawhale模拟面试每日打卡 day-10 409. 最长回文串2021-05-24 12:32:25

    解题思路: 本题要求仅仅需要返回最长的回文串长度即可,所以里面的顺序问题不需要考虑。从题目中可以发现,当某一个字母是偶数个数的时候一定可以作为最长回文串中的元素,但当某一个元素是奇数个数的时候,其中偶数个一定可以作为最长回文串中的元素,而且可以选择任意一个奇数个的

  • Datawhale组队学习【数据挖掘-异常检测-TASK5】2021-05-23 19:01:07

    Datawhale组队学习【数据挖掘-异常检测-TASK5】 前言1、引言2、Feature Bagging3、Isolation Forests4、代码实践5、总结6、练习 前言 异常检测TASK5主要内容: 学习高位数据的异常检测方法 了解集成方法的思想理解feature bagging原理掌握孤立森林算法 内容来自datawhal

  • 【Datawhale第25期组队学习】Task04:基于相似度的方法2021-05-20 23:34:34

    文章目录 一、概念二、基于距离的度量1.基于单元的方法2.基于索引的方法 三、基于密度的度量1. k-距离(k-distance(p))2. k-邻域(k-distance neighborhood)3. 可达距离(reachability distance)4. 局部可达密度(local reachability density)5. 局部异常因子 一、概念 专注于有价

  • Datawhale组队学习【数据挖掘-异常检测-TASK4】2021-05-20 21:30:32

    Datawhale组队学习【数据挖掘-异常检测-TASK4】 前言一、基于距离的度量1.1 基于单元的方法1.2 基于索引的方法 二、基于密度的度量2.1 k-距离(k-distance(p)):2.2 k-邻域(k-distance neighborhood):2.3 可达距离(reachability distance):2.4 局部可达密度(local reachability densi

  • 【Datawhale第25期组队学习】Task01:异常检测介绍2021-05-11 10:00:38

    Task01:异常检测介绍 文章目录 Task01:异常检测介绍0 写在前面1 异常检测的概念2 异常检测任务的分类2.1 有监督异常检测2.2 无监督异常检测 3 常见的异常检测算法3.1 问题定义3.2 异常检测算法综述 4 异常检测的实际应用4.1 欺诈行为检测(Fraud Detection)4.2 网络入侵检测(Net

  • Datawhale面试刷题打卡-第1天(20210508)2021-05-09 00:02:31

    20210508打卡 每日一题题目解题思路 相关算法链表双指针 致谢 每日一题 题目 地址: https://leetcode-cn.com/problems/lian-biao-zhong-dao-shu-di-kge-jie-dian-lcof/ 解题思路 首先回顾链表的特点。链表只能顺序地从前往后遍历,无法直接取到最后几个节点,并且如果想知道

  • DataWhale集成学习笔记(九)Stacking集成算法2021-05-08 10:57:47

    Stacking集成算法 1 Blending集成学习算法1.1 算法流程1.2 代码实例 2 Stacking集成算法2.1 算法流程2.2 代码实例 Stacking集成算法可以理解为一个两层的集成,第一层含有多个基础分类器,把预测的结果(元特征)提供给第二层, 而第二层的分类器通常是逻辑回归,他把一层分类器

  • DataWhale集成学习(中)——Task10前向分布算法与梯度提升决策树2021-04-23 22:58:13

    目 录 前向分布算法(1)加法模型(2)前向分步算法(3)前向分步算法与Adaboost的关系 梯度提升决策树GBDT(1)基于残差学习的提升树算法 (2)梯度提升决策树算法(GBDT) 前向分布算法 Adaboost每次学习单一分类器以及单一分类器的权重。 抽象出Adaboost算法的整体框架逻辑,构建集成学习的一

  • Datawhale 零基础入门数据挖掘二手车预测task032021-04-19 23:00:57

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1 使用语言:python Tas1 – Task5 Task2 特征工程分析 目标:数据处理操作内容:异常处理、特征归一化/标准化、数据分桶、缺失值处理、特征构造、特征筛选、降维 1.学习了本次介绍的关于异常值处理的代码包装模块,感觉大佬

  • Datawhale 零基础入门数据挖掘-Task3 特征工程2021-04-19 13:30:27

    Datawhale 零基础入门数据挖掘-Task3 特征工程 三、 特征工程目标 赛题:零基础入门数据挖掘 - 二手车交易价格预测 3.1 特征工程目标 对于特征进行进一步分析,并对于数据进行处理 完成对于特征工程的分析 3.2 内容介绍 常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma

  • Datawhale组队学习-河北高校邀请赛-天天向上-天天-task22021-04-16 19:31:48

    天天向上小队-天天,task2,EDA学习笔记 目录 数据处理总结数据探索性分析数据分布可视化name:汽车交易名称,已脱敏model:车型编码,已脱敏brand:汽车品牌,已脱敏bodyType:车身类型fuelType:燃油类型gearbox:变速箱power:发动机功率kilometers:汽车已行驶公里数notRepairedDamage:汽车有

  • Datawhale-Docker學習筆記03-數據管理2021-04-16 16:31:04

    Docker數據管理 這篇主要將docker data的概念釐清與介紹如何在 Docker 內部以及容器之間管理數據;在容器中管理數據主要有兩種方式:數據卷(Volumes)、掛載主機目錄 (Bind mounts) 鏡像來源 1 [root@docker01 ~]# docker pull registry.cn-beijing.aliyuncs.com/google_registry/n

  • Datawhale集成学习Task7-投票法2021-04-15 00:00:18

    Datawhale集成学习Task7-投票法 投票法的原理分析 这里以分类问题为例解释投票法的工作机理,假设我们有m个不同的分类器 { C 1 ,

  • DataWhale集成学习Task6--掌握分类问题的评估及超参数调优2021-03-29 23:59:47

    机器学习模型评估与超参数调优详解 文章目录 机器学习模型评估与超参数调优详解1. 用管道简化工作流方式1:make_pipline方式2:Pipeline两种方式的区别 2.使用k折交叉验证评估模型性能3. 使用学习和验证曲线调试算法4.通过网格搜索进行超参数调优SVM、SVC、SVR三者的区别 5.

  • 【datawhale-集成学习】 task05 基本的分类模型2021-03-28 00:01:17

    来吧鸢尾花~ 选择度量模型性能的指标 真阳性TP:预测值和真实值都为正例;真阴性TN:预测值与真实值都为正例;假阳性FP:预测值为正,实际值为负;假阴性FN:预测值为负,实际值为正; 分类模型的指标 准确率 分类正确的样本数占总样本的比例 A

  • Datawhale集成学习笔记:基本的分类模型2021-03-26 17:30:49

    使用sklearn构建完整的分类项目 1 . 收集数据集并选择合适的特征:在数据集上我们使用我们比较熟悉的IRIS鸢尾花数据集。 import pandas as pd from sklearn import datasets iris = datasets.load_iris() X = iris.data y = iris.target feature = iris.feature_names data =

  • DataWhale集成学习(上)——Task042021-03-23 20:03:28

    目录 (5)对超参数进行调优网格搜索随机搜索实例 (5)对超参数进行调优 参数与超参数 模型参数是模型内部分配置变量,根据数据进行估计模型超参数是模型外部的配置,其值无法从数据中估计。 常用的调参方法有以下两种: 网格搜索 思想:把所有超参数选择列出来做排列组合 class sklea

  • Datawhale开源集成学习笔记04-模型评估与超参数调优2021-03-22 23:58:20

    模型评估与超参数调优 参数与超参数 模型参数是模型内部的配置变量,其值可以根据数据进行估计。 - 进行预测时需要参数。 - 它参数定义了可使用的模型。 - 参数是从数据估计或获悉的。 - 参数通常不由编程者手动设置。 - 参数通常被保存为学习模型的一部分。 - 参数是机器学习

  • 【组队学习】【23期】Datawhale深度推荐模型2021-03-13 20:33:03

    深度推荐模型 开源内容:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel 基本信息 贡献人员:罗如意、吴忠强、田雨,宁彦吉, 何世福、徐何军、赖敏材、刘纪川学习周期:13天学习形式:理论+实践;完成学习打卡人群定位:了解机器学习基础, 了解推

  • DataWhale 零基础入门语义分割-地表建筑物识别-Task32021-02-26 22:01:06

    文章目录 语义分割模型发展一、FCN1.FCN主要特点2.反卷积(Deconvolutional)3.跳跃结构 二.SegNet三.Unet三.其他 语义分割模型发展 语义分割网络模型的发展:FCN 、SegNet、Unet、DeepLab、RefineNet、PSPNet、GAN 语义分割。本文主要以FCN 为重点进行分析 一、FCN FCN(F

  • Datawhale编程实践(LeetCode 腾讯精选练习50)Task142021-01-26 19:34:09

    1.数组中的第k个最大元素https://leetcode-cn.com/problems/kth-largest-element-in-an-array/       2.存在重复元素https://leetcode-cn.com/problems/contains-duplicate/       3.二叉搜索树中第k小的元素https://leetcode-cn.com/problems/kth-smallest-element-in-a-b

  • Datawhale编程实践(LeetCode 腾讯精选练习50)Task132021-01-25 20:35:53

    1.相交链表https://leetcode-cn.com/problems/intersection-of-two-linked-lists/ 看到这个题目没有理解示例1到底是什么意思,为什么都有1但相交的起始节点不是1那个点    后来知道了是要节点本身相等(不仅包括值还包括地址)。 看到官方的双指针法解答,感觉十分巧妙,长度分别为m和n

  • Datawhale组队学习21期_异常检测_Task5:高维异常2021-01-24 23:32:15

    异常检测——高维数据异常检测主要内容包括:Feature Bagging孤立森林 1、引言 在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。

  • DataWhale组队DAY3前沿2021-01-19 23:32:11

    任务 论文代码统计,统计所有论文出现代码的相关统计;使用正则表达式统计代码连接、页数和图表数据。 数据处理步骤 确定数据出现的位置;使用正则表达式完成匹配;完成相关的统计。 正则表达式 具体代码 # 导入所需的package import seaborn as sns #用于画图 from bs4 import B

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有