ICode9

精准搜索请尝试: 精确搜索
  • 工业时序大数据质量管理2021-04-08 22:52:13

    工业时序大数据质量管理 丁小欧,王宏志,于晟健 哈尔滨工业大学海量数据计算研究中心,黑龙江 哈尔滨 150001 摘要:工业大数据已经成为我国制造业转型升级的重要战略资源,工业大数据分析问题正引起重视和关注。时序数据作为工业大数据中一种重要的数据形式,存在大量的数据质量问题,需要设计

  • 数据管护技术及应用2021-04-08 22:51:43

    数据管护技术及应用 于明鹤1,2, 聂铁铮3, 李国良4 1 东北大学软件学院,辽宁 沈阳 110169 2 广东省普及型高性能计算机重点实验室,广东 深圳 518060 3 东北大学计算机科学与工程学院,辽宁 沈阳 110169 4 清华大学计算机科学与技术系,北京 100084 摘要:为了对海量数据进行充分和有效的处理

  • 机器学习实战_1_01_数据清洗、随机森林模型训练2021-04-01 17:35:25

     内容简介:   利用随机森林方法训练数据集,预测泰坦尼克号哪些人可以获救,主要过程如下: step1:加载源数据集 step2: 数据清洗 step3:进行特征构建 step4:特征构建(2)基于scikit-learn中的LabelEncoder() step5:特征选择 step6:获取训练集和测试集 step7:随机森林算法实现 代码在jupyter n

  • ​一文看懂数据清洗:缺失值、异常值和重复值的处理2021-03-27 08:51:09

    01 数据列缺失的4种处理方法数据缺失分为两种:一种是行记录的缺失,这种情况又称数据记录丢失;另一种是数据列值的缺失,即由于各种原因导致的数据记录中某些列的值空缺。不同的数据存储和环境中对于缺失值的表示结果也不同,例如,数据库中是Null,Python返回对象是None,Pandas或Numpy中是NaN。

  • 使用python进行数据清洗及ols回归分析2021-03-02 22:00:35

    本文使用jupyter平台进行回归分析,相比pycharm而言,jupyter可分布查看各个步骤结果,能及时发现问题 import pandas as pd from matplotlib import pyplot as plt from sklearn.linear_model import LinearRegression import statsmodels.api as sm import numpy as np # 1、读取

  • 知乎数据清洗整理与结论研究2021-02-26 23:35:30

    【项目名称】  知乎数据清洗整理和结论研究 【项目要求】 1、数据清洗 - 去除空值 要求:创建函数   2、问题1:知友全国地域分布情况,分析出TOP20 要求: ① 按照地域统计 知友数量、知友密度(知友数量/城市常住人口) ② 知友数量,知友密度,标准化处理,取值0-100,要求创建函数 ③ 通

  • 地表建筑物识别-异常数据的清洗2021-02-23 23:03:18

    地表建筑物识别-异常数据的清洗 1.将建筑物占比ratio加入到train_mask.csv中2.统计ratio在特定区间的图片数量3.可视化异常数据4.读取筛选完的数据5.总结 文件结构 utils.py eval.py model.py dataset.py 数据集 |----test_a(文件夹) |----train(文件夹) |----test

  • 基于pandas的数据清洗2021-02-07 13:36:00

    数据清洗 1、处理空值:过滤,删除,填充 2、处理重复数据:.drop_duplicates(keep = 'first') 删除重复行 3、处理异常值:异常值(极值等)可以用均值去替换   1、空值 1.1 空值的区别 pandas里头有两种空值类型 type(None)   # NoneType  None不可以参与运算, type(np.nan)  # float  N

  • 8个Python数据清洗代码,拿来即用2021-01-25 10:01:31

    不管你承不承认,数据清洗着实不是一件简单的任务,大多数情况下这项工作是十分耗时而乏味的,但它又是十分重要的。   如果你经历过数据清洗的过程,你就会明白我的意思。而这正是撰写这篇文章的目的——让读者更轻松地进行数据清洗工作。   事实上,我在不久前意识到,在进行数据清洗时,有

  • 央央家政:保洁服务有哪些?2021-01-22 21:57:22

    服务内容:1、开荒保洁:新居室装潢后保洁清洗,旧房全方位大扫除保洁,别墅、办公楼、厂房、会所、学校、宾馆、酒楼室内清洗、日常保洁、深度保洁。2、甲醛治理加检测:专业空气净化、除异味、甲醛检测、除甲醛、消毒杀菌、专业设备、专业人员、签正规合同、终身质保、出具正规CMA检测

  • 新能源汽车热度追踪系统2021-01-20 11:33:27

    随着特斯拉超级工厂的产能不断爬坡,一方面让马斯克登上了世界首富的宝座,另一方面特斯的互联网打法,不断降价的策略,从另一个方面提高了中国新能源汽车市场的竞争强度。 最近更是有部分车厂也学着手机的做法,以期货的形式发布1000公里的车型,广汽的石墨烯电池更是说8分钟快充(这套路

  • 脏数据+清洗数据2021-01-12 16:36:27

    什么是脏数据? 数据仓库中的数据是面向某一个主题的数据集合,这些数据从多个业务系统中抽取,并且存在历史数据。这样就避免不了存在数据错误、数据冲突。这些错误数据和冲突数据就被称为脏数据。比如:不完整的数据、错误的数据、重复的数据。   洗数据:发现并纠正数据文件中可识别的错

  • 清洗豆瓣数据2021-01-07 20:33:19

    text1 = '''<ol class="grid_view"> <li> <div class="item"> <div class="pic"> <em class="">1</em>

  • 2021年G3锅炉水处理考试技巧及G3锅炉水处理模拟考试题库2021-01-02 22:31:52

    题库来源:安全生产模拟考试一点通公众号小程序 2021年G3锅炉水处理考试技巧及G3锅炉水处理模拟考试题库,包含G3锅炉水处理考试技巧答案和解析及G3锅炉水处理模拟考试题库练习。由安全生产模拟考试一点通公众号结合国家G3锅炉水处理考试最新大纲及G3锅炉水处理考试真题汇总,有助于G3

  • 数据清洗2020-12-29 10:01:07

    数据清洗:过滤脏数据,解析字段结构化,数据加上一些默认值,给数据添加某些字段,把数据分类,给数据脱敏,给数据加密,修改数据的存储结构... 可以用什么技术? mr hive(udf) spark core 如何选择 ? mr 好处稳定性高,如果数据量非常的大,考虑用mr做清洗 hive 的udf 就是mr的maptask,也不会运行reduceta

  • 域名被污染解决方法及DNS污染清洗方法2020-12-29 09:02:41

    域名被污染解决方法及NDS污染清洗方法 最近宋九九博客发现网赚行业及seo行业的很多网站都被污染了,很不幸宋九九也有域名被污染了,这里分享下常用的解决方法。方法只能缓解,一般域名被污染后就废了,下面的方法仅供参考。 域名被污染解决方法及DNS污染清洗方法 第1张 1,域名清洗 这

  • 7.数据清洗2020-12-27 10:02:34

    以此为例 一.重复数据处理 1.drop_duplicates 参数名 接收 意义 默认 subset String / sequence 去重的序列 None(全部列) keep String 重复时保留第几个数据first :保留第一个last :保留最后一个false :不保留 first(保留第一个) inplace Boolean 是否在原表上操作 False

  • Python 7种超实用的数据清洗方法,这你一定要掌握2020-12-16 19:35:49

    数据清洗是数据分析的必备环节,在进行分析过程中,会有很多不符合分析要求的数据,例如重复、错误、缺失、异常类数据。 一、 重复值处理 数据录入过程、数据整合过程都可能会产生重复数据,直接删除是重复数据处理的主要方法。pandas提供查看、处理重复数据的方法duplicated和drop_dupli

  • 2021年G3锅炉水处理新版试题及G3锅炉水处理免费试题2020-12-15 22:29:26

    题库来源:安全生产模拟考试一点通公众号小程序 2021年G3锅炉水处理新版试题及G3锅炉水处理免费试题,包含G3锅炉水处理新版试题答案和解析及G3锅炉水处理免费试题练习。由安全生产模拟考试一点通公众号结合国家G3锅炉水处理考试最新大纲及G3锅炉水处理考试真题汇总,有助于G3锅炉水处

  • 使用Mysql工具进行数据清洗2020-12-04 23:00:25

    数据资源 https://gitee.com/pingfanrenbiji/resource/blob/master/%E9%87%91%E8%9E%8D%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/%E7%AC%AC%E4%B8%80%E7%AB%A0/database1/transaction_info.csv 将csv导入数据库 一路continue 有一份追加数据 https://gitee.

  • 2020年G3锅炉水处理考试题及G3锅炉水处理复审模拟考试2020-11-29 22:01:13

    题库来源:安全生产模拟考试一点通公众号小程序 2020年G3锅炉水处理考试题及G3锅炉水处理复审模拟考试,包含G3锅炉水处理考试题答案和解析及G3锅炉水处理复审模拟考试练习。由安全生产模拟考试一点通公众号结合国家G3锅炉水处理考试最新大纲及G3锅炉水处理考试真题汇总,有助于G3锅炉

  • 客户真的是喜欢廉价产品吗?2020-11-25 14:28:48

    大家好,我是一名工业清洗行业内名不见经传的普通销售工程师,从2010年踏入超声波清洗设备领域,从组装电工学徒做起,后来做过班长,做过售后服务,从12年开始自己的销售学习之路。前面走过的路蜿蜒曲折,磕绊良多,绝大部分的客户都有选择性困难症,这个问题不在于客户,而在于我们的企业。 这两天

  • 天猫美妆数据清洗步骤概括2020-10-20 13:00:49

    一、天猫美妆数据清洗步骤概括 01 准备工作 # 导入数据 data=pd.read_csv('双十一淘宝美妆数据.csv') 02 检查数据 对数据进行初步的了解 查看数据的相关特征,对数据进一步分析 # 查看前五行数据 data.head() # 查看数据集的特征 data.info() # 查看数据量 data.shape # 查看

  • 让数据处理更简单?百度EasyData推出首个高级智能数据清洗功能2020-09-08 07:08:11

    在进行AI模型开发时,数据的数量与质量直接影响模型效果。在实地数据采集之后,企业往往需要从大量数据中筛选出符合训练要求的相关数据,剔除质量差或不相关的数据,这个步骤被称为数据清洗。通常来讲,在清洗数据时主要会清理掉对训练任务没有用途的数据,例如在训练工厂工人佩戴安全帽识别模

  • Python 3爬虫、数据清洗与可视化实战PDF高清完整版免费下载|百度云盘2020-07-22 14:34:33

    百度云盘:Python 3爬虫、数据清洗与可视化实战PDF高清完整版免费下载 提取码:                 内容简介 《Python 3爬虫、数据清洗与可视化实战》是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python 读物。《Python 3爬虫、数据清洗与可视化

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有