ICode9

精准搜索请尝试: 精确搜索
  • DataFrame 提取部分再转存为DataFrame2022-07-04 10:03:07

    DataFrame 提取一行后 就变成Series,DF的列(columns) 就变成Series的索引(index ),再保存到csv文件,格式就乱了 处理办法:将Series的value提取出来,变成list格式,用append()将所有提起的数据放在一起,再转成DataFrame格式,再添加原来的columns df = pd.read_csv('filename.csv') df1 = [

  • DataFrame数据处理--删除列2022-07-03 17:34:49

    原数据中第2,4,6。。。列没有用,需要删除 filename = 'Pnt_210101000000_page27' df = pd.read_csv(name+'.csv') # 删除第一行 单位符号 #df.drop(index=0, inplace = True) # 区power 列 #print(df.loc[:,'Power']) # 取第2列 #print(df.iloc[:,1]) lie = df.columns df.d

  • 20220703 爬虫&数据处理2022-07-03 13:32:40

    1、 昨天已经获取到数据,今天发现dataframe数据单列数据存储在一行中,分列不太好分,我上网查了下。从列表转换为dataframe,正常是存储为一行,需要转置下发现确实变成逗号分开的形式了。代码如下: data = get_data() df = pd.DataFrame(data=[data],index=['a']).T print(df.head()) 如

  • 机器学习-感知机模型2022-07-02 12:33:07

    一、引言   单层感知机是神经网络的一个基本单元,类似于人类的神经网络的一个神经元,神经网络是由具有适应性的简单单元(感知机)组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。感知机可以理解为对输入进行处理,并得到输出结果的机器。我们

  • pandas数据结构2022-07-01 15:33:53

    1.Series是一种类似于一维数组的对象,它由一组数据和索引组成 1.1 仅有数据列表即可产生最简单的Series import pandas as pd s1 = pd.Series([1,'a',5.2,7]) print(s1) - 操作 s1.index##获取索引 #RangeIndex(start=0, stop=4, step=1) s1.values #array([1, 'a', 5.2, 7], d

  • pandas读取文件2022-07-01 15:05:31

    首先导入库 import pandas as pd 1. 读取纯文本文件 1.1 pandas读取文件csv文件: csv = "xxx/xxx/xxx.csv" pd.read_csv(csv) - 基础操作: df.head() ##查看前面五行数据 df.shape ##查看数据形状(行数,列数) df.columns ##查看列名列表 df.index ##查看索引列 df.dtypes ##查看

  • df.where的用法总结2022-07-01 14:32:00

    1、pd.Series( ).where( cond ) 可以过滤不满足cond的值并赋予NaN空值 s = pd.Series(range(5)) s.where(s > 0) 0 NaN 1 1.0 2 2.0 3 3.0 4 4.0 2、pd.Series( ).mask(cond) 使用时,结果与where相反 s.mask(s > 0) 0 0.0 1 NaN 2 NaN 3 NaN 4 NaN 3

  • 效率效率!如何使用Python读写多个sheet文件2022-06-29 22:32:10

    前言 怎么样使用Python提高自己的工作效率,今天就给大家分享这个吧。 我们经常用pandas读入读写excel文件,经常会遇到一个excel文件里存在多个sheet文件,这个时候,就需要一次性读取多个sheet的数据并做相应的数据分析或数据处理,最后再写入新的excel文件(同样是多个sheet)。本文即介

  • DataFrame上次符合条件的行索引2022-06-29 19:34:43

    大佬1 import pandas as pd import numpy as np df = pd.DataFrame(np.random.random((10,3)), columns = ['A', 'B', 'C']) def _get_last_index(arr): res = arr[arr>0.5].index # get all index if len(res) == 0: # if there's

  • python的pandas读取excel文件中的数据2022-06-29 19:00:24

    一、读取Excel文件   使用pandas的read_excel()方法,可通过文件路径直接读取。注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件、并同时指定sheet下的数据。可以一次读取一个sheet,也可以一次读取多个sheet,同时读取多个sheet时后续操作可能不够方便

  • docker 查看容器占用磁盘大小2022-06-29 14:34:28

    命令:docker system df 查看 每个 image、container 详细大小:docker system df -v  

  • 总结出现问题后应该考虑到的点2022-06-27 00:03:45

    1、节点出现问题,一定首先要看硬盘(df)以及内存(free -m) 一定要看!!!   2、抓包工具启动的过程中(Charles)会影响某些连接,可能会产生许多奇怪的问题   3、当查询到的数据与数据库中的数据不一致的情况下,首先考虑缓存(缓存是否与数据库中的数据不一致了)

  • DataFrame计算上次符合条件到现在的位置2022-06-26 09:00:15

    想实现类似通达信BARSLAST 上次条件成立到现在的位置 得到大佬帮助,帮我写了以下代码 import pandas as pd import numpy as np df = pd.DataFrame(np.random.random((10,4)), columns = ['A', 'B', 'cond', 'D']) # 让 cond 列变成 True/False df.cond

  • 数据可视化练习(2)2022-06-24 21:37:17

    任务二:多个饼图呈现各省份不同等级住宿场所占比 企业消费平台为了更好地发展企业业务,向企业客户推荐符合其定位的协议住宿场所,需要分析上题中Top5省份的“三星级/舒适”、“四星级/高档”和“五星级/豪华”住宿场所以及“其它类别”住宿场所(除上述三类外,其余类型住宿场所均归为“

  • sns中的displot的模仿2022-06-24 20:32:03

    弗里德曼-迪亚科尼斯规则 在统计学中,Freedman-Diaconis规则用于确定直方图中的条柱宽度, 它以David A.Freedman和Persi Diaconis的名字命名。该规则定义: \[条柱宽度 = 2 \times \frac{IQR}{\sqrt[3]{n}} \]其中,IQR是四分位距,n是观测样本数目。 import numpy as np import pandas a

  • 基于LSTM的多变量多输出温湿度预测2022-06-24 18:34:30

    基于LSTM的多变量多输出温湿度预测 1、模块导入 import tensorflow as tf import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np import os import pandas as pd import seaborn as sns from sklearn.model_selection import train_test_split from skle

  • 20220402help2022-06-23 09:34:59

    1 import xlrd 2 import xlsxwriter 3 import os 4 import pandas as pd 5 6 # 文件夹名称 7 path = "linshi/" 8 9 # 获取文件目录 10 files = os.listdir(path) 11 print(files) 12 13 print(len(files)) 14 15 # 读取第一个表格 16 data = pd.read_excel(path +

  • python数据处理:获取Dataframe中的一列或一行2022-06-22 14:03:24

    解决方案 df['w'] #选择表格中的'w'列,使用类字典属性,返回的是Series类型 df.w #选择表格中的'w'列,使用点属性,返回的是Series类型 df[['w']] #选择表格中的'w'列,返回的是DataFrame属性 data[0:2] #返回第1行到第2行的所有行,前闭后开,包括前不包括后 data[1:2] #返回第

  • 数据可视化练习(1)2022-06-21 19:03:38

    MySQL数据库中的相关数据集包含了城市、省份、评分、评论数等多项基础信息字段。请使用Flask框架,结合Echarts完成下列题目。数据库账号:root     密码:123456        库名:hotel 自行创建代码工程路径为:C:\s_hotel 任务一:条形图呈现住宿场所订单量住宿场所订单量是反映住宿场所

  • DataFrame转换为字典2022-06-20 09:31:45

    该to_dict()方法将列名设置为字典键将“ID”列设置为索引然后转置DataFrame是实现此目的的一种方法。to_dict()还接受一个’orient’参数,您需要该参数才能输出每列的值列表。否则,{index: value}将为每列返回表单的字典。 可以使用以下行完成这些步骤: >>> df.set_index('ID').T.to

  • 磁盘管理2022-06-18 16:03:32

    磁盘管理 概述 Linux磁盘管理好坏直接关系到整个系统的性能问题。 Linux磁盘管理常用命令为 df、du。 df df命令参数功能:检查文件系统的磁盘空间占用情况。可以利用该命令来获取硬盘被占用了多少空间,目前还剩下多少空间等信息。 语法: df [-ahikHTm] [目录或文件名] 选项与参

  • pandas时间处理2022-06-18 13:31:23

    运行环境为 windows系统,64位,python3.5。 1 读取并整理数据 #首先引入pandas库 import pandas as pd #从csv文件中读取数据 df = pd.read_csv('date.csv', header=None) print(df.head(2))  输出             0  1 0  2013-10-24  3 1  2013-10-25  4 整理数据 df.colu

  • 特征工程-12022-06-18 00:31:46

    一、特征工程 对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。 以下主要针对结构化数据和

  • python 读写excel2022-06-17 08:32:22

    读取excel中的内容 def get_app_service(): df = pd.read_excel("test.xlsx",sheet_name='test') #读取excel对应的sheet data = list(df['service']) #读取一列 # print(data) return data 写数据到excel,生成新的excel writer = pd.ExcelWriter

  • 数据缺失处理的一些技术2022-06-13 21:02:51

    本文参考自:https://www.kaggle.com/code/residentmario/simple-techniques-for-missing-data-imputation/data 数据亦来源该页 样本中的数据缺失是ML界非常常见的问题,本文就这问题进行讨论。 使用 MissingNo 查看数据 import pandas as pd import numpy as np import tensorflow a

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有