ICode9

精准搜索请尝试: 精确搜索
  • 多个list合成一个dataframe2022-01-06 17:31:22

    #定义空的list存放每次循环的表 ls=[] #对不同时间做循环 for t in testdata['Time'].drop_duplicates(): #给定时间条件 tmp = testdata[testdata['Time']==t] #提取这一时刻出现的所有ID([[]]才会生成表格) tmp1=tmp[['ID']] #设定临时列 tmp1['tm

  • pandas读取大文件tsv方法2022-01-06 17:06:26

    import pandas as pd df = pd.read_csv("test.tsv", dilimiter = '\t') tsv文件与csv文件的区别为前者是以\t为分隔符,后者是以,为分隔符,所以读取tsv文件时,只需要把分隔符dilimiter设置为\t即可

  • Jupyter中显示数据data时只显示省略号不显示完整数据2022-01-06 15:36:00

    在开头导入pandas后加入以下: #设置行不限制数量pd.set_option(‘display.max_rows’,None) #设置列不限制数量pd.set_option(‘display.max_columns’,None) #设置value的显示长度为100,默认为50pd.set_option(‘max_colwidth’,100)

  • 去哪儿网数据分析2022-01-05 20:31:32

    import pandas as pd import numpy as np df=pd.read_csv('C:/Users/15451/data/1.csv') df df.info() df[df.价格<1000] df[(df.价格<1200)&(df.出发地=='成都')] df[df.价格.between(1000,2000)].sort_values(by='价格') df.groupby('

  • 二手房数据预处理与分析2022-01-05 20:30:32

    import pandas as pd import numpy as np df=pd.read_table('data\lianjiahouselist.txt',sep=';') df.columns=['编号','省','市','区县','位置','详细地址','单价','总价','户型&

  • 情感分析2022-01-05 17:39:27

    采用nlp字典分析的方法 import pandas as pd from snownlp import SnowNLP from snownlp import sentiment import matplotlib.pyplot as plt df=pd.read_csv('D:\\毕设相关\\评论.csv',header=None,usecols=[7]) contents=df.values.tolist() print(len(contents)) score=[

  • 联想推出 YOGA 14c 锐龙版评测2022-01-05 13:01:35

    联想推出 YOGA 14c 锐龙版采用 14 英寸 1920x1080 分辨率,72% NTSC 高色域,支持 360° 自由翻转,支持 10 点触控,标配 4096 级压感手写笔,支持息屏笔记功能,支持屏幕亮度智能调节,DC 调光无频闪,支持杜比视界。联想推出 YOGA 14c 锐龙版怎么样http://www.adiannao.cn/dy 此外,该机轻约 1.41

  • paralles desktop设置静态ip2022-01-03 23:33:31

    由于第一次使用paralles desktop(下面简称PD)设置静态ip,所以遇到的一些问题,在此记录下。 系统:centos7.4 虚拟机:PD 1.PD虚拟机下的centos7是没有eth33这个网卡设备的,而VMWARE有(印象中),导致刚开始一直为找不到eth33而烦恼。PD下是eth0,至于为什么,暂时不知道,后面深入研究。     2.PD虚

  • Pandas学习(一)2021-12-31 18:36:17

    首先需要安装pandas库 cmd打开命令行窗口输入 pip install pandas 1)这里以excel文件为例,先读取一个excel文件 import pandas as pd data=pd.read_excel("A.xlsx",sheet_name='监测点A逐日污染物浓度实测数据') data.head(10) 2)修改表的列名,删除无用列 data = data.drop(["地

  • pandas中时间戳转日期时区问题2021-12-29 18:37:12

    使用pandas将时间戳数字转为日期格式,发现和当前时间相差8小时,是时区不对导致的 下面提供两种解决方法: 使用tz_localize和tz_convert方法 import time import pandas as pd now_time = time.time() pd.Timestamp(now_time, unit='s').tz_localize('UTC').tz_convert("Asia/Sha

  • 利用python进行数据分析(2)2021-12-29 14:02:43

    第七章数据清洗与准备 7.1 处理缺失值 pandas对象的所有描述性统计信息默认情况下是排除缺失值的。对于数值型数据,pandas使用浮点值NaN(Not a Number来表示缺失值)。在pandas中,我们采用了R语言中的编程惯例,将缺失值成为NA,意思是not available(不可用) string_data = pd.Series(['

  • 调度器23—EAS2021-12-27 22:37:05

    基于 Linux-5.10 一、EAS概述 EAS在CPU调度领域,在为任务选核是起作用,目的是保证性能的情况下尽可能节省功耗。其基于的能量模型框架(EnergyModel (EM) framework)是一个通用的接口模块,该模块连接了支持不同 perf level 的驱动模块和系统中的其他想要感知能量消耗的模块。其中这里说

  • Python数据分析与处理——处理中国地区信息2021-12-27 19:03:55

    预处理地区信息 2.1数据的爬取 代码: import pandas as pd data=pd.read_csv("example_data.csv",header=1) print(data) data1=pd.read_csv("北京地区信息.csv",header=1,encoding='gbk') data2=pd.read_csv("天津地区信息.csv",encoding='gbk')

  • 自动升降压PD快充方案 30W快充TYPE-C方案2021-12-27 13:06:17

    在许多应用场合,都需要将低电压升至适合用电设备使用的较高电压。如单节和双节锂电池供电电路,常需要将其2.8~4.2V的低电压升至可供使用的5V,9V,12V,甚至更高的电压。再如双节锂电池6.0V-8.4V电压升压到9V,12V,15V,20V,24V等电压给手机进行快速充电,也就是当前的PD快充解决方案。12V输

  • Python文件路径相关问题2021-12-26 18:35:15

    1,有时看类似pd.read_excel( ), pd.read_csv( )中路径写的不完整,不是绝对路径,就很纳闷,为什么能读取到正确的文件呢? 网友A分享:如果你的excel文件跟py文件在一个文件夹,那就直接写excel文件的名字,不然就要写路径名了,这里有两种方法,一种是绝对路径,一种是相对路径。  

  • pandas pickle不能保存DataFrame的name属性2021-12-25 21:06:44

    Pandas Series和Dataframe有name属性 通过pickle存储后再取回后,Dataframe的name属性会丢失,Series的name属性不会丢失; 如: import pandas as pd obj=pd.DataFrame({1:[11,22,33],2:[44,55,66]}) obj.name='test1' obj.index.name='test' obj.to_pickle('ls') obj_read_pi

  • 容斥原理2021-12-24 23:05:56

    容斥原理 原型 求n个相交的集合的元素总个数 原理 例如: 证明 设元素x在所有集合中出现了k次,然后写出等式,应用组合数恒等式 例题 给定一个整数 n 和 m 个不同的质数 p1, p2, …,pm。 请你求出 1∼n 中能被 p1, p2, …,pm 中的至少一个数整除的整数有多少个。 例子 如何计算? 设

  • python tips系列1——pandas的map函数2021-12-23 10:03:15

    前言 大家在使用pandas的时候,大部分可能就是一些匹配关系,主要也就是使用merge函数之类的。但是有时候在匹配的时候,并不需要使用merge的函数,使用别的函数也是可以做到,今天也就是给大家分享一个找BOSS的代码。 问题 有这样的一个数据,这个数据的第一列是员工的ID,第二列是员工的N

  • 【pandas】笔记2021-12-20 22:00:24

    【pandas】笔记 一、什么是pandas?二、Series创建二、Series索引与值三、pandas之读取外部数据四、pandas之DataFrame五、pandas之loc、iloc六、bool索到和缺失数据的处理七、分组聚合 一、什么是pandas? 一个在Python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科

  • 统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。2021-12-20 11:02:49

    3.统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。 第一个 这个和第一个非常相似,难点在于需要将出生年月转化为年龄。 data = data.copy() data['年龄'] = [dt.datetime.today().year - i.year for i in pd.to_datetime(data["出生年月"])] 如果不添加data.copy()会报错 S

  • SHELL编程练习题(一)2021-12-20 11:02:12

    1、编写脚本 systeminfo.sh,显示当前主机系统信息,包括:主机名,IPv4地址,操作系统版本,内核版本,CPU型号,内存大小,硬盘大小; [10:03:37 root@sh-pd-crm-sit-102 data]# cat systeminfo.sh #!/bin/bash # ------------------------------------------------- # FileName: systeminfo.sh

  • Pandas数据结构简要概述2021-12-19 19:00:39

    Pandas数据结构 Series数据结构 Series是什么 Series是一种类似于一维数组的对象, 由一组数据及一组与之相关的索引 组成。 创建一个Series 创建一个Series利用的方法是pd.Series(), 通过给Series()方法传入不同的对象即可实现。 传入一个列表 import pandas as pd ​ S1 =pd.Seri

  • 处理 pandas数据中 批量创建多列并写入excel的 case2021-12-19 17:31:15

    背景:得到账单数据,需要对其进行处理,针对其中一个列进行字符拆分并生成新列: 需要在 列 L、M、N...对费用明细这一列拆分:如下图所示 思路如下 第一步:对费用明细这一列 先取出字符,然后用正则取出 费用明目,即我们要创建新列的 columns; 第二步:因为最后生成的dateframe ,字典是可以生成

  • python批量获取基金定期报告2021-12-18 19:00:39

    import pandas as pd import numpy as np import os import urllib import requests from fake_useragent import UserAgent import json import time def getpdfurl(codes,sdate,edate): sdate = pd.Timestamp(sdate).strftime('%Y-%m-%d')#用pandas库把输入时间转化成标准格

  • pandas数据处理学习笔记(三)2021-12-17 16:58:19

    导入模块 import pandas as pd import numpy as np 1.删除重复元素 创建一个包含重复元素的DataFrame对象 #创建一个包含重复元素的DataFrame对象 dframe = pd.DataFrame({'color':['w','w','r','r','w'], 'value':

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有