ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python基础-python处理数据

2020-12-22 10:58:39  阅读:150  来源: 互联网

标签:item python data 处理 file time print datalist 数据


1、数据排序,python有两种选择。原地排序,排序后的数据替换原来的数据,原来的顺序会丢失,对于列表,sort()方法提供原地排序;复制排序,返回原数据的有序副本,原数据的顺序依然保留,sorted()支持复制排序。

2、数据排序示例

#filename列表形式文件名
def deal_file(filename):
    datalist=[]
    try:
        for item_name in filename:
            #rb:读二进制模式
            with open(item_name,'r') as out_file:
                for item in out_file: #取出整个文件数据
                    print(item)
                    #.split(',')生成列表
                    #item.strip().split(',') 方法串联
                    datalist.extend(item.strip().split(',')) #extend列表合并
                #data=out_file.readline() #readline只能读取一行数据
                #print(data)           
    except IOError as err:
        print('file error:'+str(err))
    print(datalist)
    #统一时间格式
    new_data=[]
    for str_time in datalist:
        new_data.append(deal_time(str_time))
    
    print(new_data)
    #对数据列表排序(函数串联)
    print(sorted(new_data))
#处理时间函数(统一格式,将-或:替换成.):3:4->3.4;3-4->3.4
def deal_time(time_string):
    if '-' in time_string:
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        splitter='.'
    (mins,secs)=time_string.split(splitter)
    #补位数
    if len(mins)<2:
        mins='0'+mins
    if len(secs)<2:
        secs='0'+secs
    return (mins+'.'+secs)

3、排序方法示例代码修改,简化统一时间格式调用(使用列表推导)

#filename列表形式文件名
def deal_file(filename):
    datalist=[]
    try:
        for item_name in filename:
            #rb:读二进制模式
            with open(item_name,'r') as out_file:
                for item in out_file: #取出整个文件数据
                    print(item)
                    #.split(',')生成列表
                    #item.strip().split(',') 方法串联
                    datalist.extend(item.strip().split(',')) #extend列表合并
                #data=out_file.readline() #readline只能读取一行数据
                #print(data)           
    except IOError as err:
        print('file error:'+str(err))
    print(datalist)
    #统一时间格式
    new_data=[deal_time(str_time) for str_time in datalist]
    print(new_data)
    #对数据列表排序(函数串联)
    print(sorted(new_data))
​

[sort()与sorted()方法默认升序排序,若想要进行降序排序,需要传入参数reverse=True]  

4、使用集合删除重复项,集合中的数据项是无序且不允许重复的。

datalist=[10.6,11,6,10.6,10]
distances=set(datalist)
print(distances)
>>>输出结果
{10, 10.6, 11, 6} #直接会去掉重复的10.6

此目录会不定期更新,喜欢我的文章希望和我一起成长的宝宝们,可以搜索并添加公众号TryTestwonderful ,或者扫描下方二维码添加公众号

标签:item,python,data,处理,file,time,print,datalist,数据
来源: https://blog.csdn.net/HXiao0805/article/details/111514091

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有