ICode9

精准搜索请尝试: 精确搜索
首页 > 数据库> 文章详细

Python中实现SQL中窗口函数lag

2021-07-27 17:05:08  阅读:304  来源: 互联网

标签:Python lag daytime df time file SQL day dir


Python的 shift

代码示例

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-

import os.path
import pandas as pd
from datetime import datetime

if __name__ == "__main__":
    top_file_dir = r"C:\Users\filter"
    according_dir = [
        datetime.strptime(file_name.split("_")[-1], '%Y%m%d%H%M') for file_name in os.listdir(top_file_dir)
        if os.path.isdir(os.path.join(top_file_dir, file_name)) and file_name.startswith("test")]
    calculate_dir = sorted(according_dir, reverse=False)
    dat_time = sorted(according_dir)
    all_daytime_df = pd.DataFrame({'day_time': sorted(dat_time)})
    # 窗口函数 .LEAD(col,n,DEFAULT) 用于统计窗口内往下第n行值
    # daytime_df['lag_day'] = daytime_df.shift(-1).fillna(0).astype('')
    all_daytime_df['lag_day'] = all_daytime_df.shift(-1)
    # pandas计算时间差
    all_daytime_df['interval_day'] = (all_daytime_df['lag_day'] - all_daytime_df['day_time']).dt.seconds/60
    file_start_time = all_daytime_df.loc[:, "day_time"][[0]]
    # 数据筛选
    file_filter_time = all_daytime_df['lag_day'][all_daytime_df['interval_day'] > 20]
    # Series 时间转字符串
    res = pd.concat([file_start_time, file_filter_time]).apply(lambda x: "test"+x.strftime("%Y%m%d%H%M")+".json")
    out_file = os.path.join(top_file_dir, "J_DAT_json_name.txt")
    res.to_csv(out_file, header=False, index=False)

标签:Python,lag,daytime,df,time,file,SQL,day,dir
来源: https://www.cnblogs.com/ytwang/p/15066828.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有