ICode9

精准搜索请尝试: 精确搜索
  • python:DataFrame对单列或多列进行整列的运算(map, apply, transform, agg)2021-03-25 10:31:09

    参考:https://blog.csdn.net/zwhooo/article/details/79696558  Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)   1.单列运算 在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作: df['col2'] = df['col1'].map(lambda x: x**2) 其中lamb

  • pyspark udf传入固定参数2021-03-08 19:02:40

    1. udf 定义 def udf_test(column1, column2): if column1 == column2: return column1 else: return column2 apply_test = udf(udf_test, StringType()) df = df.withColumn('new_column', apply_test('column1', 'column2

  • Hive高级函数2021-03-04 14:01:06

    GROUPING SETS可以实现在一个SQL语句中对多个维度同时做聚合计算,省去了对多个聚合结果UNION ALL的操作,非常方便。 with a as ( select 'a' col1,'aa' col2,1 num union all select 'a' col1,'ab' col2,2 num union all select 'a' col1,'ab' col2,3 num

  • 303. 区域和检索 - 数组不可变 & 304. 二维区域和检索 - 矩阵不可变 -leetcode刷题(C++)2021-03-03 12:33:06

    一、题目 303. 区域和检索 - 数组不可变 304. 二维区域和检索 - 矩阵不可变 二、分析 由于最多会调用 10^4次 sumRange 方法,所以在sumRange中计算数组的区域和,时间复杂度会非常高,于是乎这道题的目的就是让在构造函数中进行一些操作,使得每次调用sumRange函数时间复杂度降下来

  • leetcode 304.二维区域和检索 - 矩阵不可变2021-03-02 23:32:31

    leetcode 304.二维区域和检索 - 矩阵不可变 题干 给定一个二维矩阵,计算其子矩形范围内元素的总和,该子矩阵的左上角为 (row1, col1) ,右下角为 (row2, col2) 。 上图子矩阵左上角 (row1, col1) = (2, 1) ,右下角(row2, col2) = (4, 3),该子矩形内元素的总和为 8。 示例: 给定

  • Leetcode 304. 二维区域和检索 - 矩阵不可变2021-03-02 09:05:11

    题目描述 给定一个二维矩阵,计算其子矩形范围内元素的总和,该子矩阵的左上角为 (row1, col1) ,右下角为 (row2, col2)。 示例: 给定 matrix = [ [3, 0, 1, 4, 2], [5, 6, 3, 2, 1], [1, 2, 0, 1, 5], [4, 1, 0, 1, 7], [1, 0, 3, 0, 5] ] sumRegion(2, 1, 4, 3) -> 8 sumRegion(

  • [LeetCode] 304. Range Sum Query 2D - Immutable2021-03-02 02:05:20

    Given a 2D matrix matrix, find the sum of the elements inside the rectangle defined by its upper left corner (row1, col1) and lower right corner (row2, col2). The above rectangle (with the red border) is defined by (row1, col1) = (2, 1) and (row2, col2)

  • MySQL 覆盖索引详解2021-01-30 21:59:53

    什么是覆盖索引 创建一个索引,该索引包含查询中用到的所有字段,称为“覆盖索引”。 使用覆盖索引,MySQL 只需要通过索引就可以查找和返回查询所需要的数据,而不必在使用索引处理数据之后再进行回表操作。 覆盖索引可以一次性完成查询工作,有效减少IO,提高查询效率。 使用示例 查询

  • Mysql-Explain参数详解(尚硅谷-周阳)2021-01-26 09:32:10

    系统在某些时刻存在响应缓慢,开启了慢查询,发现有许多查询缓慢的SQL, 这里想着优化一下查询,奈何技术不扎实,花了些时间系统学习了下SQL调优基本分析,这里记录一下。参考B站周阳-https://www.bilibili.com/video/BV1KW411u7vy?p=46&t=8   哪些情况下适合建立索引      哪些情况不要

  • ShardingSphere分库分表2-ShardingJDBC实战2021-01-12 17:30:57

    文章目录 一、ShardingSphere二、ShardingJDBC实战1、核心概念:2、测试项目介绍3、快速实战4、ShardingJDBC的分片算法5、ShardingSphere的SQL使用限制6、分库分表带来的问题7、分库分表方案设计实战 一、ShardingSphere ​ ShardingSphere是一款起源于当当网内部的应用

  • 2020-12-122020-12-12 10:57:07

    RDD vs DataFrames vs DataSet 在SparkSQL中Spark为我们提供了两个新的抽象,分别是DataFrame和DataSet。他们和RDD有什么区别呢?首先从版本的产生上来看: RDD (Spark1.0) —> Dataframe(Spark1.3) —> Dataset(Spark1.6) 如果同样的数据都给到这三个数据结构,他们分别计算之后,都

  • Pandas简介2020-11-20 07:31:30

              Pandas非常适合许多不同类型的数据: 列数据具有异构类型的表格数据,例如在SQL表或Excel电子表格中 有序和无序(不一定是固定频率)时间序列数据。 具有行和列标签的任意矩阵数据 观察/统计数据集的任何其他形式。 二进制安装程序:https://pypi.org/project/pandas 来

  • PLSQL语句demo2020-10-05 20:34:46

    for循环demo1 数字循环 BEGIN FOR I IN 1 .. 100 LOOP -- 输出I的值 SYS.DBMS_OUTPUT.PUT_LINE(I); END LOOP; END; for循环demo2 表记录循环 BEGIN FOR CURR_ROW IN (SELECT COL1,COL2 FROM TEST_TABEL) -- 遍历输出字段COL1的值

  • 【pandas】Pandas速查笔记2020-08-25 21:01:34

    导入包 import pandas as pd import numpy as np 导入数据 pd.read_csv(filename):从CSV文件导入数据 pd.read_table(filename):从限定分隔符的文本文件导入数据 pd.read_excel(filename):从Excel文件导入数据 pd.read_sql(query, connection_object):从SQL表/库导入数据 pd.read_jso

  • MyBatis中in的使用2020-05-25 22:52:14

      通常在SQL中使用in关键字可以直接书写范围列表,不过在MyBatis中没有这样支持的语法了,必须要通过foreach标签来实现,示例如下所示: -- 输入参数是List类型<select id="selectSomeField" resultMap="java.lang.String"> SELECT some_col FROM table_name WHERE col1_name IN

  • PostgreSQL常用数据类型及实践2020-05-14 18:02:54

    前言 数据类型是编程语言中,在其数据结构上定义的相同值类型的集合以及对该相同值集合的一组操作。而数据类型的值存储离不开变量,因此变量的一个作用就是使用它来存储相同值集的数据类型。数据类型决定了如何将代表这些值的集合存储在计算机的内存中。变量一般遵循先声明后使用的原

  • insert into语法范例2020-02-24 17:52:20

    在日常工作中,我们会从一个表复制数据插入到另外一个表,当表结构不一致时(字段大小、类型都相同),可以用如下语句。 insert into A(col1, col2) select col1, col2 from B; 例如: INSERT INTO talbe1(NAME,age,STATUS,is_delete,create_date) SELECT NAME, age,0,NOW() FROM table2 b

  • ABAP_DEMO篇33 SUM和COLLECT的用法2019-12-21 15:54:27

    ABAP程序内表中的数量和金额字段  经常会需要合计, SUM和COLLECT 语法都能实现对数量和金额字段的合计。   1. SUM语法 ABAP中SUM语句比不上EXCEL里的强大;SUM只能在loop循环中使用,一般和AT-ENDAT配合使用。使用SUM语句的先决条件包含在loop中使用加法INTO,以及指定的工作区域wa

  • 今天简单说一下cdc 的使用2019-12-06 18:00:30

    从08开始,sql server 提供了一种叫做 变更数据捕获 cdc(Change Data Capture) 的功能,可以通过启用这个功能,来实现查看数据库中的表对象的数据的变化情况。(我感觉就是有点像sql server 自己提供的用户能直接看懂的数据变化功能)。 根据官方的说法。使用cdc 功能有以下好处 1、这是

  • 【转载】pandas常用函数2019-10-17 20:00:29

    原文链接:https://www.cnblogs.com/rexyan/p/7975707.html 一、import语句 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport datetimeimport re 二、文件读取 df = pd.read_csv(path='file.csv')参数:header=None 用默认列名,0,1,2,3... names=[�

  • Hive学习笔记022019-10-15 19:58:19

    1. Hive基本操作   a. DML操作 load:加载时只是把数据文件移动到hive表对应的位置。 loacl如果指定了就在本地的文件系统,local会将本地文件系统的文件复制到目标文件系统中。 overwrite:如果使用了overwrite目标表或者分区中的内容就会被覆盖。 load data local inpath 'pat

  • Oracle update 多字段更新2019-10-11 15:01:15

    一次性update多个字段 以student表为例: -- 创建学生表 create table student ( id number, name varchar2(40), age number, birthday date, address varchar2(200) ) -- 插入数据 insert into student(id, name, age, birthday, address) values(1, '王小波', 50, to_

  • SQL优化例子2019-09-19 10:50:41

    如下SQL的优化: select count(*) from ( select id,name,col1,col2 from t1  where name='xxxx' union select id,name ,null as col1,'' as col2 from t2  where id!=1 ) 原SQL慢原因:由于union需要过滤 重复记录。所以会有后台的一个group by id,name,col1,col2的操作。 优化:去

  • Pandas重复值处理2019-09-04 23:56:25

    import pandas as pd #生成数据 data1,data2,data3,data4=['a',3],['b',2],['a',3],['c',2] df=pd.DataFrame([data1,data2,data3,data4],columns=['col1','col2']) print(df) col1 col2 0 a 3 1 b

  • Java集合set2019-08-29 13:42:15

    1.Set 数组虽然也可以存储对象,但长度是固定的;集合长度是可变的。数组中可以存储基本数据类型,集合只能存储对象。 集合可以存储不同类型的对象。 共性方法 由于大部分集合类都继承了Collection接口,所以Collection接口的方法就是集合类的共性方法. public static void demo1

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有