标签:dplyr 表格 融合 dat merge 拼接 join 数据
cbind(df1,df2) 横向添加表格,表格变宽,增加列数
rbind(df1,df2) 纵向添加表格,表格变长,增加行数
例子:
表格融合:针对数据框没有很好的保持一致。可用函数R内置的merge() 和dplyr的_join()函数。注:merge()可指定匹配列名,但运行较慢。
merge(数据框1,数据框2,all= ,[by=,by.x=,by.y= ])
注:merge()函数会自动寻找两个数据框的共有列,即by=共有列,也可以指定不同名的列即by.x指定左边数据框的依据列,by.y指定右边数据框的依据列。
all=FALSE时,只将数据框中共有列数值相同的那些行输出,类似两个数据框对共有列取交集。;all=TRUE时取并集,原本在该行没有得数据框值用NA替代。
例子:
dat_merge1<-merge(df1,df2,by="x",all=TRUE)
dat_merge2<-merge(df1,df3,by.x="x",by.y="g")
dat_merge3<-merge(df1,df4,by=c("x","y"),all=TRUE)
结果:
dplyr包提供left_join(),right_join(), inner_join(), full_join()四个函数。
dplyr::full_join()生成两个集合的并集,
dplyr::inner_join()保留交集key
dplyr::left_join() 只保留左数据框所有key
dplyr::right_join()只保留右边数据框所有key
注:空值填充NA。
by=c("x"="g"),指定两个数据框对应匹配列。
在合并过程有列在两个表中同名,但不作为匹配列,值不同,想保留这两列时候,用suffix参数给重复列名加后缀。
例子:
dat_join1<-dplyr::left_join(x=df1,y=df2,by="x")
dat_join2<-dplyr::right_join(x=df1,y=df2,by="x")
dat_join3<-dplyr::inner_join(x=df1,y=df2,by="x")
dat_join4<-dplyr::full_join(x=df1,y=df2,by="x")
dat_join4<-dplyr::full_join(x=df1,y=df2,by="x")
dat_join7<-dplyr::left_join(x=df1,y=df4,by="x",suffix=c("1","2"))
标签:dplyr,表格,融合,dat,merge,拼接,join,数据 来源: https://www.cnblogs.com/koujiaodahan/p/15359330.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。