ICode9

精准搜索请尝试: 精确搜索
首页 > 系统相关> 文章详细

linux中求两组数据的交集、并集、特有项

2022-01-21 19:03:31  阅读:186  来源: 互联网

标签:并集 中求 PC1 cat linux test home txt root


1、测试数据

root@PC1:/home/test# ls         ##  测试数据
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c

 

2、取两个文件的交集

sort + uniq实现

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# cat <(sort -u a.txt ) <(sort -u b.txt ) | sort | uniq -d    ## 取两个文件的交集
a
d

 

comm实现:

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# comm <(sort -u a.txt ) <(sort -u b.txt ) -1 -2    ## 取两个文件的交集
a
d

 

3、取两个文件的并集

sort 实现

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# cat a.txt b.txt | sort -u   ## 取两个文件的并集
a
c
d
e
g
s
t
w

 

comm实现:

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# comm <(sort -u a.txt ) <(sort -u b.txt ) | sed 's/^\t\+//g'    ## 取两个文件中的并集
a
c
d
e
g
s
t
w

 

4、取文件a.txt中的特有项

grep + if实现

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# sort -u a.txt | while read i; do grep -w "$i" <(sort -u b.txt) &> /dev/null; if [ $? -eq 1 ]; then echo $i; fi; done
g
s
w

 

comm实现:

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# comm <(sort -u a.txt ) <(sort -u b.txt ) -2 -3    ## 取出a.txt中的特有项
g
s
w

 

5、取出b.txt中的特有项

sort + grep实现

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# sort -u b.txt | while read i; do grep -w "$i" <(sort -u a.txt ) &> /dev/null; if [ $? -eq 1 ]; then echo $i; fi; done
c
e
t

 

comm实现

root@PC1:/home/test# ls
a.txt  b.txt
root@PC1:/home/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test# comm <(sort -u b.txt ) <(sort -u a.txt ) -2 -3    ## 求b.txt中的特有项
c
e
t
root@PC1:/home/test# comm <(sort -u a.txt ) <(sort -u b.txt ) -1 -3    ## 取b.txt中的特有项
c
e
t

 

标签:并集,中求,PC1,cat,linux,test,home,txt,root
来源: https://www.cnblogs.com/liujiaxin2018/p/15831414.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有