cover

Linux用awk去掉重复列的几种情况

Linux用awk去掉重复列的几种情况

pwerdu91

4264人浏览 · 2022-06-29 15:01:36

pwerdu91 · 2022-06-29 15:01:36 发布

awk去掉重复列的模式如下：

!a[$0]++

其中$0表示整行，$1表示第一列，$2表示第二列

文件内容如下：

cat 00.txt 
a b
c b
a s

1、去重第一列重复的行

cat 00.txt |awk '!a[$1]++{print}'
a b
c b

2、去重以第一列和第二列重复的行

第一种：

[root@VM-20-12-centos txt]# cat 11.txt 
aa bb
aa bb
aa cc
cc bb
[root@VM-20-12-centos txt]# cat 11.txt |awk '!a[$1""$2]++{print}'
aa bb
aa cc
cc bb

第二种：

[root@VM-20-12-centos txt]# cat 11.txt |awk '!a[$0]++{print}'
aa bb
aa cc
cc bb

3、只显示重复行

[root@VM-20-12-centos txt]# cat 11.txt 
aa bb
aa bb
aa cc
cc bb
[root@VM-20-12-centos txt]# cat 11.txt |awk 'a[$0]++{print}'
aa bb

uniq可以针对完全相同的行去重

[root@VM-20-12-centos txt]# cat 11.txt 
aa bb
aa bb
aa cc
cc bb
[root@VM-20-12-centos txt]# cat 11.txt |uniq
aa bb
aa cc
cc bb

华为云开发者联盟

为开发者提供学习成长、分享交流、生态实践、资源工具等服务，帮助开发者快速成长。

更多推荐

cover

解锁HDC 2024之旅：从购票到报名，全程攻略

华为云开发者联盟

cover

从原始边列表到邻接矩阵Python实现图数据处理的完整指南

华为云开发者联盟

cover

华为云云原生FinOps解决方案，释放云原生最大价值

华为云开发者联盟

所有评论(0)

查看更多评论

pwerdu91

已为社区贡献1条内容