本篇内容介绍了“uniq命令如何使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
uniq命令本身被用作去除文本文件中的重复行,与sort命令相似,但是始终还是有区别的。文本文件在Linux中,既可以是txt,也可以是其他任意自定义格式。
首先,让我们创建一个带有一些重复行的文件:
vi ostechnix.txt welcome to ostechnix welcome to ostechnix Linus is the creator of Linux. Linux is secure by default Linus is the creator of Linux. Top 500 super computers are powered by Linux
正如你在上面的文件中看到的,我们有一些重复的行(第一行和第二行,第三行和第五行是重复的)。
如果你在不使用任何参数的情况下使用 uniq 命令,它将删除所有连续的重复行,只显示唯一的行。
uniq ostechnix.txt
示例输出:
如你所见, uniq 命令删除了给定文件中的所有连续重复行。你可能还注意到,上面的输出仍然有第二行和第四行重复了。这是因为 uniq 命令只有在相邻的情况下才会删除重复的行,当然,我们也可以删除非连续的重复行。请看下面的第二个例子。
sort ostechnix.txt | uniq
示例输出:
看到了吗?没有重复的行。换句话说,上面的命令将显示在 ostechnix.txt 中只出现一次的行。我们使用 sort 命令与 uniq 命令结合,因为,就像我提到的,除非重复行是相邻的,否则 uniq 不会删除它们。
为了只显示文件中唯一的一行,可以这样做:
sort ostechnix.txt | uniq -u
示例输出:
Linux is secure by default Top 500 super computers are powered by Linux
如你所见,在给定的文件中只有两行是唯一的。
同样的,我们也可以显示文件中重复的行,就像下面这样:
sort ostechnix.txt | uniq -d
示例输出:
Linus is the creator of Linux. welcome to ostechnix
这两行在 ostechnix.txt 文件中是重复的行。请注意 -d(小写 d) 将会只打印重复的行,每组显示一个。打印所有重复的行,使用 -D(大写 D),如下所示:
sort ostechnix.txt | uniq -D
在下面的截图中看两个选项的区别:
由于某种原因,你可能想要检查给定文件中每一行重复出现的次数。要做到这一点,使用 -c 选项,如下所示:
sort ostechnix.txt | uniq -c
示例输出:
Linus is the creator of Linux. Linux is secure by default Top 500 super computers are powered by Linux welcome to ostechnix
我们还可以按照每一行的出现次数进行排序,然后显示,如下所示:
sort ostechnix.txt | uniq -c | sort -nr
示例输出:
welcome to ostechnix Linus is the creator of Linux. Top 500 super computers are powered by Linux Linux is secure by default
我们可以使用 -w 选项来限制对文件中特定数量字符的比较。例如,让我们比较文件中的前四个字符,并显示重复行,如下所示:
uniq -d -w 4 ostechnix.txt
像对文件中行的前 N 个字符进行限制比较一样,我们也可以使用 -s 选项来忽略比较前 N 个字符。
下面的命令将忽略在文件中每行的前四个字符进行比较:
uniq -d -s 4 ostechnix.txt
为了忽略比较前 N 个字段(LCTT 译注:即前几列)而不是字符,在上面的命令中使用 -f 选项。
欲了解更多详情,请参考帮助部分:
uniq --help
也可以使用 man 命令查看:
man uniq
“uniq命令如何使用”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。