Linux下对文件进行按行排序：sort 与 uniq 命令简介

sort 命令可针对文本文件的内容，以行为单位进行排序。其基本语法格式为：

sort [-bcfMnrtk][源文件][-o 输出文件]

参数：

-b 忽略每行前面开始出的空格字符
-c 检查文件是否已经按照顺序排序
-f 排序时，忽略大小写字母
-M 将前面 3 个字母依照月份的缩写进行排序
-n 依照数值的大小排序
-o<输出文件> 将排序后的结果存入指定的文件
-r 以相反的顺序来排序
-t<分隔字符> 指定排序时所用的栏位分隔字符
-k 选择以哪个区间进行排序

uniq 命令用于去除文件中重复的行，这个命令可以配合 sort 命令使用，将排序过程中出现的重复行去掉。其基本语法格式为：

uniq [选项] 文件

参数：

-c 显示输出中，在每行行首加上本行在文件中出现的次数。它可取代 -u 和 -d 选项
-d 只显示重复行
-u 只显示文件中不重复的各行
-n 前 n 个字段与每个字段前的空白一起被忽略。一个字段是一个非空格、非制表符的字符串，彼此由制表符和空格隔开(字段从0开始编号)
+n 前 n 个字符被忽略，之前的字符被跳过(字符从0开始编号)
-f n 与 -n 相同，这里 n 是字段数
-s n 与 +n 相同，这里 n 是字符数

例：

$ sort filename | uniq -c

以上操作对文件进行排序，并去除重复的行，同时在行首显示重复出现的次数。

本文使用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可，转载请注明出处