Linux之文件过滤分割与合并

 文件过滤分割与合并

 1、grep命令

     grep（global regular expression print）全面搜索正则表达式并把行打印出来，是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。

     -a 不要忽略二进制数据。

     -A<显示列数> 除了显示符合范本样式的那一行之外，并显示该行之后的内容。

     -b 在显示符合范本的数据之外，并显示该行之前的内容。

     -c 计算符合范本样式的列数。

     -C<显示列数> 除了显示符合范本样式的那一列之外，并显示该列之前后的内容。

     -d<进行动作> 当指定要查找的是目录而非文件时，必须使用这参数，否则grep命令将回报信息并停止动作。

     -e<范本样式> 指定字符串作为查找文件内容的范本样式。

     -E 能使用扩展正则表达式

     -f<范本文件> 指定范本文件，其内容有一个或多个范本样式，让grep查找符合范本条件的文件内容，格式为每一列的范本样式。

     -F 将范本样式视为固定的字符串列表。

     -G 将范本样式视为普通的表示法来使用。

     -h 在显示符合范本样式的那一列之前，不标示该列所属的文件名称。

     -H 在显示符合范本样式的那一列之前，标示该列的文件名称。

     -i 忽略大小写的差别。

     -l 列出文件内容符合指定的范本样式的文件名称。

     -L 列出文件内容不符合指定的范本样式的文件名称。

     -n 在显示符合范本样式的那一列之前，标示出该列的编号。

     -q 不显示任何信息。

     -R/-r 此参数的效果和指定“-d resource”参数相同。

     -s 不显示错误信息。

     -v 反转查找。

     -w 只显示全字符合的列。

     -x 只显示全列符合的列。

     -y 此参数和 -i效果相同。

     -o 只输出文件中匹配到的部分。

 grep命令的常见用法

     在文件中搜索一个单词，命令会返回一个包含“match_pattern”的文本行：

     grep match_pattern file_name

     grep "match_pattern" file_name

     在多个文件中查找

     grep match_pattern file_name1 file_name2

     输出除匹配到的所有行之外的 -v选项

     grep -v match_pattern file_name

     标记匹配颜色选项

     grep match_pattern file_name --color=auto

     使用正则表达式-E选项：

     grep -E "[1-9]+"

     只输出文件中匹配到的部分 -o选项

     echo this is a test line. | grep -o -E "[a-z]+\.

     echo this is a test line. | egrep -o -E "[a-z]+\.

     统计文件或者文本中包含匹配字符串的行数-c选项

     grep -c "match_pattern" file_name

     输出包含字符串的行数-n选项

     grep “text” -n filename    或 cat file_name | grep "text" -n

     打印样式匹配所位于的字符或者字节偏移

     echo gun is not unix | grep -o -b "not"

     搜索多个文件并查找匹配文本在哪些文件中：

     grep -l "text" file1 file2 file3……

     在多级目录中对文本进行递归搜索：

     grep “text” . -r -n

     忽略匹配样式中的字符的大小写

     echo hello world | grep -i "hello"

     选项 -e 制动多个匹配样式：

     echo this is a text line | grep -e "is" -e "line" -o

     在grep搜索结果中包括或者排除指定文件：

     //只在目录中搜索所有的.php和.html文件中递归搜索字符“main()”

     grep "main()" . -r --include *.{php,html}

     grep静默输出

     grep -q “test” filename

     打印出匹配文本之前或者之后的行；

     //显示匹配某个结果之后的3行，使用-A选项

     seq 10 | grep "5" -A 3

     //显示匹配某个结果之前的3行，使用-B选项

     seq 10 | grep "5" -B 3

     //显示匹配某个结果的前三行和后三行，使用-C选项

     seq 10 | grep "5" -C 3

     //如果匹配结果有多行，会用“--”作为各匹配结果之间的分隔符：

     echo -e "a\nb\nc\na\nb\nc" | grep a -A 1

 2、sort命令

     sort命令是在Linux中非常有用，它将文本尽心排序，并将排序结果标准输出。sort命令既可以从特定的文件，也可以从stdin中获取输入

 语法

     sort（选项）（参数）

 选项

     -b：忽略每行最前面的空格

     -c：检查文件是否按顺序排序

     -d：处理英文字母、数字及空格字符外，忽略其他的字符；

     -f：排序时将小写字母视为大写字母；

     -m：将几个排序号的文件进行排序；

     -n：按照数值的大小排序；

     -o<输出文件>：将排序后的结果存入制定的文件；

     -r：以相反的顺序来排序；

 参数

     文件：指定待排序的文件列表

 实例

     sort sort.txt

     sort -u sort.txt    //忽略相同行

     或者    uniq sort.txt

     将第二列按数字从小到大的排列

     sort -nk 2 -t: sort.txt

     将第三列按数字从大到小的顺序排列

     sort -nrk 3 -t: sort.txt
秒客网

Linux之文件过滤分割与合并

相关文章