sed命令详解-应用篇

时间:2022-07-04 20:04:14

本篇从实用的角度讲解sed,关于sed的详细帮助文档,请参考前篇

http://www.cnblogs.com/the-capricornus/p/5279979.html

本篇用到的选项请参考前篇。

本篇用到的地址相关的内容请参考前篇。

本篇大概分3部分:基本应用、模式空间、标签。

sed可以直接处理文本文件,也可以处理管道中的文本。

sed通常情况下每次处理一行文本,这行文本保存在sed的模式空间内。

那有哪些不通常的情况呢?比如你使用N命令往模式空间追加了一行内容。

现在说说sed都可以进行哪些操作。

我们先从基本的操作入手:

=  打印行号
a\ 追加新行
i\ 插入新行
p 打印
q 退出
Q 立即退出
r 追加从文件读取的文本
c\ 行替换
s 替换 P 打印模式空间的第一行
R 追加从文件读取的一行

再来说说高级操作,高级操作都是围绕模式空间展开的:

d 删除模式空间
h 复制模式空间到保持空间
g 复制保持空间到模式空间 n 读取下一行到模式空间
w 写模式空间到文件
x 交换模式空间和保持空间
y 将模式空间内source里的字符转换成dest里对应的字符 G 追加保持空间到模式空间
H 追加模式空间到保持空间
N 追加下一行到模式空间
D 删除模式空间中的一行
W 写模式空间的第一行到文件

再来围绕标签来谈谈高级操作:

: 为b和t命令定义标签
b 切换到标签
t 如果前面的替换成功切换到标签
T 如果前边的替换失败切换到标签

基本应用

sed默认打印模式空间的内容到输出上。如果你执行了如下的命令:

echo -e "abc\ndef" | sed 'p'

每行都打印2遍,一遍是默认的对模式空间的打印,一遍是p命令的打印。

如果你加上选项-n,每行只打印一遍。默认的对模式空间的打印被关闭。

echo -e "abc\ndef" | sed -n 'p'

如果你执行的了删除模式空间的操作,则被删除的模式空间将不被打印。

echo -e "abc\ndef" | sed '1d'

下面的命令会在每一行的前边加上一行,内容是行号。

echo -e "abc\ndef" | sed '='

那你想知道总共有多少行,你可以使用如下的命令,这个可以用来统计文本行数。

echo -e "abc\ndef" | sed -n '$='

追加行不多说,但是被追加的行即使你使用了抑制模式,还是会被打印出来的。

echo -e "abc\ndef" | sed -n 'a\s'

要注意的一点是,你启用-i选项编辑文件时,你同时用了-n选项的话,要知道后果有多严重。

就是文件的所有内容将被输出替换掉。比如你执行了如下的操作:

sed -ni '1a\Note:all content is deleted.' aaa

则文件aaa的内容将只有一行啦,所有的数据都丢失啦,太可怕啦,文件操作一定要谨慎。

为了安全起见,在文件操作之前,先生成一个文件的备份。

sed -n -i_bak '1a\Note:all content is deleted.' aaa

将先生成aaa的备份文件aaa_bak,然后进行文件操作。

-i选项就是这样的,你指定了备份就生成,你不指定就不生成。

你可以利用sed命令来合并2个文档,下面的命令把file1的内容追加到file2的结尾。

sed -i '$rfile1' file2

如果你使用了大写的R,则文件变成file2一行,file1一行这样的交替这来。

sed -i '$Rfile1' file2

下面的栗子将把第一行替换成str:

echo -e "abc\ndef" | sed '1c\str'

你想在处理完某行就退出吗?下面的栗子处理完第一行就退出:

echo -e "abc\ndef" | sed '1q'

下面的栗子你看和上面的栗子有什么不同?

echo -e "abc\ndef" | sed '1Q'

连模式空间都不打印了,立即退出

上面说了那么多栗子,用的都是行取地址,其实也可以使用正则表达式取地址。

用2个斜杠就表示里边的内容是正则表达式。

echo -e "abc\ndef" | sed '/abc/c\str'

那你想把abc替换成def的话,如下使用

echo -e "abc" | sed 's/abc/def/'

上面的命令只替换模式空间中第一次出现的,如果你想替换所有的,加上标志g

echo -e "abc\nabc" | sed 's/abc/def/g'

还有很多标志请参考前篇文档。

下面从模式空间的角度来谈谈高级应用。

下面的栗子将创建文件aaa并往里边写入2行。

echo -e 'abc\ndef' | sed 'waaa'

下面的栗子p命令打印的是偶数行

echo -e 'abc\ndef\nghi\njkl' | sed -n 'n;p'

对于上面的命令,用分号隔开2个操作,对每一行都会执行所有的操作。

操作第一行时,n读取第二行到模式空间,接着打印,打印的内容是第二行。

然后操作第三行,n读取第四行到模式空间,接着打印,打印的内容是第四行。

但是如果你使用N操作,将是追加下一行到模式空间,p打印2行内容

echo -e 'abc\ndef\nghi\njkl' | sed -n 'N;p'

下边是一个对应字符替换的栗子,将输出 1xx2xx3xx

echo "axxbxxcxx" | sed 'y/abc/123/'

下边的命令将只打印奇数行

echo -e 'abc\ndef\nghi\njkl' | sed -n 'h;n;g;p'

下边的命令也是只打印了奇数行

echo -e 'abc\ndef\nghi\njkl' | sed -n 'h;n;x;p'

下边的命令把偶数行和奇数行的顺序互换

echo -e 'abc\ndef\nghi\njkl' | sed -n 'h;n;G;p'

下面从标签的角度来谈谈高级应用

用:定义一个标签,用b切换到标签

echo -e "abc\ndef\nghi\njkl" | sed -n '/[a,j]/b label;y/abcdefghijkl/0123456789AB/;:label;p'

b是无条件跳转,而t是有条件跳转的,那就是它前边的s///命令执行成功的话,它就跳转

echo -e "abcdefg\nhi\njkl" | sed ':label;s/^.\{1,19\}$/ &/;tlabel'

上面的命令正则表达式是^.{1,19}$,就是1到19个任意字符,&是一个引用,内容就是正则表达式匹配到的。

不到19个字符总会匹配成功,匹配成功就替换成空格加引用。最后所有的行都变成20个字符宽度的右对齐。