awk sed 实例练习-FinClip官网

awk sed 实例练习

网友投稿 624 2022-09-24

awk sed 实例练习

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[ ]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\$/N; s/\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\$/N; s/\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*//;x;s/.*$.\{ 9\ }$$//;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/ /'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[]=}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", ,a[],;delete a[]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

);else printf("%s ",

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

;getline;b=

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

;getline;print a,b,

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[

1,sed介绍 sed可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行,或读入其它档的资料到文>件中,也可替换(substuite)它们其中的字串、或转换 (tranfer)其中的字母等等。例如将文件中的连续空白行删成一行、"local"字串替换成"remote"、"t"字母转换成"T"、将第10行资料与第11资料合等. 总合上述所言,当sed由标准输入读入一行资料并放入pattern space时,sed依照sed script 的编辑指令逐一对pattern space内的资料执行编辑,之後,再由pattern space内的结果送到标准输出,接着再将下一行资料读入.如此重执行上述动作,直至读>完所有资料行为止. 小结,记住: (1)sed总是以行对输入进行处理 (2)sed处理的不是原文件而是原文件的拷贝命令行概述: sed 编辑指令的格式如下 : [address1[,address2]]function[argument] 其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行; 函数参数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。有那些函数(function)参数下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。函数参数功能 : label 建立 script file 内指令互相参考的位置。 # 建立解 { } 集合有相同位址参数的指令。 ! 不执行函数参数。 = 印出资料行数( line number )。 a\ 添加使用者输入的资料。 b label 将执行的指令跳至由 : 建立的参考位置。 c\ 以使用者输入的资料取代资料。 d 删除资料。 D 删除 pattern space 内第一个 newline 字母 \ 前的资料。 g 拷贝资料从 hold space。 G 添加资料从 hold space 至 pattern space 。 h 拷贝资料从 pattern space 至 hold space 。 H 添加资料从 pattern space 至 hold space 。 l 印出 l 资料中的 nonprinting character 用 ASCII 码。 i\ 插入添加使用者输入的资料行。 n 读入下一笔资料。 N 添加下一笔资料到 pattern space。 p 印出资料。 P 印出 pattern space 内第一个 newline 字母 \ 前的资料。 q 跳出 sed 编辑。 r 读入它档内容。 s 替换字串。 t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。 w 写资料到它档内。 x 交换 hold space 与 pattern space 内容。 y 转换(transform)字元。虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。 2,1 删除 (1) sed -e '1d' inputfile (删除第一行) 那么删除第x行呢?删除第x1,x2,x3行呢？ sed -e 'xd' inputfile sed -e 'x1d' -e 'x2d' -e 'x3d' inputfile 当然也许还有更好的办法。 (2) sed -e '1,3d' file (删除第一到第三行) 思考：删除第n行到第m行?也就是 sed -e 'n,md' file 删除第一行到最后一行 sed -e '1,$d' file #$ 最后一行和一行的最后 (3) sed -e '/#/d' file (删除含有'#'号的行) 思考：删除含有字母xx的行 sed -e '/xx/d' file 思考: 删除除含有字符串xx的所有行 sed -e '/xx/!d' file (4) sed -e '/word1/, /word2/d' file (删除从含有单词word1到含有单词word2的行) sed -e '10,/word1/d' file 删除文件中从第10行到含有word1的行 sed -e '/word1/,10/d' file 和上面的匹配相反，删除从含有word1的行到第10行 (5) sed -e '/t.*t/d' file (删除含有两个t的行) 思考：删除含有指定正在表达式匹配的行。 2.2 替换 Sed 可替换文件中的字串、资料行、甚至资料区。其中,表示替换字串的指令中的函数参数为s;表示替换资料行、或资料区>的指令中的函数参数为c。上述情况以下面三个例子说明。 *行的替换 (1) sed -e '1c\#!/bin/more' file (把第一行替换成#!/bin/more) 思考: 把第n行替换成just do it sed -e 'nc\just do it' file (2) sed -e '1,10c\I can do it' file (把1到10行替换成一行:I can do it) 思考: 换成两行(I can do it! Let's start) sed -e '1,10c\I can do it!\nLet'"\'"'s start' file *字符的替换 (3) sed -e 's/word1/& word2/' file (将每一行的word1单词替换成s参数最多与两个位置参数相结合,函数参数s中有两个特殊的符号: & : 代表pattern \n : 代表 pattern 中被第 n 个 $ 、$(参照[附录 A]) 所括起来的字串。例如 sed -e 's/w1/& w2/' file # w1的地方输出 w1 w2 sed -e 's/$test$ $my$ $car$/[\2 \3 \1]/' file #结果: [my car test] *flag 参数举例 sed -e 's/w1/& w2/g' file g : 代表替换所有匹配项目;这里,文件中所有字符串w1都会被替换成字串w1 w2 sed -e 's/w1/& w2/10' file m(10) : 替换行内第m个符合的字串; 记住，是行内的第m个匹配的字串 sed -e 's/w1/& w2/p' file p : 替换第一个和w1匹配的字符串为w1 w2，并输出到标准输出. sed -e 's/w1/& w2/w w2file' file w filename : 该参数会将替换过的内容写入到文件w2file并输出替换后的整个文件。注意w2file里写的只是替换过的行。 sed 'e 's/w1/& w2/' file 这里的flag 为空, 这样就只是将第一个w1匹配的字符串替换成w1 w2而后面的不进行替换。 *位置参数应用举例 sed -e '/machine/s/phi/beta/g' file 将文件中含"machine"字串的资料行中的"phi"字串,替换成为"beta"字串 sed -e '1,10 s/w1/& w2/g' file 把1到10内的w1字符串替换成w1 w2字符串。 sed -e '1,/else/ s/w1/& w2/g' file 把1到字符串else内的w1字符串替换成w1 w2字符串。其它位置参数的应用与前面的相同。 2.3 内容的插入 i 基本格式: [address] i\ 插入内容 filename word2) 说明: 函数参数 s 表示替换(substitute)文件内字串。其指令格式如下 : [address1[ ,address2]] s/pattern/replacemen/[flag] sed -e '/#/i\words' file #在#字符的前面插入一行words 说明：这里的函数参数是i，它只能有一个地址参数。 sed -e '1/i\words' file 在第一行前加一行words cat "word" | sed -e '/$/.doc/g' #输出word.doc 在word后面加上后缀名，从而输出word.doc i 参数正好与a参数相反，它是插入到所给内容的前面. a a参数的使用格式如下： [address] a\ <插入内容> filename sed -e '/unix/a\ haha' test.txt #在含有unix的行后添加"haha" #输出结果为: unix haha 另外: sed -e '1 a\ hh' test.txt #在第一行后添加hh字符. 2.4 文本的打印: p 基本格式： [address1,[address2]] p (1) sed -e '/then/ p' filename #打印所有行并重复打印含有then 的行 (2) sed -n '/then/ p' filename #只打印含有then的行 (3) sed -e '1,3 p' filename # 打印所有行并重复1-3行 (4) sed -n '1,3 p' filename # 打印1-3行 (5) sed -n '/if/,/fi/ p' filename #打印字符if和fi之间的内容 p函数为sed的打印函数，在这里要注意-e 和-n 参数的区别。一般使用-n参数。 2.5 字元的替换: y 例如： (1)sed -e 'y/abc../xyz../' filename 把文件中的a字母替换成x, b替换成y, c替换成z。 (2) sed -e 'y/abc/ABC' filename 把小写的abc转换成大写的ABC 2.6 反相执行命令 : ! 基本格式: [address1[ , address2]] ! 函数参数 sed -e '/1996/!d' filename 删除除了含有1996的所有行。 2.7 改变文件中的资料: c 基本格式： [address1[ ,address2]]c\ filename 函数参数 c 紧接着 "\" 字元用来表示此行结束 , 使用者所输入的资料必须从下一行输入。如果资料超过一行 , 则须在>每行的结尾加入"\" sed -e '/zhengxh/c hhhh' filename 表示把含有字符串zhengxh的行，该成hhhh。 2.8 读入下一行资料: n 基本格式： [address1[ ,address2]] n sed -n -e '/echo/n' -e 'p' temp 表示输出文件，但如果一行含有字符串echo，则输出包含该字符串的下一行。 sed -n -e 'n' -e 'p' filename 输出文中的偶数行 3, 命令的复用一次执行多个命令的方式有三种： (1) sed 's/w1/& w2/g; 1/i\words' filename (使用;号把命令隔开，注意前面不加-e参数) (2) sed -e 'cmd1' -e 'cmd2' filename (使用多个-e参数) 一. 替换 1.神奇变换(y命令的使用) 代码: sed 'y/ori_letter_list/target_letter_list/' filename 代码: cat filename 1234567890 2345678901 3456789012 4567890123 测试将文件中1换成A 将文件中2换成B ... 将文件中0换成J 代码: sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC 注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g list1:1234567890 list2:ABCDEFGHIJ 下面再作一个与前例相反的变换代码: sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH 2.替换每行第一个匹配代码: sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename 举例: 引用: cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 3.替换每行第n(如果有的话)个匹配代码: sed "s/regexpr/anyword/${ n }" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 4.替换每行所有匹配代码: cat filename 1234567890 2345678901 3456789012 4567890123 代码: 举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三二.行号处理 1.为文件加行号代码: sed = filename|sed 'N;s/\n/:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例代码: sed = filename|sed 'N;s/\n/:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 2.仅为文件中的正文行加行号代码: sed /./= a|sed '/./N;s/\n/:/' 举例代码: cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/\n/:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 三.字串翻转代码: sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 举例代码: echo 1234567890|sed '/\n/!G;s/$.$$.*\n$/&\2\1/;s/.//' 0987654321 四.选择性输出 1.打印文档奇数行(隔行输出) 代码: sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 2.打印偶数行(隔行输出) 代码: sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 3.删除连续重复行（大量使用了pattern space 文件太大时要注意）代码: sed '$!N; /^$.*$\n\1$/!P; D' #使用 $!N 要当心内存溢出举例代码: cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^$.*$\n\1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 4.合并上下行并以空格相分隔代码: sed '$!N;s/\n/ /' 举例代码: cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 5.将以\符号结尾的行与下行合并并以空格分隔(拼接断行) 代码: sed -e :a -e '/\\$/N; s/\\\n/ /; ta' 举例代码: cat filename 1 111111111111111111\ 2 222222222222222222 3 333333333333333333\ 4 444444444444444444 sed -e :a -e '/\\$/N; s/\\\n/ /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 6.按关键字拼接行如果某行以=开始，则合并到上一行并替代＝为空格代码: sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' 举例代码: cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/\n=/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 7.输出匹配行的下一行代码: sed -n '/regexpr/{ n;p; }' filename 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{ n;p; }' filename 4 444444444444444444 8.显示匹配行的行号并输出匹配行的上行、匹配行、下行 sed -n -e '/regexpr/{ =;x;1!p;g;$!N;p;D; }' -e h 举例代码: cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{ =;x;1!p;g;$!N;p;D; }' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 9.删除文档中某标志区域内的关键字匹配行删除文档中从being开到end结束的块中包含myword的行代码: sed '/^begin/,/^end/{ /myword/d; }' filename 引用: cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! 测试引用: myword begin Number! Number! Number! Number! end myword Number! 五.字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串代码: echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 ###################### cat file1 --代号 --账号 101 aa 102 bb 103 cc cat file2 --代号 --姓名 101 aaaa 103 bbbb 104 dddd awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n cat a 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 1399946_1399944_1399943_1399942_1399941_1399940_1399939_1399938_1399937_1399936_1399935_1399934_1399933_1399932_1399931_1399930 awk 'BEGIN{RS="_"}{print $1 | "sort"}' a 1399946 1399944 1399943 ##################### sed -n '/wrwq/a \shenzhen' myfile 插入wrwq后面一行,插入shenzhen一行 sed -n '/wrwq/i \shenzhen' myfile 插入wrwq前面一行在b.txt的第2行之前插入“xxx” sed '2 i/xxx' b.txt 在b.txt的第2行之后插入“xxx” sed '2 a/xxx' b.txt 在b.txt的第2行和第3行之后插入“xxx” sed '2,3 a/xxx' b.txt 在b.txt的第2行和第3行之前插入“xxx” sed '2,3 i/xxx' b.txt 在b.txt的第2行至最后一行之前插入“xxx” sed '2,$ i/xxx' b.txt [root@dbtest1 ~]# cat 1 《如文件所示，要求合并文件为两行，》 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{if(NR%3==0)printf("%s\n",$0);else printf("%s ",$0)}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# awk '{a=$0;getline;b=$0;getline;print a,b,$0}' 1 1 2 3 4 5 6 [root@dbtest1 ~]# cat 1 | xargs -n3 1 2 3 4 5 6 [root@dbtest1 ~]# sed 'N;N;s/\n/ /g' 1 1 2 3 4 5 6 ##################################################################################################################### #################################################################################################################### 删除重复的行在awk中，可以用！a[$0]++做为条件，对重复出现的行进行处理。 [root@dbtest1 ~]# cat 2 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 [root@dbtest1 ~]# awk '!a[$0]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n\1$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

]++' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444 [root@dbtest1 ~]# sed '$!N; /^$.*$\n$/!P; D' 2 111111111111111111 222222222222222222 333333333333333333 444444444444444444

[root@dbtest2 ~]# more c 1 2 3 4 5 6 [root@dbtest2 ~]# sed ':a;N;s/\n/ /g;ba;' c 1 2 3 4 5 6

对于awk '!a[$3]++'，需要了解3个知识点 1、awk数组知识，说不通ing---- 2、awk的基本命令格式 awk 'pattern{action}' 省略action时，默认action是{print}，如awk '1'就是awk '1{print}' 3、var++的形式：先读取var变量值，再对var值+1 以数据 1 2 3 1 2 3 1 2 4 1 2 5 为例，对于awk '!a[$3]++' awk处理第一行时：先读取a[$3]值再自增，a[$3]即a[3]值为空(0)，即为awk '!0'，即为awk '1'，即为awk '1{print}' awk处理第二行时：先读取a[$3]值再自增，a[$3]即a[3]值为1，即为awk '!1'，即为awk '0'，即为awk '0{print}' ............. 最后实现的效果就是对于$3是第一次出现的行进行打印，也就是去除$3重复的行 ######################################################################################################################## ####################################################################################################################### 分隔符 [root@dbtest1 ~]# more a [aa] aa1 dd2 dd3 dd4 [bb] dd5 dd6 dd7 xx8 dd9 5510 [root@dbtest1 ~]# awk -vRS="\n\n" '/aa/' a [aa] aa1 dd2 dd3 dd4 [root@dbtest1 ~]# awk '{if($0 !~ /^$/)print;else exit}' a [aa] aa1 dd2 dd3 dd4 [root@dbtest1 ~]# awk -vRS="[" '/aa/{print RS$0}' a [aa] aa1 dd2 dd3 dd4 [root@dbtest1 home]# more c 1399946_1399944_1399943_1399942_1399941_1399940_1399939 [root@dbtest1 home]# awk 'BEGIN{RS="_"}{print $1 | "sort"}' c 1399939 1399940 1399941 1399942 1399943 1399944 1399946 ############################################################################################################ ############################################################################################################# 字串解析 1.从字串中解析出两个子串(前2各字符和后9个字符) 代码: echo "WeLoveChinaUnix"|sed -e 'H;s/$..$.*/\1/;x;s/.*$.\{ 9\ }$$/\1/;x;G;s/\n/ /' We ChinaUnix 2.分解日期串 echo 20030922|sed 's/$....$$..$$..$/\1 \2 \3/'|read year month day echo $year $month $day 2003 09 22 [root@dbtest1 home]# more 1 --daihao --zhanghao 101 aa 102 bb 103 cc [root@dbtest1 home]# more 2 --daihao --zhanghao 101 aaaa 103 bbbb 104 dddd [root@dbtest1 home]# awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n --daihao --zhanghao --zhanghao 101 aa aaaa 102 bb 103 cc bbbb 104 dddd #################################################################################################################### ################################################################################################################### awk 数组米字距列求和与积 [root@dbtest1 home]# more 3 1 2 3 4 5 6 7 8 9 [root@dbtest1 home]# awk 'NF==3{l++;for(n=0;n++<3;)a[l,n]=$n}END{mr=mc=ms=mb=1;for(n=0;n++<3;){mr*=a[n,2];ar+=a[n,2];mc*=a[2,n];ac+=a[2,n];ms*=a[n,4-n];as+=a[n,4-n];mb*=a[n,n];ab+=a[n,n]}print "row2 add="ar" row2 mul="mr"\ncol2 add="ac" col2 mul="mc"\nslash add="as" slash mul="ms"\nback slash add="ab" back slash mul="mb}' 3 row2 add=15 row2 mul=80 col2 add=15 col2 mul=120 slash add=15 slash mul=105 back slash add=15 back slash mul=45 [root@dbtest1 home]# awk -vRS= '{j=4;product=1;for(i=1;i<=4;i++){product=$i*$(j+i)*$(2*j+i);sum=$i+$(j+i)+$(2*j+i);print sum,product;j--}}' 3 15 45 15 80 15 105 15 120 [root@dbtest1 home]# awk -vRS= '{j=4;for(i=1;i<=4;i++){print $i+$(j+i)+$(2*j+i),$i*$(j+i)*$(2*j+i);j--}}' 3 15 45 15 80 15 105 15 120 ################################################################################################################################# [root@dbtest2 ~]# more b I0011 11111 I0012 22222 I0014 55555 I0013 66666 [root@dbtest2 ~]# more a 比较b第一个域中2-5个字符是否与a中第一个域中1-4个字符相同，若相同，则合并b到a中 0011AAA 200.00 20050321 0012BBB 300.00 20050621 0013DDD 400.00 20050622 0014FFF 500.00 20050401 [root@dbtest2 ~]# awk 'NR==FNR{a[substr($1,2,5)]=$2}NR>FNR&&a[b=substr($1,1,4)]{print $0,a[b]}' b a 0011AAA 200.00 20050321 11111 0012BBB 300.00 20050621 22222 0013DDD 400.00 20050622 66666 0014FFF 500.00 20050401 55555

洞察纵观鸿蒙next版本，如何凭借FinClip加强小程序的跨平台管理，确保企业在数字化转型中的高效运营和数据安全？

624 2022-09-24

awk sed 实例练习

洞察纵观鸿蒙next版本，如何凭借FinClip加强小程序的跨平台管理，确保企业在数字化转型中的高效运营和数据安全？

洞察金融行业需要转型，如何利用鸿蒙app开发提升运营效率

洞察在数字化转型过程中，信创推动企业有效整合资源，实现低成本、高效率的跨平台小程序运营。

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计