Board logo

标题: [转载教程] awk用法小结 [打印本页]

作者: Batcher    时间: 2009-4-1 23:14     标题: awk用法小结

  1. awk 用法:awk ' pattern {action} '
  2. 变量名                含义
  3. ARGC                命令行变元个数
  4. ARGV                命令行变元数组
  5. FILENAME        当前输入文件名
  6. FNR                当前文件中的记录号
  7. FS                输入域分隔符,默认为一个空格
  8. RS                输入记录分隔符
  9. NF                当前记录里域个数
  10. NR                到目前为止记录数
  11. OFS                输出域分隔符
  12. ORS                输出记录分隔符
  13. 1、awk '/101/'               file 显示文件file中包含101的匹配行。
  14.    awk '/101/,/105/'         file
  15.    awk '$1 == 5'             file
  16.    awk '$1 == "CT"'          file 注意必须带双引号
  17.    awk '$1 * $2 >100 '       file
  18.    awk '$2 >5 && $2<=15'     file
  19. 2、awk '{print NR,NF,$1,$NF,}' file 显示文件file的当前记录号、域数和每一行的第一个和最后一个域。
  20.    awk '/101/ {print $1,$2 + 10}' file 显示文件file的匹配行的第一、二个域加10。
  21.    awk '/101/ {print $1$2}'  file
  22.    awk '/101/ {print $1 $2}' file 显示文件file的匹配行的第一、二个域,但显示时域中间没有分隔符。
  23. 3、df | awk '$4>1000000 '         通过管道符获得输入,如:显示第4个域满足条件的行。
  24. 4、awk -F "|" '{print $1}'   file 按照新的分隔符“|”进行操作。
  25.    awk  'BEGIN { FS="[: \t|]" }
  26.    {print $1,$2,$3}'              file 通过设置输入分隔符(FS="[: \t|]")修改输入分隔符。
  27.    Sep="|"
  28.    awk -F $Sep '{print $1}'  file 按照环境变量Sep的值做为分隔符。   
  29.    awk -F '[ :\t|]' '{print $1}' file 按照正则表达式的值做为分隔符,这里代表空格、:、TAB、|同时做为分隔符。
  30.    awk -F '[][]'    '{print $1}' file 按照正则表达式的值做为分隔符,这里代表[、]
  31. 5、awk -f awkfile              file 通过文件awkfile的内容依次进行控制。
  32.    cat awkfile
  33. /101/{print "\047 Hello! \047"} --遇到匹配行以后打印 ' Hello! '.\047代表单引号。
  34. {print $1,$2}                   --因为没有模式控制,打印每一行的前两个域。
  35. 6、awk '$1 ~ /101/ {print $1}' file 显示文件中第一个域匹配101的行(记录)。
  36. 7、awk   'BEGIN { OFS="%"}
  37.    {print $1,$2}'           file 通过设置输出分隔符(OFS="%")修改输出格式。
  38. 8、awk   'BEGIN { max=100 ;print "max=" max}             BEGIN 表示在处理任意行之前进行的操作。
  39.    {max=($1 >max ?$1:max); print $1,"Now max is "max}' file 取得文件第一个域的最大值。
  40.    (表达式1?表达式2:表达式3 相当于:
  41.    if (表达式1)
  42.        表达式2
  43.    else
  44.        表达式3
  45.    awk '{print ($1>4 ? "high "$1: "low "$1)}' file
  46. 9、awk '$1 * $2 >100 {print $1}' file 显示文件中第一个域匹配101的行(记录)。
  47. 10、awk '{$1 == 'Chi' {$3 = 'China'; print}' file 找到匹配行后先将第3个域替换后再显示该行(记录)。
  48.     awk '{$7 %= 3; print $7}'  file 将第7域被3除,并将余数赋给第7域再打印。
  49. 11、awk '/tom/ {wage=$2+$3; printf wage}' file 找到匹配行后为变量wage赋值并打印该变量。
  50. 12、awk '/tom/ {count++;}
  51.          END {print "tom was found "count" times"}' file END表示在所有输入行处理完后进行处理。
  52. 13、awk 'gsub(/\$/,"");gsub(/,/,""); cost+=$4;
  53.          END {print "The total is $" cost>"filename"}'    file gsub函数用空串替换$和,再将结果输出到filename中。
  54.     1 2 3 $1,200.00
  55.     1 2 3 $2,300.00
  56.     1 2 3 $4,000.00
  57.     awk '{gsub(/\$/,"");gsub(/,/,"");
  58.     if ($4>1000&&$4<2000) c1+=$4;
  59.     else if ($4>2000&&$4<3000) c2+=$4;
  60.     else if ($4>3000&&$4<4000) c3+=$4;
  61.     else c4+=$4; }
  62.     END {printf  "c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"' file
  63.     通过if和else if完成条件语句
  64.     awk '{gsub(/\$/,"");gsub(/,/,"");
  65.     if ($4>3000&&$4<4000) exit;
  66.     else c4+=$4; }
  67.     END {printf  "c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"' file
  68.     通过exit在某条件时退出,但是仍执行END操作。
  69.     awk '{gsub(/\$/,"");gsub(/,/,"");
  70.     if ($4>3000) next;
  71.     else c4+=$4; }
  72.     END {printf  "c4=[%d]\n",c4}"' file
  73.     通过next在某条件时跳过该行,对下一行执行操作。
  74. 14、awk '{ print FILENAME,$0 }' file1 file2 file3>fileall 把file1、file2、file3的文件内容全部写到fileall中,格式为
  75.     打印文件并前置文件名。
  76. 15、awk ' $1!=previous { close(previous); previous=$1 }   
  77.     {print substr($0,index($0," ") +1)>$1}' fileall 把合并后的文件重新分拆为3个文件。并与原文件一致。
  78. 16、awk 'BEGIN {"date"|getline d; print d}'         通过管道把date的执行结果送给getline,并赋给变量d,然后打印。
  79. 17、awk 'BEGIN {system("echo \"Input your name:\\c\""); getline d;print "\nYour name is",d,"\b!\n"}'
  80.     通过getline命令交互输入name,并显示出来。
  81.     awk 'BEGIN {FS=":"; while(getline< "/etc/passwd" >0) { if($1~"050[0-9]_") print $1}}'
  82.     打印/etc/passwd文件中用户名包含050x_的用户名。
  83. 18、awk '{ i=1;while(i<NF) {print NF,$i;i++}}' file 通过while语句实现循环。
  84.     awk '{ for(i=1;i<NF;i++) {print NF,$i}}'   file 通过for语句实现循环。   
  85.     type file|awk -F "/" '
  86.     { for(i=1;i<NF;i++)
  87.     { if(i==NF-1) { printf "%s",$i }
  88.     else { printf "%s/",$i } }}'               显示一个文件的全路径。
  89.     用for和if显示日期
  90.     awk  'BEGIN {
  91. for(j=1;j<=12;j++)
  92. { flag=0;
  93.   printf "\n%d月份\n",j;
  94.         for(i=1;i<=31;i++)
  95.         {
  96.         if (j==2&&i>28) flag=1;
  97.         if ((j==4||j==6||j==9||j==11)&&i>30) flag=1;
  98.         if (flag==0) {printf "%02d%02d ",j,i}
  99.         }
  100. }
  101. }'
  102. 19、在awk中调用系统变量必须用单引号,如果是双引号,则表示字符串
  103. Flag=abcd
  104. awk '{print '$Flag'}'   结果为abcd
  105. awk '{print  "$Flag"}'   结果为$Flag
复制代码
原文地址:http://bbs.chinaunix.net/viewthread.php?tid=1260482




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2