文本处理神器 awk 命令详解

作者: Ginson 分类: Linux 发布时间: 2018-05-16 15:18

零、awk的基本知识

 

1、awk命令形式:

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

2、awk语法解释:

[-F|-f|-v] 大参数。-F指定分隔符,-f调用脚本,-v定义变量 var=value
‘  ‘ 引用代码块。
BEGIN 初始化代码块。在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符
// 匹配代码块。可以是字符串或正则表达式
{} 命令代码块。包含一条或多条命令,多条命令使用分号分隔
END 结尾代码块。在对每一行进行处理之后再执行的代码块,主要是进行最终计算或输出结尾摘要信息

 

3、awk内置变量:

FILENAME awk浏览的文件名
FNR 与NR类似,不过多文件记录不递增,每个文件都从1开始
FS 设置输入字段分隔符,同- F选项
NF 浏览记录的字段个数 awk ‘{print NF}’ file    //显示每行有多少字段
$NF 最后一个字段的值 awk ‘{print $NF}’ file    //将每行第NF个字段的值打印出来
NR 已读的记录数,理解为行号,多文件行号递增 awk ‘NR==5{print}’  file    //显示第5行
OFS 输出数据时,每个字段间以OFS制定的字符作为分隔符 awk ‘{print $3,$5,$4}’ OFS=”\n” file
ORS 输出数据时,每行记录间以OFS制定的字符作为分隔符 awk ‘{print $3,$5,$4}’ ORS=”\n” file

 

 

一、awk的大参数

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

1、-F 指定分隔符

可不写,不写时默认空格为分隔符

一个或多个连续的空格看做一个分隔符,即多个空格看做一个空格

可以定义多个分隔符,如 -F[./] 是指,同时以“.”和“/”作为分隔符

 

二、awk的引用代码块

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

1、操作符

综合看引用代码部分实际上相当于一个编程环境,支持很多操作符。如条件运算操作符、逻辑运算操作符等。

== 等于,精确比较 awk ‘$3==”48″ {print $0}’ file    只打印第3个字段等于”48″的记录
!= 不等于,精确比较 awk ‘$1 != “abc”‘ file    //提取第一个字段不是abc的行
~ 匹配,与==相比不是精确比较 awk ‘{if ($4~/abc/) print $0}’ file    //表示如果第四个字段包含abc,就打印整行
!~ 不匹配,不精确比较 awk ‘$0 !~ /abc/’ file      打印整条不包含abc的记录
&&  和 awk ‘{if ( $1==”a” && $2==”b” ) print $0}’ file    //如果第1、第2个字段值是a和b,打印整行
|| awk ‘{if ($1==”a” || $1==”b”) print $0}’ temp    //如果第1、第2个字段值是a或b,打印整行
 >  大于 awk ‘$1>500 {print $2}’ file     //如果字段1的值大于500,则打印字段2
>= 大于等于 awk ‘$1>=400 {print $2}’ file     //如果字段1的值大于等于400,则打印字段2
< 小于 awk ‘$1<200 {print $2}’ file     //如果字段1的值小于200,则打印字段2
<= 小于等于 awk ‘$1<=100 {print $2}’ file     //如果字段1的值小于等于100,则打印字段2
+ awk ‘{print $3+10}’ file    //字段3数值加10
awk ‘{print $3-10}’ file    //字段3数值减10
* awk ‘{print $3*10}’ file    //字段3数值乘10
/ awk ‘{print $3/10}’ file    //字段3数值除10

 

2、字符匹配代码块

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

①字符匹配代码支持针对字符串的操作符

需要注意的是,不支持部分针对数字的操作符

如 awk ‘$3>/200/ {print $1}’ baidu.log 中 $3>/200/ 实际没有生效,不管条件结果如何都会被忽略,直接print $1

②字符匹配代码块 // 中支持正则表达式

 

3、if语句

①必须用在{}中,且比较内容用()扩起来,支持if else

awk -F: ‘{if($1~/abc/) print $1}’ file     //简写

awk -F: ‘{if($1~/abc/) {print $1}}’  file    //全写

awk -F: ‘{if($1~/abc/) {print $1} else {print $2}}’ file    //if…else…

②有时不用if语句也可以实现同样效果图,如

awk -F: ‘{if($1~/abc/) {print $1}}’ file    //$1为指定内容才显示

awk -F: ‘$1~/abc/ {print $1}’ file    //与上面相同效果,没有用if语句,条件写在‘’外

 

4、while语句

与其他语言的while语句类似,条件为True时执行循环语句,False时不执行。

 

5、gsub命令

用gsub命令实现字符串的替换。语法:gsub(/要替换的字符串/,”替换为的字符串”,所在域)

awk ‘gsub(/Jan/,”1″,$1) {print $0}’    //将$1中的“Jan”替换为“1”并打印整行

 

 

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注