小编给大家分享一下awk的特殊使用方法有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
awk是Unix环境下一种非常好的语言,适合于文本处理和报表生成,它还有许多精心设计的特性,允许进行特殊技巧程序设计。
在awk的文本处理规则里,awk将文本文件视为由字段和记录组成的文本数据库。默认情况下,awk将每一行视为一个记录,也就是说记录的分隔符是 ,记录的分隔符可以通过内置变量RS更改。
在每一个记录中,又把记录分为若干个字段,即记录由字段组成,而字段的默认分隔符为空格或制表符。
和我们平常使用的 Linux 命令一样, awk 也是遵循着某种格式来使用,格式如下:
# 使用格式 awk 执行的事件 文件
# 例如:
root@jaking-virtual-machine:~# awk '{print $0}' test.txtMy first language:Python My second language:Shell My third language:Java My fourth language:C
其中,print 表示打印,$0 表示一整个记录,test.txt 表示一个文件。所以
awk ‘{print $0}’ test.txt
表示把 test.txt 文件里面的每行记录都打印出来。
表示整个记录,不过1, 3…..则表示整个记录中的第一个字段,第二个字段……。
root@jaking-virtual-machine:~# awk '{print $1}' test.txtMy My My My root@jaking-virtual-machine:~# awk '{print $2}' test.txtfirst second third fourth root@jaking-virtual-machine:~# awk '{print $3}' test.txtlanguage:Python language:Shell language:Java language:C
刚才我们说字段的默认分隔符是空格或者制表符这些,默认意味着我们可以自己显式着指定分隔符。下面我们用“:”来作为我们的分隔符吧。
root@jaking-virtual-machine:~# awk -F ':' '{print $2}' test.txtPython Shell Java C
上面我们用参数 -F 指定了我们的分隔符,即如果想要指定字段的分隔符,可以用参数 -F 指定分隔符。
在打印文本的时候,我们可以指定一些条件。格式如下:
awk 参数 条件 要执行的动作 文件
例如我们指定分隔符为“:”,条件为第二个字段为”Java”的记录。
# 打印第二个字段为”Java”的文本
root@jaking-virtual-machine:~# awk -F ':' '$2 == "Java" {print $2}' test.txtJava
打印奇数行的的第二个字段:
# 打印奇数行的记录
root@jaking-virtual-machine:~# awk -F ':' 'NR % 2 == 1 {print $2}' test.txtPython Java
其中,NR 是一个内置的变量,表示当前正在处理的记录,即当前的记录是第几个记录。
和我们平常的编程一样,awk 也提供了 if, else, while 等这些条件语句。
例如,打印第二个及其之后的记录:
root@jaking-virtual-machine:~# awk '{if(NR > 1) print $2}' test.txtsecond third fourth
注意,上面的字段分隔符是空格了,并且 if 语句是在“{}” 里指定的。
再看一个例子:
root@jaking-virtual-machine:~# awk '{if($1 # 如果第一个字段小于“s",则打印第一个字段,否则打印第二个字段My My My My root@jaking-virtual-machine:~# awk '{if($1 > "s") print $1; else print $2}' test.txtfirst second third fourth root@jaking-virtual-machine:~# awk '{if($1 My My My My root@jaking-virtual-machine:~# awk '{if($1 > "l") print $1; else print $2}' test.txtfirst second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "c") print $1; else print $2}' test.txtfirst second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "d") print $1; else print $2}' test.txtfirst second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "p") print $1; else print $2}' test.txtfirst second third fourth root@jaking-virtual-machine:~# awk '{if($1 My My My My root@jaking-virtual-machine:~# awk '{if($3 language:Python language:Shell language:Java language:C root@jaking-virtual-machine:~# awk '{if($2 language:Python second third language:C root@jaking-virtual-machine:~# awk '{if($2 My second third My
awk 提供了一些内置函数来供我们使用,一下常用的函数如下:
tolower():字符转为小写。 toupper():字符转为大写 length():返回字符串长度。 substr():返回子字符串。 sqrt():平方根。 rand():随机数。 root@jaking-virtual-machine:~# awk '{print toupper($1)}' test.txtMY MY MY MY root@jaking-virtual-machine:~# awk '{print tolower($1)}' test.txtmy my my my root@jaking-virtual-machine:~# awk -F ':' '{print toupper($2)}' test.txtPYTHON SHELL JAVA C root@jaking-virtual-machine:~# awk -F ':' '{print tolower($2)}' test.txtpython shell java c
刚才我们说 NR 是一个表示当前正在处理的记录是第几个记录的内置变量,常用的内置变量如下:
NR:表示当前处理的是第几行 NF:表示当前行有多少个字段 FILENAME:当前文件名 FS:字段分隔符,默认是空格和制表符。 RS:行分隔符,用于分割每一行,默认是换行符。 OFS:输出字段的分隔符,用于打印时分隔字段,默认为空格。 ORS:输出记录的分隔符,用于打印时分隔记录,默认为换行符。
例如我们要打印每一个记录的最后一个字段,就可以使用变量 NF 了。
root@jaking-virtual-machine:~# awk '{print $NF}' test.txtlanguage:Python language:Shell language:Java language:C
对了,刚才那个 NR 的变量也是挺好用的,例如:
root@jaking-virtual-machine:~# awk '{print NR ". " $0}' test.txt1. My first language:Python 2. My second language:Shell 3. My third language:Java 4. My fourth language:C
以上是“awk的特殊使用方法有哪些”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。