1.awk數組描述
在其他的編程語言中,數組的下標都是從0開始的,也就是說,如果想反向引用數組中 的第一個元素,則需要引用對應的下標[0],在awk中數組也是通過引用下標的方法,但是在awk中數組的下標是從1開始的,在其他語言中,你可能會習慣于先“聲明”一個數組,在awk中,則不用這樣,直接為數組的元素賦值即可(其實如果自己給數組賦值,下標從1或者從0開始那就無所謂了?。?/p>
2.在聲明數組時,可能值很多,命令太長,降低命令可讀性,所以使用反斜杠“\”,來進 行換行,效果是完全一樣的,代碼如下所示:
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three"\
;arr[4]="four";print arr[3]}'
three
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";arr[4]="four";print arr[3]}'
three
3.數組的元素設置為空,是允許的,當數組中沒有某個元素而直接引用它的時候,它默認被賦值為空,所以判斷某個元素是否存在,不能采用數組元素值為空的方法,而應該采用下面的方法:
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";if(4 in arr){print "four in this arr"}}'
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";if(3 in arr){print "three in this arr"}}'
three in this arr
也可以采用取反的方式(使用運算符?。?/p>
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";if(!(4 in arr)){print "four not in this arr"}}'
four not in this arr
4.awk數組下標
在awk中數組的下標不僅可以是“數字”,還可以是“任意字符串”,其實,awk中的數組本來就是“關聯數組”,之所以先用數字作為下標舉例子是為了方便之前的習慣,能夠有個好的過渡,不過,以數字作為數組的下標在某些場景有一定的優勢,但是本質上也是“關聯數組”,awk默認會把“數字”下標轉換成“字符串”,所以它本質上還是一個使用字符串作為下標的“關聯數組”
5.刪除數組元素
使用 delete 可以刪除數組中的元素,也可以使用 delete 刪除整個數組
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";\
> delete arr[1];print arr[1]}'
____(空)
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";\
print arr[1];print arr[3];delete arr;print arr[1]}'
one
three
____(空)
6.使用for循環遍歷數組
語法:for(變量 in 數組名){ 代碼語句 }
注:其中變量循環的是數組的下標
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";arr[4]="four";\
> for ( i in arr){print arr[i]}}'
four
one
two
three
#無序的打印數組元素,進一步證明其是“關聯數組”
#有序的打印數組元素
[zkpk@master as]$ awk 'BEGIN{arr[1]="one";arr[2]="two";arr[3]="three";arr[4]="four";\
for ( i=1;i<=4;i++){print arr[i]}}'
one
two
three
four
7.awk數組使用實例
[zkpk@master as]$ awk 'BEGIN{a=1;print a; a=a+1 ; print a}'
1
2
[zkpk@master as]$ awk 'BEGIN{a=1;print a; a++ ; print a}'
1
2
將變量a設置為1,對其進行自加運算,則其數值會增加1,這不難理解,那么如果變量a是一個字符串哪?
[zkpk@master as]$ awk 'BEGIN{a="test";print a; a++ ; print a}'
test
當a的值為字符串時,竟然也可以參與運算,而且可以看出,字符串被當成數字0參與運算,那么空字符串參與運算時也會被當成0運算嗎?
[zkpk@master as]$ awk 'BEGIN{a="";print a; a++ ; print a}'
____(空)
結果顯示,空字符串在參與運算時也會被當做數字0,之前我們說過,當我們引用數組中一個不存在的元素,元素被賦值成空字符串,當對這個元素進行自加運算時,元素的值就變成了1,因此當我們對一個不存在的元素進行自加運算后,這個元素的值就變成了自加的次數,自加x次,元素的值就被賦值為x,自加y次元素的值就被賦值為y,所以我們可以通過awk數組的這個特性來統計文本中某字符串出現的次數,代碼如下所示
[zkpk@master as]$ cat text
Alice
Bob
Tom
Peter
Alice
Alice
Tom
Bob
Peter
Bob
[zkpk@master as]$ awk '{count[$1]++};END{for(i in count){print i,count[i]}}' text
Bob 3
Tom 2
Alice 3
Peter 2
這回你該發現awk數組這個特性的強大所在了吧,好,也許你會說我不用awk照樣可以統計啊,代碼如下所示:
[zkpk@master as]$ cat text | sort | uniq -c
3 Alice
3 Bob
2 Peter
2 Tom
好吧,我承認你這個思路很棒,但是你看看下面例子哪?統計文本中人名出現的次數
[zkpk@master as]$ cat -tE text
Alice^IBob$
Bob^IAlice Alice Peter$
Tom Bob$
Peter Alice $
Alice Tom$
Alice^I^ITom $
Tom Peter$
Bob Bob$
Peter Alice$
Bob Alice Alice Tom$
#我們可以看出上面的文本中人名之間的分隔符有制表符,也有空格,來吧,統計人名出現的次數吧,
#我使用awk數組的方式可以這樣統計
[zkpk@master as]$ awk '{for(i=1;i<=NF;i++){count[$i]++} }END{for(j in count)\
{print j , count[j]}}' text
Bob 6
Tom 5
Alice 9
Peter 4
但若你不用awk,非得用其他命令實現可以參考如下代碼( ^_^ )
[zkpk@master as]$ cat text | tr -s "\t" " " | tr -s " " "\n" | sort | uniq -c
9 Alice
6 Bob
4 Peter
5 Tom
結尾
本文介紹了awk數組的基本使用方法,但是要學會靈活的運用,我在上面的示例中也寫出了一些可以在某種程度上替換awk數組的方式,所以本文不單單是介紹awk數組該如何使用,而是如何在合適的場景,選擇出最優的解決方案,快速高效的解決問題。這就是我一直追求的,也是我學習Linux命令的真實意圖。
以上所述是小編給大家介紹的Linux中的awk數組的基本使用方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!