變量 |
說明 |
$n | 當前記錄的第n個字段,字段間由FS分隔。 |
$0 | 完整的輸入記錄。 |
ARGC | 命令行參數的數目。 |
ARGIND | 命令行中當前文件的位置(從0開始算)。 |
ARGV | 包含命令行參數的數組。 |
BINMODE | 在非POSIX系統上,這個變量指定的所有I / O使用二進制模式 |
CONVFMT | 數字轉換格式(默認值為%.6g) |
ENVIRON | 環境變量關聯數組。 |
ERRNO | 最后一個系統錯誤的描述。 |
FIELDWIDTHS | 字段寬度列表(用空格鍵分隔)。 |
FILENAME | 當前文件名。 |
FNR | 同NR,但相對于當前文件 |
FPAT |
這是一個正則表達式(字符串),告訴gawk基于匹配正則表達式的文本來創建字段 |
FS | 字段分隔符(默認是任何空格)。 |
IGNORECASE | 如果為真,則進行忽略大小寫的匹配。 |
LINT |
當這個變量為真(非零或非空),gawk的行為猶如"--lint"命令行選項 |
NF | 當前記錄中的字段數。 |
NR | 當前記錄數。 |
OFMT | 數字的輸出格式(默認值是%.6g)。 |
OFS | 輸出字段分隔符(默認值是一個空格)。 |
ORS | 輸出記錄分隔符(默認值是一個換行符)。 |
PROCINFO |
這個數組的元素提供訪問運行awk程序的信息 |
RLENGTH | 由match函數所匹配的字符串的長度。 |
RS | 記錄分隔符(默認是一個換行符)。 |
RT | 每次一條記錄被讀取的設置 |
RSTART | 由match函數所匹配的字符串的第一個位置。 |
SUBSEP |
數組下標分隔符(默認值是\034)。 |
TEXTDOMAIN | 此變量用于程序的國際化 |
藍色為新增加的內置變量。
簡單舉例:
1.
01.sed 1q /etc/passwd | awk '{ FS = ":"; print $1 }'
打印密碼第一行,用冒號分隔符
2.
打印文本FILENAME
3. seq 100 | awk 'NR==4,NR==6'
打印4到6行
再介紹幾個awk內置的字符串函數,也講一部分。
length(string):
返回字符串的長度
index(string,serch_string):
返回search_string在字符串中出現的位置
split(string,array,delimiter):
用定界符生成一個字符串列表,并將該列表存入數組
substr(string,array,delimiter):
在字符串中用字符起止便宜量生成子串,并返回該子串
sub(regex,replacement_str,string):
將正則表達式匹配到的第一處內容替換成replacement_str
gsub(regex,replacement_str,string):
和sub()類似。不過該函數會替換正則表達式匹配到的所有內容
match(regex,string):
檢查正則表達式是否能夠匹配字符串。如果能夠匹配,返回非0值;否則,返回0.match()有兩個相關的特殊變量,分別是RSTART喝RLENGTH。變量RSTART包含正則表達式所匹配內容的其實位置,而變量RLENGTH包含正則表達式所匹配內容的長度。
舉例:
1.$ awk '{ sub(/test/, "mytest"); print }' testfile
在整個記錄中匹配,替換只發生在第一次匹配發生的時候
2.$ awk '{ sub(/test/, "mytest"); $1}; print }' testfile
在整個記錄的第一個域中進行匹配,替換只發生在第一次匹配發生的時候
3.$ awk '{ print index("test", "mytest") }' testfile
實例返回test在mytest的位置,結果應該是3
4.$ awk '{ print length( "test" ) }'
實例返回test字符串的長度。
awk補充二
這節可能要寫的比較粗了,時間太少。
一. 內置函數
注意一種約定俗稱語法習慣: [a]代表a可選.
數字函數(Numeric Functions)
函數名 |
說明 |
atan2(y,x) | 返回y/x弧的反正切 |
cos(x) | 返回x的余弦 |
exp(x) | 返回x的指數 |
int(x) | 返回最靠近的整數,風向標指向0 |
log(x) | 返回x的自然對數 |
rand() | 返回隨機數 |
sin(x) | 返回x的正弦 |
sqrt(x) | 返回x的正平方根 |
srand([x]) | 生成隨機數,可以設置起點 |
字符串操作函數(String-Manipulation Functions)
注意:藍色部分為gawk特有,awk沒有此函數功能。
函數名 |
說明 |
asort(source [, dest [, how ] ]) | 返回數組元素數(內容較多) |
asorti(source [, dest [, how ] ]) | 同asort,(有細微差別) |
gensub(regexp, replacement, how [, target]) | 搜索正則表達式RegExp匹配的regexp |
gsub(regexp, replacement [, target]) | 將正則表達式匹配的第一處內容替換成replacement_str |
index(in, find) | 返回find在字符串in中出現的位置 |
length([string]) | string 中的字符數 |
match(string, regexp [, array]) | 檢查正則表達式能否匹配字符串 |
patsplit(string, array [, fieldpat [, seps ] ]) |
劃分件到由fieldpat定義的字符串,并存儲在array里,分隔字符串存在在seps數組 |
split(string, array [, fieldsep [, seps ] ]) | 用定界符生成一個字符串列表,并將該列表存入數組 |
sprintf(format, expression1, ...) | 打印 |
strtonum(str) | 字符轉轉換成數字 |
sub(regexp, replacement [, target]) | 將正則表達式匹配到的第一處內容替換成replacement |
substr(string, start [, length]) | 分割字符串,根據其實位置和長度 |
tolower(string) | 轉換成小寫 |
toupper(string) | 轉換成大寫 |
輸入輸出函數(Input/Output Functions)
函數 |
說明 |
close(filename [, how]) | 關閉文件輸入輸出流 |
fflush([filename]) | 刷新與文件名相關的任何緩沖輸出 |
system(command) | 執行操作系統命令,返回值給awk程序 |
時間函數(Time Functions)
函數 |
說明 |
mktime(datespec) | datespec為時間戳格式,與systime()格式一樣 |
strftime([format [, timestamp [, utc-flag]]]) | 格式化timestamp的內容,返回日期格式 |
systime() | 返回系統時間,精確到秒 |
位操作函數(Bit-Manipulation Functions)
函數 |
說明 |
and(v1, v2) | v1,v2的與操作結果 |
compl(val) | val的反碼 |
lshift(val, count) | 返回val左移count位的值 |
or(v1, v2) | v1,v2的或操作 |
rshift(val, count) | 返回val右移count位的值 |
xor(v1, v2) | 返回v1,v2的異或的值 |
獲取類型信息(Getting Type Information)
函數 |
說明 |
isarray(x) | 如果x是數組,返回true.否則false |
字符串轉換函數(String-Translation Functions)
函數 |
說明 |
bindtextdomain(directory [, domain]) | 設置awk要搜尋信息的目錄和域 |
dcgettext(string [, domain [, category]]) | 返回的字符串string 翻譯文本域domain 的語言環境類別category |
dcngettext(string1, string2, number [, domain [, category]]) |
返回string1和string2的翻譯數量的復數形式,string1,string2在語言環境類別的文本域里 |
內置函數還有些高級特性,等許多實例,以后有機會補充。
二. 自定義函數
格式入下:
如:
awk這個命令還有很多功能,打算就只寫這么多了。以后可能更多在一些例子里,與其他命令結合時會提到。