Lua解釋器對字符串的支持很有限。一個程序可以創建字符串并連接字符串,但不能截取子串,檢查字符串的大小,檢測字符串的內容。在Lua中操縱字符串的功能基本來自于string庫。
字符串庫中的一些函數是非常簡單的:
string.len(s) 返回字符串s的長度;
string.rep(s, n) 返回重復n次字符串s的串;你使用string.rep("a", 2^20)可以創建一個1M bytes的字符串(比如,為了測試需要);
string.lower(s) 將s中的大寫字母轉換成小寫(string.upper將小寫轉換成大寫)。如果你想不關心大小寫對一個數組進行排序的話,你可以這樣:
復制代碼 代碼如下:
table.sort(a, function (a, b) return string.lower(a) string.lower(b) end)
string.upper(s) 將s中的小寫字母轉換成大寫
string.upper和string.lower都依賴于本地環境變量。所以,如果你在 European Latin-1環境下,表達式:
復制代碼 代碼如下:
string.upper("a??o") --> "A??O"
string.sub(s,i,j) 函數截取字符串s的從第i個字符到第j個字符之間的串。Lua中,字符串的第一個字符索引從1開始。你也可以使用負索引,負索引從字符串的結尾向前計數:-1指向最后一個字符,-2指向倒數第二個,以此類推。所以, string.sub(s, 1, j)返回字符串s的長度為j的前綴;string.sub(s, j, -1)返回從第j個字符開始的后綴。如果不提供第3個參數,默認為-1,因此我們將最后一個調用寫為string.sub(s, j);string.sub(s, 2, -2)返回去除第一個和最后一個字符后的子串。
復制代碼 代碼如下:
s = "[in brackets]"
print(string.sub(s, 2, -2)) --> in brackets
記住:Lua中的字符串是恒定不變的。string.sub函數以及Lua中其他的字符串操作函數都不會改變字符串的值,而是返回一個新的字符串。一個常見的錯誤是:
復制代碼 代碼如下:
string.sub(s, 2, -2)
認為上面的這個函數會改變字符串s的值。如果你想修改一個字符串變量的值,你必須將變量賦給一個新的字符串:
復制代碼 代碼如下:
s = string.sub(s, 2, -2)
string.char函數和string.byte函數用來將字符在字符和數字之間轉換。string.char獲取0個或多個整數,將每一個數字轉換成字符,然后返回一個所有這些字符連接起來的字符串。string.byte(s, i)將字符串s的第i個字符的轉換成整數;第二個參數是可選的,缺省情況下i=1。下面的例子中,我們假定字符用ASCII表示:
復制代碼 代碼如下:
print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
上面最后一行,我們使用負數索引訪問字符串的最后一個字符。
Lua提供了string.format()函數來生成具有特定格式的字符串, 函數的第一個參數是格式(formatstring), 之后是對應格式中每個代號的各種數據. 由于格式字符串的存在, 使得產生的長字符串可讀性大大提高了. 這個函數的格式很像C語言中的printf().函數string.format在用來對字符串進行格式化的時候,特別是字符串輸出,是功能強大的工具。這個函數有兩個參數,你完全可以照C語言的printf來使用這個函數。第一個參數為格式化串:由指示符和控制格式的字符組成。指示符后的控制格式的字符可以為:十進制'd';十六進制'x';八進制'o';浮點數'f';字符串's'。在指示符'%'和控制格式字符之間還可以有其他的選項:用來控制更詳細的格式,比如一個浮點數的小數的位數:
格式字符串可能包含以下的轉義碼:
復制代碼 代碼如下:
%c - 接受一個數字, 并將其轉化為ASCII碼表中對應的字符
%d, %i - 接受一個數字并將其轉化為有符號的整數格式
%o - 接受一個數字并將其轉化為八進制數格式
%u - 接受一個數字并將其轉化為無符號整數格式
%x - 接受一個數字并將其轉化為十六進制數格式, 使用小寫字母
%X - 接受一個數字并將其轉化為十六進制數格式, 使用大寫字母
%e - 接受一個數字并將其轉化為科學記數法格式, 使用小寫字母e
%E - 接受一個數字并將其轉化為科學記數法格式, 使用大寫字母E
%f - 接受一個數字并將其轉化為浮點數格式
%g(%G) - 接受一個數字并將其轉化為%e(%E, 對應%G)及%f中較短的一種格式
%q - 接受一個字符串并將其轉化為可安全被Lua編譯器讀入的格式
%s - 接受一個字符串并按照給定的參數格式化該字符串
為進一步細化格式, 可以在%號后添加參數. 參數將以如下的順序讀入:
(1) 符號: 一個+號表示其后的數字轉義符將讓正數顯示正號. 默認情況下只有負數顯示符號.
(2) 占位符: 一個0, 在后面指定了字串寬度時占位用. 不填時的默認占位符是空格.
(3) 對齊標識: 在指定了字串寬度時, 默認為右對齊, 增加-號可以改為左對齊.
(4) 寬度數值
(5) 小數位數/字串裁切: 在寬度數值后增加的小數部分n, 若后接f(浮點數轉義符, 如%6.3f)則設定該浮點數的小數只保留n位, 若后接s(字符串轉義符, 如%5.3s)則設定該字符串只顯示前n位.
在這些參數的后面則是上述所列的轉義碼類型(c, d, i, f, ...).
復制代碼 代碼如下:
print(string.format("pi = %.4f", PI))
--> pi = 3.1416
d = 5; m = 11; y = 1990
print(string.format("%02d/%02d/%04d", d, m, y))
--> 05/11/1990
tag, title = "h1", "a title"
print(string.format("%s>%s/%s>", tag, title, tag))
--> h1>a title/h1>
第一個例子,%.4f代表小數點后面有4位小數的浮點數。第二個例子%02d代表以固定的兩位顯示十進制數,不足的前面補0。而%2d前面沒有指定0,不足兩位時會以空白補足。對于格式串部分指示符得詳細描述清參考lua手冊,或者參考C手冊,因為Lua調用標準C的printf函數來實現最終的功能。
以下是一些例子:
復制代碼 代碼如下:
string.format("%%c: %c", 83) 輸出S
string.format("%+d", 17.0) 輸出+17
string.format("%05d", 17) 輸出00017
string.format("%o", 17) 輸出21
string.format("%u", 3.14) 輸出3
string.format("%x", 13) 輸出d
string.format("%X", 13) 輸出D
string.format("%e", 1000) 輸出1.000000e+03
string.format("%E", 1000) 輸出1.000000E+03
string.format("%6.3f", 13) 輸出13.000
string.format("%q", "One\nTwo") 輸出"One\
Two"
string.format("%s", "monkey") 輸出monkey
string.format("%10s", "monkey") 輸出 monkey
string.format("%5.3s", "monkey") 輸出 mon
您可能感興趣的文章:- Lua中string.len()使用指南
- Lua中的string庫和強大的模式匹配學習筆記
- Lua loadstring函數用法實例
- Lua中的loadfile、dofile、loadstring、require用法實例
- Lua字符串庫(string庫)學習筆記
- LUA string庫使用小結
- Lua中實現StringBuffer功能
- Lua中字符串(string)淺析
- Lua中string.lower()使用指南