說明:
cut 按列切分文件,你可以指定分隔每列的定界符。在cut的術語中,每列都是一個字段,就是有時候說第一列,可能表述稱第一個字段。
實戰:
假設有文件data.txt,格式如下
NO Name Mark Percent
1 Sarath 45 90
2 Alex 49 98
3 Anu 45 90
分隔符(定界符)為Tab 制表符
如果我要取得第二列,所有人的名稱,有什么好的辦法嗎?此時cut該大顯身手了。
1. 取得2,3列 即name,和mark
$cut –f 2,3 data.txt
2. 取得除第3列以外所有列
$cut –f3 –complement data.txt
3. 采取其他定界符,可以用-d改變。
復制代碼 代碼如下:
假設data_comma.txt:
NO,Name,Mark,Percent
1,Sarath,45,90
2,Alex,49,98
3,Anu,45,90
則:
$cut –f2 -d"," data_comma.txt
解讀—help
用法:cut [選項]... [文件]...
從每個文件中輸出指定部分到標準輸出。
長選項必須使用的參數對于短選項時也是必需使用的。
-b, --bytes=列表 只選中指定的這些字節
-c, --characters=列表 只選中指定的這些字符
-d, --delimiter=分界符 使用指定分界符代替制表符作為區域分界
-f, --fields=列表 只選中指定的這些域;并打印所有不包含分界符的
行,除非-s 選項被指定
-n (忽略)
--complement 補全選中的字節、字符或域
-s, --only-delimited 不打印沒有包含分界符的行
--output-delimiter=字符串 使用指定的字符串作為輸出分界符,默認采用輸入
的分界符
--help 顯示此幫助信息并退出
--version 顯示版本信息并退出
僅使用f -b, -c 或-f 中的一個。每一個列表都是專門為一個類別作出的,或者您可以用逗號隔
開要同時顯示的不同類別。您的輸入順序將作為讀取順序,每個僅能輸入一次。
每種參數格式表示范圍如下:
N 從第1 個開始數的第N 個字節、字符或域
N- 從第N 個開始到所在行結束的所有字符、字節或域
N-M 從第N 個開始到第M 個之間(包括第M 個)的所有字符、字節或域
-M 從第1 個開始到第M 個之間(包括第M 個)的所有字符、字節或域
當沒有文件參數,或者文件不存在時,從標準輸入讀取
解讀:
1.取得某一列的字符或者字節 可以用-c, -b等
2.可以取得某個范圍
1和2綜合例子:
有文件range_data.txt,內容如下
復制代碼 代碼如下:
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
運行:$cut range_data.txt -c-2
打印字符1-2列
再復雜一點:
$cut range_data.txt -c1-3,6-9 --output-delimiter ","
打印1-3行,6-9行,并且用逗號分隔。
命令比較簡單,主要還是借鑒書籍《linux shell腳本攻略》,從附件中會看到一排格式很差的字母,嘗試用-s過濾掉他。
您可能感興趣的文章:- 一天一個shell命令 linux文本內容操作系列-awk命令詳解
- 使用Linux正則表達式靈活搜索文件中的文本
- 一天一個shell命令 linux文本操作系列-touch命令用法
- 一天一個shell命令 linux文本操作系列-head,tail命令詳解
- 一天一個shell命令 linux文本操作系列-diff命令詳解
- 一天一個shell命令 linux文本內容操作系列-grep命令詳解
- Linux使用文本編輯器vi常用命令
- 詳解Linux文本文件與WIN文本文件換行格式轉換命令
- 一天一個shell命令 linux文本操作系列-wc命令詳解
- Linux中查看文本的小技巧(超實用!)
- linux之cut命令的用法