在linux中分割大文件,比如一個(gè)5gb日志文件,需要把它分成多個(gè)小文件,分割后以利于普通的文本編輯器讀取。
有時(shí),需要傳輸20gb的大文件到另一臺(tái)服務(wù)器,也需要把它分割成多個(gè)文件,這樣便于傳輸數(shù)據(jù)。
以下通過(guò)五個(gè)不同的例子,來(lái)講解Linux下分割大文件的方法,供大家參考。
例1、以每個(gè)文件1000行分割
split命令分割文件成每個(gè)文件1000行,并且文件名依次為 [前綴]aa, [前綴]ab, [前綴]ac等,默認(rèn)的前綴是X,每個(gè)文件的行數(shù)為1000行。
命令:
$ split mylog -l 1000
$ wc -l *
4450 mylog
1000 xaa
1000 xab
1000 xac
1000 xad
450 xae
例2、以每個(gè)文件20MB分割
分割文件為多個(gè)20MB的文件,附帶-b選項(xiàng)。
命令:
$ split -b 20M logdata
$ ls -lh | tail -n +2
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf
例3、以每個(gè)文件50MB指定前綴分割
使用–bytes選項(xiàng)把文件分割成多個(gè)50MB的文件,–bytes類(lèi)似-b選項(xiàng),在第二個(gè)參數(shù)指定前綴。
命令:
$ split --bytes=50M logdata mydatafile
$ ls -lh
total 204M
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac
例4、基于行數(shù)分割文件
使用-l選項(xiàng)指定行數(shù)來(lái)把文件分割成多個(gè)行數(shù)相同的文件。
命令:
$ wc -l testfile
2591 testfile
$ split -l 1500 testfile importantlog
$ wc -l *
1500 importantlogaa
1091 importantlogab
2591 testfile
例5、以數(shù)字后綴命名分割文件
使用-d選項(xiàng)可以指定后綴為數(shù)字,如00,01,02..,而不是aa,ab,ac。
命令:
$ split -d testfile
$ ls
testfile x00 x01 x02
可用選項(xiàng)
短選項(xiàng) 長(zhǎng)選項(xiàng) 選項(xiàng)描述
-b –bytes=SIZE SIZE 值為每一輸出檔案的大小,單位為 byte。
-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數(shù)。
-d –numeric-suffixes 使用數(shù)字作為后綴。
-l –lines=NUMBER NUMBER 值為每一輸出檔的列數(shù)大小。/p>
p>短選項(xiàng) 長(zhǎng)選項(xiàng) 選項(xiàng)描述
-b –bytes=SIZE SIZE 值為每一輸出檔案的大小,單位為 byte。
-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數(shù)。
-d –numeric-suffixes 使用數(shù)字作為后綴。
-l –lines=NUMBER NUMBER 值為每一輸出檔的列數(shù)大小。