NumPy提供了多種存取數組內容的文件操作函數。保存數組數據的文件可以是二進制格式或者文本格式。二進制格式的文件又分為NumPy專用的格式化二進制類型和無格式類型。
numpy格式的文件可以保存為后綴為(.npy/.npz)格式的文件
1. tofile()和fromfile()
- tofile()將數組中的數據以二進制格式寫進文件
- tofile()輸出的數據不保存數組形狀和元素類型等信息
- fromfile()函數讀回數據時需要用戶指定元素類型,并對數組的形狀進行適當的修改
import numpy as np
# 隨機生成12個數字并將其有一維轉換成3*4的矩陣形式
a = np.arange(12)
print("一維數組:",a)
a.shape = 3,4
print("3*4的矩陣:",a)
# 將數組中的數據以二進制格式寫入到文件
a.tofile('a.bin')
# fromfile在讀取numpy文件時需要自己指定數據格式,并且原格式并為保存
b1 = np.fromfile('a.bin', dtype=np.float) # 按照float讀取數據
b2 = np.fromfile('a.bin', dtype=np.int) # 按照int讀取數據
b3 = np.fromfile('a.bin', dtype=np.int32) # 按照int32讀取數據
print('float格式b1:{},\nint格式b2:{},\nint32格式b3:{}'.format(b1,b2,b3))
b3.shape = 3,4
print('b3:',b3)

2. save() 和 load(),savez()
- NumPy專用的二進制格式保存數據,它們會自動處理元素類型和形狀等信息
- 如果想將多個數組保存到一個文件中,可以使用savez()
- savez()的第一個參數是文件名,其后的參數都是需要保存的數組,也可以使用關鍵字參數為數組起名
- 非關鍵字參數傳遞的數組會自動起名為arr_0、arr_1、...。
- savez()輸出的是一個擴展名為npz的壓縮文件,其中每個文件都是一個save()保存的npy文件,文件名和數組名相同
- load()自動識別npz文件,并且返回一個類似于字典的對象,可以通過數組名作為鍵獲取數組的內容
import numpy as np
a = np.arange(12)
a.shape = 3,4
# 將數據存儲為npy/npz
np.save('a.npy', a)
np.save('a.npz', a)
c = np.load('a.npy')
print('save-load:',c)
# 存儲多個數組
b1 = np.array([[6, 66, 666],[888, 88,8]])
b2 = np.arange(0, 1.0, 0.1)
c2 = np.sin(b2)
np.savez('result.npz', b1,b2,sin_arry = c)
c3 = np.load('result.npz') # npz文件時一個壓縮文件
print(c3)
print("數組b1:{}\n數組b2:{}\n數組sin_arry:{}".format(c3['arr_0'],c3['arr_1'],c3['sin_arry']))

3. savetxt() 和 loadtxt()
- 讀寫1維和2維數組的文本文件
- 可以用它們讀寫CSV格式的文本文件
用這種方式來對數據進行存儲,方便深度學習中, 保存了訓練集,驗證集,測試集,還包括他們的標簽,用這個方式存儲起來,要啥加載啥,文件數量大大減少,也不會到處改文件名。算是get到了另外一種好的存儲數據的方式
參考:https://www.cnblogs.com/wushaogui/p/9142019.html
https://www.cnblogs.com/dmir/p/5009075.html
到此這篇關于python利用numpy存取文件案例教程的文章就介紹到這了,更多相關python利用numpy內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python NumPy灰度圖像的壓縮原理講解
- Python多進程共享numpy 數組的方法
- python中sqllite插入numpy數組到數據庫的實現方法
- python圖像處理基本操作總結(PIL庫、Matplotlib及Numpy)
- python numpy中multiply與*及matul 的區別說明
- 淺談Python numpy創建空數組的問題
- Python NumPy中diag函數的使用說明
- Python機器學習三大件之一numpy