好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > Python 循環讀取數據內存不足的解決方案

Python 循環讀取數據內存不足的解決方案

熱門標簽:應電話機器人打電話違法嗎 手機網頁嵌入地圖標注位置 開封語音外呼系統代理商 400電話辦理哪種 河北防封卡電銷卡 開封自動外呼系統怎么收費 電銷機器人的風險 天津電話機器人公司 地圖標注線上如何操作

看代碼吧~

import gc
for x in list(locals().keys())[:]:
    del locals()[x]
# del all_s_x, AE, AE_split, x_ticks, split
gc.collect()

補充:Python讀取大文件的"坑“與內存占用檢測

python讀寫文件的api都很簡單,一不留神就容易踩”坑“。筆者記錄一次踩坑歷程,并且給了一些總結,希望到大家在使用python的過程之中,能夠避免一些可能產生隱患的代碼。

1.read()與readlines():

隨手搜索python讀寫文件的教程,很經常看到read()與readlines()這對函數。所以我們會常常看到如下代碼:

with open(file_path, 'rb') as f:
    sha1Obj.update(f.read())

or

with open(file_path, 'rb') as f:
    for line in f.readlines():
        print(line)

這對方法在讀取小文件時確實不會產生什么異常,但是一旦讀取大文件,很容易會產生MemoryError,也就是內存溢出的問題。

Why Memory Error?

我們首先來看看這兩個方法:

當默認參數size=-1時,read方法會讀取直到EOF,當文件大小大于可用內存時,自然會發生內存溢出的錯誤。

同樣的,readlines會構造一個list。list而不是iter,所以所有的內容都會保存在內存之上,同樣也會發生內存溢出的錯誤。

2.正確的用法:

在實際運行的系統之中如果寫出上述代碼是十分危險的,這種”坑“十分隱蔽。所以接下來我們來了解一下正確用,正確的用法也很簡單,依照API之中對函數的描述來進行對應的編碼就OK了:

如果是二進制文件推薦用如下這種寫法,可以自己指定緩沖區有多少byte。顯然緩沖區越大,讀取速度越快。

with open(file_path, 'rb') as f:
    while True:
        buf = f.read(1024)
        if buf:    
            sha1Obj.update(buf)
        else:
            break

而如果是文本文件,則可以用readline方法或直接迭代文件(python這里封裝了一個語法糖,二者的內生邏輯一致,不過顯然迭代文件的寫法更pythonic )每次讀取一行,效率是比較低的。筆者簡單測試了一下,在3G文件之下,大概性能和前者差了20%.

with open(file_path, 'rb') as f:
    while True:
        line = f.readline()
        if buf:    
            print(line)
        else:
            break
with open(file_path, 'rb') as f:
    for line in f:
        print(line)

3.內存檢測工具的介紹:

對于python代碼的內存占用問題,對于代碼進行內存監控十分必要。這里筆者這里推薦兩個小工具來檢測python代碼的內存占用。

memory_profiler

首先先用pip安裝memory_profiler

pip install memory_profiler

memory_profiler是利用python的裝飾器工作的,所以我們需要在進行測試的函數上添加裝飾器。

from hashlib import sha1
import sys
@profile
def my_func():
    sha1Obj = sha1()
    with open(sys.argv[1], 'rb') as f:
        while True:
            buf = f.read(10 * 1024 * 1024)
            if buf:
                sha1Obj.update(buf)
            else:
                break
    print(sha1Obj.hexdigest())
if __name__ == '__main__':
    my_func()

之后在運行代碼時加上** -m memory_profiler**

就可以了解函數每一步代碼的內存占用了

guppy

依樣畫葫蘆,仍然是通過pip先安裝guppy

pip install guppy

之后可以在代碼之中利用guppy直接打印出對應各種python類型(list、tuple、dict等)分別創建了多少對象,占用了多少內存。

from guppy import hpy
import sys
def my_func():
    mem = hpy()
    with open(sys.argv[1], 'rb') as f:
        while True:
            buf = f.read(10 * 1024 * 1024)
            if buf:
                print(mem.heap())
            else:
                break

如下圖所示,可以看到打印出對應的內存占用數據:

通過上述兩種工具guppy與memory_profiler可以很好地來監控python代碼運行時的內存占用問題。

4.小結:

python是一門崇尚簡潔的語言,但是正是因為它的簡潔反而更多了許多需要仔細推敲和思考的細節。希望大家在日常工作與學習之中也能多對一些細節進行總結,少踩一些不必要的“坑”。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • python入門for循環嵌套理解學習
  • python入門while循環語句理解學習
  • Python for 循環語句的使用
  • Python基礎之循環語句相關知識總結
  • python for循環賦值問題
  • Python循環結構詳解
  • Python基礎教程之循環語句(for、while和嵌套循環)
  • python 實現循環定義、賦值多個變量的操作
  • 10張動圖學會python循環與遞歸問題
  • Python 循環函數詳細介紹

標簽:六盤水 山東 常州 宿遷 蘭州 江蘇 駐馬店 成都

巨人網絡通訊聲明:本文標題《Python 循環讀取數據內存不足的解決方案》,本文關鍵詞  Python,循環,讀取,數據,內存,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python 循環讀取數據內存不足的解決方案》相關的同類信息!
  • 本頁收集關于Python 循環讀取數據內存不足的解決方案的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 三级极精品电影| 天天5g天天爽永久免费观看| 野外被强日本在线观看 | 国产愉拍91九色国产愉拍| 两个美女互脱内衣吃奶| 亚洲七七久久精品中文国产| 成人午夜A片无码一级毛片水浒传| 5G影院天天5g天天爽破解版下载| 久久久高清免费视频| 亚洲M码 欧洲S码SSS222| 欧美黑大粗硬毛片免费视频A片| 国产精品色情AAAAA片| 日韩怡春院| 免费精品国产自产拍在| 久久人人97超碰人人爱百度| 美女脱??免费看胸秘?| 男人吃奶玩乳免费视频| 91网址发布ebay| 亚洲精品嫩草研究院久久| 一级全黄录像免费观看| 2017亚洲男人天堂| 又爽又黄又无遮挡的美女游戏| 最全AⅤ番号库网| 外国毛片视频| 成年免费大片黄在线观看岛国| 日本三级和搜子同居的日子2| 久久久久久精品国自产| 99自拍视频在线观看| 日韩在线一区高清在线| 亚色视频在线| 日韩三级在线免费观看| 边吃奶边XXOO69XX| 久爱精品视频在线视频| 黄色激情网址| 超H大尺度成人漫画免费阅读| 无套中出丰满人妻无码99蜜AV| 太深了灬舒服灬太爽了| 精品国产免费人成在线观看| 性放荡的公交车| 欧美一区二区三区精品视频在线| 国产成人午夜片在线观看|