好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > Pytorch數據讀取之Dataset和DataLoader知識總結

Pytorch數據讀取之Dataset和DataLoader知識總結

熱門標簽:開封自動外呼系統怎么收費 手機網頁嵌入地圖標注位置 開封語音外呼系統代理商 電銷機器人的風險 應電話機器人打電話違法嗎 天津電話機器人公司 400電話辦理哪種 地圖標注線上如何操作 河北防封卡電銷卡

一、前言

確保安裝

  • scikit-image
  • numpy

二、Dataset

一個例子:

# 導入需要的包
import torch
import torch.utils.data.dataset as Dataset
import numpy as np
 
# 編造數據
Data = np.asarray([[1, 2], [3, 4],[5, 6], [7, 8]])
Label = np.asarray([[0], [1], [0], [2]])
# 數據[1,2],對應的標簽是[0],數據[3,4],對應的標簽是[1]
 
 
#創建子類
class subDataset(Dataset.Dataset):
    #初始化,定義數據內容和標簽
    def __init__(self, Data, Label):
        self.Data = Data
        self.Label = Label
    #返回數據集大小
    def __len__(self):
        return len(self.Data)
    #得到數據內容和標簽
    def __getitem__(self, index):
        data = torch.Tensor(self.Data[index])
        label = torch.IntTensor(self.Label[index])
        return data, label
 
# 主函數
if __name__ == '__main__':
    dataset = subDataset(Data, Label)
    print(dataset)
    print('dataset大小為:', dataset.__len__())
    print(dataset.__getitem__(0))
    print(dataset[0])

 輸出的結果

我們有了對Dataset的一個整體的把握,再來分析里面的細節:

#創建子類
class subDataset(Dataset.Dataset):

創建子類時,繼承的時Dataset.Dataset,不是一個Dataset。因為Dataset是module模塊,不是class類,所以需要調用module里的class才行,因此是Dataset.Dataset!

lengetitem這兩個函數,前者給出數據集的大小**,后者是用于查找數據和標簽。是最重要的兩個函數,我們后續如果要對數據做一些操作基本上都是再這兩個函數的基礎上進行。

三、DatasetLoader

DataLoader(dataset,
           batch_size=1,
           shuffle=False,
           sampler=None,
           batch_sampler=None,
           num_works=0,
           clollate_fn=None,
           pin_memory=False,
           drop_last=False,
           timeout=0,
           worker_init_fn=None,
           multiprocessing_context=None)

功能:構建可迭代的數據裝載器;
dataset:Dataset類,決定數據從哪里讀取及如何讀取;數據集的路徑
batchsize:批大小;
num_works:是否多進程讀取數據;只對于CPU
shuffle:每個epoch是否打亂;
drop_last:當樣本數不能被batchsize整除時,是否舍棄最后一批數據;
Epoch:所有訓練樣本都已輸入到模型中,稱為一個Epoch;
Iteration:一批樣本輸入到模型中,稱之為一個Iteration;
Batchsize:批大小,決定一個Epoch中有多少個Iteration;

還是舉一個實例:

import torch
import torch.utils.data.dataset as Dataset
import torch.utils.data.dataloader as DataLoader
import numpy as np
 
Data = np.asarray([[1, 2], [3, 4],[5, 6], [7, 8]])
Label = np.asarray([[0], [1], [0], [2]])
#創建子類
class subDataset(Dataset.Dataset):
    #初始化,定義數據內容和標簽
    def __init__(self, Data, Label):
        self.Data = Data
        self.Label = Label
    #返回數據集大小
    def __len__(self):
        return len(self.Data)
    #得到數據內容和標簽
    def __getitem__(self, index):
        data = torch.Tensor(self.Data[index])
        label = torch.IntTensor(self.Label[index])
        return data, label
 
if __name__ == '__main__':
    dataset = subDataset(Data, Label)
    print(dataset)
    print('dataset大小為:', dataset.__len__())
    print(dataset.__getitem__(0))
    print(dataset[0])
 
    #創建DataLoader迭代器,相當于我們要先定義好前面說的Dataset,然后再用Dataloader來對數據進行一些操作,比如是否需要打亂,則shuffle=True,是否需要多個進程讀取數據num_workers=4,就是四個進程
 
    dataloader = DataLoader.DataLoader(dataset,batch_size= 2, shuffle = False, num_workers= 4)
    for i, item in enumerate(dataloader): #可以用enumerate來提取出里面的數據
        print('i:', i)
        data, label = item #數據是一個元組
        print('data:', data)
        print('label:', label)

四、將Dataset數據和標簽放在GPU上(代碼執行順序出錯則會有bug)

這部分可以直接去看博客:Dataset和DataLoader

總結下來時有兩種方法解決

1.如果在創建Dataset的類時,定義__getitem__方法的時候,將數據轉變為GPU類型。則需要將Dataloader里面的參數num_workers設置為0,因為這個參數是對于CPU而言的。如果數據改成了GPU,則只能單進程。如果是在Dataloader的部分,先多個子進程讀取,再轉變為GPU,則num_wokers不用修改。就是上述__getitem__部分的代碼,移到Dataloader部分。

2.不過一般來講,數據集和標簽不會像我們上述編輯的那么簡單。一般再kaggle上的標簽都是存在CSV這種文件中。需要pandas的配合。

這個進階可以看:WRITING CUSTOM DATASETS, DATALOADERS AND TRANSFORMS,他是用人臉圖片作為數據和人臉特征點作為標簽。

到此這篇關于Pytorch數據讀取之Dataset和DataLoader知識總結的文章就介紹到這了,更多相關詳解Dataset和DataLoader內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Pytorch dataloader在加載最后一個batch時卡死的解決
  • pytorch鎖死在dataloader(訓練時卡死)
  • Pytorch 如何加速Dataloader提升數據讀取速度
  • pytorch DataLoader的num_workers參數與設置大小詳解
  • 我對PyTorch dataloader里的shuffle=True的理解
  • pytorch中DataLoader()過程中遇到的一些問題

標簽:六盤水 宿遷 常州 江蘇 山東 蘭州 駐馬店 成都

巨人網絡通訊聲明:本文標題《Pytorch數據讀取之Dataset和DataLoader知識總結》,本文關鍵詞  Pytorch,數據,讀,取之,Dataset,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Pytorch數據讀取之Dataset和DataLoader知識總結》相關的同類信息!
  • 本頁收集關于Pytorch數據讀取之Dataset和DataLoader知識總結的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 欧美精品中文字幕在线| 女尊总攻乱yin荡生活H| 午夜电影免费看| 闷骚艳岳的婬乱生活| 99久久大香伊蕉在人线国产| 尤果网美女大尺度写真| 久久99热这里只频精品6中文字幕 国产高清不卡视频在线播放 | 欧美三级在线观看不卡视频| 男女交媾视频| 国产一级特黄高清免费大片| 欲女-经典片-K8经典网| 女人操女人逼| 久久婷婷色| 美女131亚洲精品A片| 国内小情侣一二三区在线视频| ass欧美大白屁股ass| 少妇真人直播免费视频| 在公交车上弄到高C了怎么办 | 337p粉嫩欧洲亚洲大胆色| 国产真实乱人偷精品视频| 亚洲美女视频免费| 国内久久久久久久久久| 成人a大片高清在线观看| 美女扒开内裤免费视频| 国模静欣大尺度啪啪私拍| 熟女少妇亚洲综合色蜜乳| 91亚洲人成手机在线观看| 免费在线成人网| Japanese熟女少妇XXX| 在线看《甜性涩爱》| 王爷攻×暗卫受r18肉| 国产伦精品一品二品三品| 国产做受18~20岁A片潘金莲| 黄色免费小网站| 隔壁的老师呻吟声| gay调教贱奴伺候主人| 国产一级婬片A片AA片| 中文娱乐网在线观看| 丁香八月婷婷| 久久免费看A片毛片老牛69 | 双乳挺拔圆润饱满的双乳|