好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 教你使用Python建立任意層數的深度神經網絡

教你使用Python建立任意層數的深度神經網絡

熱門標簽:地圖標注與注銷 西青語音電銷機器人哪家好 電梯新時達系統(tǒng)外呼顯示e 成都呼叫中心外呼系統(tǒng)哪家強 無錫智能外呼系統(tǒng)好用嗎 宿州電話機器人哪家好 南昌地圖標注 旅游廁所地圖標注怎么弄 百應電話機器人總部

一、神經網絡介紹:

  神經網絡算法參考人的神經元原理(軸突、樹突、神經核),在很多神經元基礎上構建神經網絡模型,每個神經元可看作一個個學習單元。這些神經元采納一定的特征作為輸入,根據自身的模型得到輸出。

圖1 神經網絡構造的例子(符號說明:上標[l]表示與第l層;上標(i)表示第i個例子;下標i表示矢量第i項)

圖2 單層神經網絡示例

神經元模型是先計算一個線性函數(z=Wx+b),接著再計算一個激活函數。一般來說,神經元模型的輸出值是a=g(Wx+b),其中g是激活函數(sigmoid,tanh, ReLU, …)。

二、數據集

假設有一個很大的數據庫,里面記錄了很多天氣數據,例如,氣溫、濕度、氣壓和降雨率。

問題陳述:

一組訓練數據m_train,下雨標記為(1),不下雨標記為(0)。

一個測試數據組m_test,標記是否下雨。

每一個天氣數據包含x1=氣溫,x2=濕度,x3=氣壓。

機器學習中一個常見的預處理步驟是將數據集居中并標準化,這意味著從每個示例中減去整個numpy數組的平均值,然后將每個示例除以整個numpy數組的標準偏差。

  通用方法(建立部分算法)

  使用深度學習來建造模型

  1. 定義模型構造(例如,數據的輸入特征)

  2. 初始化參數并定義超參數(迭代次數、在神經網絡中的L層的層數、隱藏層大小、學習率α)

  3. 迭代循環(huán)(正向傳播(計算電流損耗)、計算成本函數、反向傳播(計算電流損耗)、升級參數(使用背景參數和梯度))

  4. 使用訓練參數來預測標簽(初始化)

更深層次的L-層神經網絡的初始化更為復雜,因為有更多的權重矩陣和偏置向量。下表展示了不同結構的各種層級。

表1 L層的權重矩陣w、偏置向量b和激活函數z

表2 示例架構中的神經網絡權重矩陣w、偏置向量b和激活函數z

表2幫助我們?yōu)閳D1中的示例神經網絡架構的矩陣準備了正確的維度。

import numpy as np
import matplotlib.pyplot as plt
nn_architecture = [
{"layer_size": 4,"activation": "none"}, # input layer
{"layer_size": 5,"activation": "relu"},
{"layer_size": 4,"activation": "relu"},
{"layer_size": 3,"activation": "relu"},
{"layer_size": 1,"activation": "sigmoid"}
]
def initialize_parameters(nn_architecture, seed = 3):
np.random.seed(seed)
# python dictionary containingour parameters "W1", "b1", ..., "WL","bL"
parameters = {}
number_of_layers = len(nn_architecture)
for l in range(1,number_of_layers):
parameters['W' + str(l)] =np.random.randn(
nn_architecture[l]["layer_size"],
nn_architecture[l-1]["layer_size"]
) * 0.01
parameters['b' + str(l)] =np.zeros((nn_architecture[l]["layer_size"], 1))
return parameters

代碼段1 參數初始化

  使用小隨機數初始化參數是一種簡單的方法,但同時也保證算法的起始值足夠好。

記住:

  • 不同的初始化工具,例如Zero,Random, He or Xavier,都會導致不同的結果。
  • 隨機初始化能夠確保不同的隱藏單元可以學習不同的東西(初始化所有權重為零會導致,所有層次的所有感知機都將學習相同的東西)。
  • 不要初始化為太大的值

三、激活函數

  激活函數的作用是為了增加神經網絡的非線性。下例將使用sigmoid and ReLU。

  Sigmoid輸出一個介于0和1之間的值,這使得它成為二進制分類的一個很好的選擇。如果輸出小于0.5,可以將其分類為0;如果輸出大于0.5,可以將其分類為1。

def sigmoid(Z):
    S = 1 / (1 + np.exp(-Z))
    return S

def relu(Z):
    R = np.maximum(0, Z)
    return R

def sigmoid_backward(dA, Z):
    S = sigmoid(Z)
    dS = S * (1 - S)
    return dA * dS

def relu_backward(dA, Z):
    dZ = np.array(dA, copy=True)
    dZ[Z = 0] = 0
    return dZ

  代碼段2 Sigmoid和ReLU激活函數,及其衍生物

  在代碼段2中,可以看到激活函數及其派生的矢量化編程實現。該代碼將用于進一步的計算。

四、正向傳播

  在正向傳播中,在層l的正向函數中,需要知道該層中的激活函數是哪一種(sigmoid、tanh、ReLU等)。前一層的輸出值為這一層的輸入值,先計算z,再用選定的激活函數計算。

圖3 神經網絡的正向傳播

線性正向模塊(對所有示例進行矢量化)計算以下方程式:

方程式1 線性正向函數

def L_model_forward(X, parameters, nn_architecture):
    forward_cache = {}
    A = X
    number_of_layers = len(nn_architecture)
    
for l in range(1, number_of_layers):
    A_prev = A
    W = parameters['W' + str(l)]
    b = parameters['b' + str(l)]
    activation = nn_architecture[l]["activation"]
    Z, A = linear_activation_forward(A_prev, W, b, activation)
    forward_cache['Z' + str(l)] = Z
    forward_cache['A' + str(l)] = A
    AL = A
return AL, forward_cache

def linear_activation_forward(A_prev, W, b, activation):
    if activation == "sigmoid":
        Z = linear_forward(A_prev, W, b)
        A = sigmoid(Z)
    elif activation == "relu":
        Z = linear_forward(A_prev, W, b)
        A = relu(Z)
    return Z, A

def linear_forward(A, W, b):
    Z = np.dot(W, A) + b
    return Z

代碼段3 正向傳播模型

使用“cache”(python字典包含為特定層所計算的a和z值)以在正向傳播至相應的反向傳播期間傳遞變量。它包含用于反向傳播計算導數的有用值。

五、損失函數

  為了管程學習過程,需要計算代價函數的值。下面的公式用于計算成本。

  方程式2 交叉熵成本

def compute_cost(AL, Y):
    m = Y.shape[1]
    # Compute loss from AL and y
    logprobs = np.multiply(np.log(AL), Y) + np.multiply(1 - Y, np.log(1 - AL))
    # cross-entropy cost
    cost = - np.sum(logprobs) / m
    cost = np.squeeze(cost)
    return cost

代碼段4 代價函數的計算

六、反向傳播

  反向傳播用于計算參數的損失函數梯度。該算法是由微分學中已知的“鏈規(guī)則”遞歸使用的。

  反向傳播計算中使用的公式:

方程式3 反向傳播計算公式

  鏈式法則是計算復合函數導數的公式。復合函數就是函數套函數。

方程式4 鏈規(guī)則示例

  “鏈規(guī)則”在計算損失時十分重要(以方程式5為例)。

方程式5 損失函數(含替換數據)及其相對于第一權重的導數

  神經網絡模型反向傳播的第一步是計算最后一層損失函數相對于z的導數。方程式6由兩部分組成:方程式2損失函數的導數(關于激活函數)和激活函數“sigmoid”關于最后一層Z的導數。

方程式6 從4層對z的損失函數導數

  方程式6的結果可用于計算方程式3的導數。

方程式7 損失函數相對于3層的導數

  在進一步計算中,使用了與第三層激活函數有關的損失函數的導數(方程式7)。

方程式8 第三層的導數

方程式7的結果和第三層活化函數“relu”的導數用于計算方程式8的導數(損失函數相對于z的導數)。然后,我們對方程式3進行了計算。

我們對方程9和10做了類似的計算。

方程式9 第二層的導數

方程式10 第一層的導數

七、總體思路

從第一層層對z的損失函數導數有助于計算(L-1)層(上一層)對損失函數的導數。結果將用于計算激活函數的導數。

圖4 神經網絡的反向傳播

def L_model_backward(AL, Y, parameters, forward_cache, nn_architecture):
    grads = {}
    number_of_layers =len(nn_architecture)
    m = AL.shape[1]
    Y = Y.reshape(AL.shape) # afterthis line, Y is the same shape as AL
    # Initializing thebackpropagation
    dAL = - (np.divide(Y, AL) -np.divide(1 - Y, 1 - AL))
    dA_prev = dAL
    for l in reversed(range(1,number_of_layers)):
        dA_curr = dA_prev
        activation =nn_architecture[l]["activation"]
        W_curr = parameters['W' +str(l)]
        Z_curr = forward_cache['Z' +str(l)]
        A_prev = forward_cache['A' +str(l-1)]
        dA_prev, dW_curr, db_curr =linear_activation_backward(dA_curr, Z_curr, A_prev, W_curr, activation)
        grads["dW" +str(l)] = dW_curr
        grads["db" +str(l)] = db_curr
    return grads
def linear_activation_backward(dA, Z, A_prev, W, activation):
    if activation =="relu":
        dZ = relu_backward(dA, Z)
        dA_prev, dW, db =linear_backward(dZ, A_prev, W)
    elif activation =="sigmoid":
        dZ = sigmoid_backward(dA, Z)
        dA_prev, dW, db =linear_backward(dZ, A_prev, W)
    return dA_prev, dW, db
def linear_backward(dZ, A_prev, W):
    m = A_prev.shape[1]
    dW = np.dot(dZ, A_prev.T) / m
    db = np.sum(dZ, axis=1,keepdims=True) / m
    dA_prev = np.dot(W.T, dZ)
    return dA_prev, dW, db

代碼段5 反向傳播模塊

更新參數

  該函數的目標是通過梯度優(yōu)化來更新模型的參數。

def update_parameters(parameters, grads, learning_rate):
    L = len(parameters)
    for l in range(1, L):
        parameters["W" +str(l)] = parameters["W" + str(l)] - learning_rate *grads["dW" + str(l)]
        parameters["b" +str(l)] = parameters["b" + str(l)] - learning_rate *grads["db" + str(l)]
    return parameters

全模型

神經網絡模型的完整實現包括在片段中提供的方法。

def L_layer_model(X, Y, nn_architecture, learning_rate = 0.0075,num_iterations = 3000, print_cost=False):
    np.random.seed(1)
    # keep track of cost
    costs = []
    # Parameters initialization.
    parameters =initialize_parameters(nn_architecture)
    # Loop (gradient descent)
    for i in range(0,num_iterations):
    # Forward propagation:[LINEAR -> RELU]*(L-1) -> LINEAR -> SIGMOID.
        AL, forward_cache =L_model_forward(X, parameters, nn_architecture)
        # Compute cost.
        cost = compute_cost(AL, Y)
        # Backward propagation.
        grads = L_model_backward(AL,Y, parameters, forward_cache, nn_architecture)
        # Update parameters.
        parameters =update_parameters(parameters, grads, learning_rate)
        # Print the cost every 100training example
        if print_cost and i % 100 ==0:
            print("Cost afteriteration %i: %f" %(i, cost))
            costs.append(cost)
            # plot the cost
    plt.plot(np.squeeze(costs))
    plt.ylabel('cost')
    plt.xlabel('iterations (pertens)')
    plt.title("Learning rate=" + str(learning_rate))
    plt.show()
    return parameters

代碼段7 整個神經網絡模型

只需要將已知的權重和系列測試數據,應用于正向傳播模型,就能預測結果。

  可以修改snippet1中的nn_架構,以構建具有不同層數和隱藏層大小的神經網絡。此外,準備正確實現激活函數及其派生函數(代碼段2)。所實現的函數可用于修改代碼段3中的線性正向激活方法和代碼段5中的線性反向激活方法。

進一步改進

  如果訓練數據集不夠大,則可能面臨“過度擬合”問題。這意味著所學的網絡不會概括為它從未見過的新例子。可以使用正則化方法,如L2規(guī)范化(它包括適當地修改成本函數)或退出(它在每次迭代中隨機關閉一些感知機)。

  我們使用梯度下降來更新參數和最小化成本。你可以學習更多高級優(yōu)化方法,這些方法可以加快學習速度,甚至可以為成本函數提供更好的最終價值,例如:

  •   小批量梯度下降
  •   動力
  •   Adam優(yōu)化器

參考:http://www.uml.org.cn/ai/201911251.asp

到此這篇關于Python建立任意層數的深度神經網絡的文章就介紹到這了,更多相關Python神經網絡內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • numpy創(chuàng)建神經網絡框架
  • python神經網絡編程之手寫數字識別
  • python機器學習之神經網絡
  • pytorch動態(tài)神經網絡(擬合)實現
  • Python如何使用神經網絡進行簡單文本分類
  • pytorch之深度神經網絡概念全面整理

標簽:雅安 贛州 許昌 渭南 七臺河 西安 辛集 濰坊

巨人網絡通訊聲明:本文標題《教你使用Python建立任意層數的深度神經網絡》,本文關鍵詞  教你,使用,Python,建立,任意,;如發(fā)現本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《教你使用Python建立任意層數的深度神經網絡》相關的同類信息!
  • 本頁收集關于教你使用Python建立任意層數的深度神經網絡的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 911在线无码精品秘?入口王者| 欧美日韩亚洲综合另类ac| 欧美精彩狠狠色丁香婷婷| 痴女地狱无限高潮H丝袜| 《熟妇荡欲》欧美电影| 午夜影视欧美一区二区三区| 后宫打屁股羞辱调教| 韩国理伦电影午夜三级演员表 | 免费人成激情视频在线看| 免费黄色三级网站| 亚洲午夜无码av| 浴室里的娇喘h| 真人一级毛片一级是A片真人片| 久久精品视频免费播放| 动漫美女被爆挤奶| ?国产精品嫩草影院?春菇| 别揉我奶?啊?嗯高潮了| h舔| 电影天堂在线观看三级| 色欲精品久久人妻av中文字幕| 七夕和女神酒店里高潮视频瞬间流出| 欧美四级在线| 猎艳校园美妇| 女教师被婬辱の教室XXX| 桥矿国语精品1果冻传媒| 日日碰日日摸日日澡| 久久免费区一区二区三波多野| 回复术士的重来人生第一季免费观看| 拍国产真实伦偷精品| 91人妻PORNY精品国产| freehd18xxxx中国| 日日摸夜夜爽啪啪A片漫画| 欧美在线视频第一页| 亚洲精品秘?一区二区三区在线观看 | 欧美另类69XXXXX| 久久精品国产亚洲AV成人雅虎| 欧美激情在线播放第16页| 美女脱内衣禁止18以下看免费下载| 亚洲AV综合色区无码三区50| 中文字幕国内精品日本Av| 靠逼模拟器|