深度學習（Deep Learning）基礎概念6：搭建2層神經網路的python實現

此專欄文章隨時更新編輯，如果你看到的文章還沒寫完，那麼多半是作者正在更新或者上一次沒有更新完，請耐心等待，正常的頻率是每天更新一篇文章。

此文章主要是吳恩達在Cursera上的系列課程“深度學習（DeepLearning）”的學習筆記，這一篇是關於第三週測試題的筆記，首發於知乎的專欄“深度學習+自然語言處理（NLP）”。

該系列文章的目的在於理清深度學習進的一些基本概念。

以下是正文：

====================================================================

先放出文章結構：

先看看我們要處理的資料

搭建神經網路模型

首先定義神經網路的結構

前向傳播

後向傳播

最佳化引數

整合模型

預測

====================================================================

1。先看看我們要處理的資料

本週作業的題目是：Planar data classification with one hidden layer，也就是用一層隱藏層的神經網路解決Planar data的分類問題。

什麼是Planar data？Planar data 來自於planar_utils這個庫，為了讀入這個資料我們需要先引用該庫：

from

planar_utils

import

load_planar_dataset

load_planar_dataset就是用來讀入資料的函式：

X， Y = load_planar_dataset（）

為了更加直觀，我們畫出函式影象：

看起來像是“鮮花形狀的資料”。

這是個二分類問題，也就是說圖中有兩類資料（紅色和藍色）。

我們的目的就是如何搭建很好的模型分類該資料。

我們先嚐試用傳統的邏輯迴歸演算法解決該問題，這裡忽略過程，直接看結果如下圖：

很明顯，簡單的用一條線分類，無法解決該問題！

2。搭建神經網路模型

先看一下我們要搭建的模型結構：

這張圖描述的是當輸入一組資料時，輸入層有兩個變數，隱藏層有4個‘神經元’，輸出層採用的是sigmoid函式，最後得到一個機率，如果該機率<0。5，我們就預測該組資料的輸出類別是0，反之是1。

為什麼輸入變數是2，因為輸入資料的特徵值有兩個：

shape_X

。

shape

（

‘The shape of X is： ’

str

（

shape_X

））

# The shape of X is：（2， 400）

為什麼隱藏層神經元的數量是4，因為這是我們自己設定的，簡單來說，神經元越多演算法的效能越好，直到過擬合。

2。1 首先定義神經網路的結構

如果我們用n_x， n_h， n_y分別代表輸入層、隱藏層、輸出層的大小。

顯然，根據我們第一部分講的內容，這些引數是由資料X和Y決定的。

n_x

。

shape

［

］

# size of input layer

n_h

n_y

。

shape

［

］

# size of output layer

這裡應該定義一個函式layer_sizes（X， Y），輸出是n_x， n_h， n_y，但是為了專注於講解程式碼思路，縮短篇幅，這裡全部省略了，想看完整程式碼可以點選文章最後的連結。

2。2 初始化模型引數

模型引數也就是我們的引數W1，b1，W2，b2。

這裡涉及到的問題就是，如何確定引數的維度，這裡的技巧是，每一層的W引數的行數是下一層的維度，列數是上一層的維度。b引數的行數是下一層的維度，列數是1。

以上圖舉例說明：對於引數W1來說，上一層是輸入層，維度是2，下一層是隱藏層，維度是4，所以W1的維度是4x2，b1的維度是4x1。

給出程式碼：

。

random

。

randn

（

n_h

，

n_x

）

0。01

。

zeros

（（

n_h

，

））

。

random

。

randn

（

n_y

，

n_h

）

0。01

。

zeros

（（

n_y

，

））

2。2 前向傳播

前向傳播在python中的實現，就是將上一層的輸出作為本層的輸入，然後代入公式計算，得到本層的輸出，再輸如給下一層。

先給出每一層的公式：

python程式碼實現：

。

dot

（

，

）

。

tanh

（

）

。

dot

（

，

）

sigmoid

（

）

然後，計算代價，代價函式公式如下：

python實現：

logprobs

。

multiply

（

。

log

（

），

）

。

multiply

（

。

log

（

），

）

cost

（

）

。

sum

（

logprobs

）

cost

。

squeeze

（

cost

）

# makes sure cost is the dimension we expect。

# E。g。， turns ［［17］］ into 17

2。3 後向傳播

後向傳播的目的就是為了最佳化引數。

怎麼最佳化呢？

首先，透過代價函式對引數求導得到每一個引數的梯度dW1，db1，dW2，db2

然後最佳化引數：

$\theta = \theta - \alpha \frac{\partial J }{ \partial \theta }$

，這裡的

$\theta$

代表我們模型的引數。

先給出後向傳播的公式：

python實現：

dZ2

dW2

（

）

。

dot

（

dZ2

，

。

）

db2

（

）

。

sum

（

dZ2

，

axis

，

keepdims

True

）

dZ1

。

dot

（

。

，

dZ2

）

（

。

power

（

，

））

dW1

（

）

。

dot

（

dZ1

，

。

）

db1

（

）

。

sum

（

dZ1

，

axis

，

keepdims

True

）

2。4 最佳化引數

最後一步，最佳化引數。

公式在2。3節已經給出：

$\theta = \theta - \alpha \frac{\partial J }{ \partial \theta }$

，這裡的

$\theta$

代表我們模型的引數，

$\alpha$

代表學習率，是我們自己定義的引數大小。

python實現比較簡單：

learning_rate

dW1

learning_rate

db1

learning_rate

dW2

learning_rate

db2

至此，已經完成了主要的工作，一個完整的神經網路已經搭建完成。

但是還有一個問題，迭代！

如果我們只最佳化一次引數是遠遠不夠的，我們需要進行大量的迭代，也就是不斷的完成“前向傳播->後向傳播->最佳化引數”的過程。

這就需要進行下一項工作：整合模型。

3。整合模型

將本文第二部分的工作整合，並進行大量的迭代。

python程式碼：

for

range

（

，

num_iterations

）：

### START CODE HERE ### （≈ 4 lines of code）

# Forward propagation。 Inputs： “X， parameters”。 Outputs： “A2， cache”。

，

cache

forward_propagation

（

，

parameters

）

# Cost function。 Inputs： “A2， Y， parameters”。 Outputs： “cost”。

cost

compute_cost

（

，

parameters

）

# Backpropagation。 Inputs： “parameters， cache， X， Y”。 Outputs： “grads”。

grads

backward_propagation

（

parameters

，

cache

，

）

# Gradient descent parameter update。 Inputs： “parameters， grads”。 Outputs： “parameters”。

parameters

update_parameters

（

parameters

，

grads

）

這裡的num_iterations，是迭代次數，可自行設定。

4。預測

完成了模型引數的最佳化，我們就可以使用該模型進行預測了。

python實現：

A2， cache = forward_propagation（X，parameters）

#predictions = （A2>0。5）

predictions = np。where（A2 > 0。5， 1， 0）

注意，預測的時候只需要利用前向傳播就可以了，因為模型已經最佳化完成，不再需要後向傳播。

至此，一個完整的用於解決二分類問題的神經網路的python實現已經完成了。

本文的完整python程式碼可以點選以下連結檢視：

吳恩達深度學習課程week3作業程式碼

深度學習（Deep Learning）基礎概念6：搭建2層神經網路的python實現

十年前的初戀情人再次想遇

張國立在相聲界輩分是怎樣的？與郭德綱是什麼關係？

隨便看看

五抖雞做法？

柳青和秋水最後結局？

2串1兩場贏一場有獎金嗎？

山西黃酒哪個牌子好？

深度學習（Deep Learning）基礎概念6：搭建2層神經網路的python實現

十年前的初戀情人再次想遇

張國立在相聲界輩分是怎樣的？與郭德綱是什麼關係？

猜你喜歡

我買鞋盒有三包的卡，然後走的時候店員說三個月之內保修？

請問大家嬰兒奶粉哪個牌子好？貝因美有機A2值得買嗎？

翡翠a2是什麼意思？

隨便看看

五抖雞做法？

柳青和秋水最後結局？

2串1兩場贏一場有獎金嗎？

山西黃酒哪個牌子好？