国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python迅速掌握語音識別之知識儲備篇

Python迅速掌握語音識別之知識儲備篇

2022-03-05 14:22我是小白呀 Python

語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域

概述

從今天開始我們將開啟一個新的深度學習章節, 為大家來講述一下深度學習在語音識別 (Speech Recognition) 的應用. 語音識別技術可以將語音轉換為計算機可讀的輸入, 讓計算機明白我們要表達什么, 實現真正的人機交互. 希望通過本專欄的學習, 大家能夠對語音識別這一領域有一個基本的了解.

Python迅速掌握語音識別之知識儲備篇

 

RNN

RNN (Recurrent Neural Network) 即循環神經網絡, 用于處理輸入有相關性的任務. RNN 網絡包括一個輸入層, 一個隱層, 和一個輸出層組成, 如圖:

Python迅速掌握語音識別之知識儲備篇

 

計算

隱層 (Hidden Layer) 定義了整個網絡的狀態, RNN 網絡的計算過程如下:

Python迅速掌握語音識別之知識儲備篇

計算狀態 (State)

Python迅速掌握語音識別之知識儲備篇

計算輸出:

Python迅速掌握語音識別之知識儲備篇

 

RNN 存在的問題

梯度消失問題 (Vanishing gradient problem). 如果導數小于 1, 隨著網絡層數的增加梯度跟新會朝著指數衰減的方向前進, 這就是梯度消失, 如圖:

Python迅速掌握語音識別之知識儲備篇

我們可以看出, 隨著時間的增加, 深層的網絡對淺層的感知變得越來越微弱, 梯度接近于0.

梯度爆炸問題 (Exploding gradient problem). 如果導數大于 1, 隨著網絡層數的增加梯度跟新會朝著指數增加的方向前進, 這就是梯度爆炸. 當 RNN 網絡導數大于 1 時就會出現時序依賴, 從而造成梯度爆炸.

Python迅速掌握語音識別之知識儲備篇

 

LSTM

LSTM (Long Short Term Memory), 即長短期記憶模型. LSTM 是一種特殊的 RNN 模型, 解決了長序列訓練過程中的梯度消失和梯度爆炸的問題. 相較于普通 RNN, LSTM 能夠在更長的序列中有更好的表現. 相比 RNN 只有一個傳遞狀態 ht, LSTM 有兩個傳遞狀態: ct (cell state) 和 ht (hidden state).

Python迅速掌握語音識別之知識儲備篇

LSTM 增加了輸入門, 輸出門, 遺忘門 三個控制單元. LSTM 的 cell 會決定哪些信息被留下, 哪些信息被遺忘, 從而解決神經網絡中長序列依賴的問題.

 

GRU

GRU (Gate Recurrent Unit) 和 LSTM 類似, 但是更易于計算. GRU 由重置門, 更新門, 和輸出門組成. 重置門和 LSTM 的遺忘文作用一樣, 用于決定信息的去留. 同理, 更新門的作用類似于 LSTM 的輸入門.

Python迅速掌握語音識別之知識儲備篇

 

Seq2seq

Seq2seq 由 Encoder 和 Decoder 兩個 RNN 組成. Encoder 將變長序列輸出, 編碼成 encoderstate 再由 Decoder 輸出變長序列.

Python迅速掌握語音識別之知識儲備篇

 

Attention 模型

Attention 是一種用于提升 RNN 的 Encoder 和 Decoder 模型的效果的機制. 廣泛應用于機器翻譯, 語音識別, 圖像標注等多個領域. 深度學習中的注意力機制從本質上講和人類的選擇性視覺注意力機制類似. 核心目標也是從眾多信息中選擇出對當前任務目標更關鍵的信息.

Python迅速掌握語音識別之知識儲備篇

Attention 實質上是一種 content-based addressing 的機制. 即從網絡中某些狀態集合中選取給定狀態較為相似的狀態, 進而做后續的信息抽取.

Python迅速掌握語音識別之知識儲備篇

首先根據 Encoder 和 Decoder 的特征計算權值, 然后對 Encoder 的特征進行加權求和, 作為 Decoder 的輸入. 其作用的將 Encoder 的特征以更好的方式呈獻給 Decoder. (并不是所有的 context 都對下一個狀態的生成產生影響, Attention 就是選擇恰當的 context 用它生成下一個狀態.

 

Teacher Forcing 機制

早起的 RNN 在訓練過程中的預測能力非常弱, 如果一個 unit 預測錯了, 后面的 unit 就很難再獲取對的結果. 比如我們翻譯一句話:

  • Life is like a box of chocolates.You never know what you're going to get
  • 人生就像一盒巧克力,你永遠也不知道下一塊是什么味道

如果我們把 life 翻譯成 “西伯利亞”, 那么后面再翻譯對的可能性就幾乎為 0.

Python迅速掌握語音識別之知識儲備篇

Teacher Forcing 是一種網絡訓練的方法, 使用上一個 label 作為下一個 state 的輸入. 還是用上面的例子說明: 當使用 Teacher Forcing 機制的時候, 即時我們把 life 翻譯成 “西伯利亞”, 下一個 Decoder 的輸入我們會使用上一個的 label 作為 state, 即 “人生”, 而不是 “西伯利亞”. 這樣就大大提高了 RNN 網絡的預測能力.

到此這篇關于Python迅速掌握語音識別之知識儲備篇的文章就介紹到這了,更多相關Python 語音識別內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://blog.csdn.net/weixin_46274168/article/details/121437315

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 中国大陆高清aⅴ毛片 | 影音先锋亚洲资源 | 亚洲欧美视频 | 日韩毛片免费看 | 美女国产精品 | 亚洲视频一区 | 黄片毛片毛片毛片 | 成人在线免费观看小视频 | 亚洲一区在线日韩在线深爱 | 九九热这里只有精品8 | av特黄| 欧美黄色电影在线 | 狠狠干很很操 | 精品九九久久 | 久久亚洲黄色 | 91精品国产欧美一区二区成人 | 91精品视频在线播放 | 欧美日韩第一页 | 荷兰欧美一级毛片 | 午夜看片 | 亚洲欧洲自拍 | 一区二区三区国产视频 | av中文字幕在线 | 亚洲精品久久久久久一区二区 | 中文字幕一区在线 | 精品国产一区二区三区免费 | 亚洲免费在线播放 | 欧美日韩成人在线观看 | 国产精品99久久久久久www | 一区在线视频 | 日本中文一区二区 | 久久精品久久久久电影 | 日韩在线播放一区二区三区 | 国产伦理一区 | www.av在线| 免费在线看a | 精品福利片 | 视频黄色免费 | 亚洲成人av在线 | www.久| 黄视频在线观看免费 |