研究計畫-專案詳細資料
摘要
本計畫擬使用Kaldi 語音辨識引擎,針對TwESC 台語語音資料庫做台語大詞彙連續語音辨識,亦即語音轉文字 (Speech to Text)。 TwESC 台語資料庫原是台灣的教育部舉辦台語朗讀比賽所選用的眾多台文作家所寫之短文, 聘請專人統一格式及用字來改寫之後, 聘請專人進錄音室所錄製的10 幾小時的【乾淨語音】(clean speech), 由我們的研究團隊對其做斷音、連結、標音、校正之後,所得的產品。 本研究計畫據此產生台語發音辭典、聲音模型、語言模型,擬以近10 年來最受歡迎的語音辨認開源工具 Kaldi 語音辨認引擎以及 HMM+DNN 架構,希望能把台語連續語音辨識之音節錯誤率做到 10% 以下, 文字之錯誤率在合理的語言模型之下也能做到 10% 以下。
Project IDs
系統編號:PB10703-1483
原計畫編號:MOST106-2221-E182-077
原計畫編號:MOST106-2221-E182-077
| 狀態 | 已完成 |
|---|---|
| 有效的開始/結束日期 | 01/08/17 → 31/07/18 |
Keywords
- 資訊科學--軟體
- 台語語音辨認
- KALDI 語音辨認工具軟體組合
- 隱馬可夫模型
- 深度學習神經網路
指紋
探索此研究計畫-專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。