研究計畫-專案詳細資料
摘要
本計畫擬延續計畫主持人連續多年執行國科會計畫,有關於台語語音辨認的進一步研究,主要是從台語語音辨認之「聲學模型」進一步拓展至「語言模型」,以使台語連續語音辨認技術得以完整進行。在這個計畫中,我們擬逐年達成幾個階段性目標,最後目標放在電視廣播新聞節目的轉寫(transcription)系統,以協助產生台語的文語文資料,進一步協助台文電腦化教育、台文數位典藏等任務。我們所使用的方法為:– 整理現有朗讀式台語語音資料及文字資料– 運用幾項新演算法訓練聲學模型以及語言模型– 整理、校正新蒐集之台語廣播電視新聞語音資料庫、語言資料– 語料之自動切割、分群(分語言、分語者、分場景)– 運用輕監督型及非監督型訓練法則來訓練聲學模型以及語言模型– 運用幾項進階型語音辨認技術,改善辨識率我們逐年所欲達成之目標為:第一年• 連續朗讀式台語語音辨認目標:音節錯誤率 15%以內,發表相關論文。第二年• 台語廣播電視新聞語音辨認目標:音節錯誤率 25%以內,發表相關論文。第三年• 台語廣播電視戲劇節目語音辨認目標:音節錯誤率 15%以內,發表相關論文,台語節目語音自動轉寫系統之實作
Project IDs
系統編號:PB10001-0998
原計畫編號:NSC99-2221-E182-029-MY3
原計畫編號:NSC99-2221-E182-029-MY3
狀態 | 已完成 |
---|---|
有效的開始/結束日期 | 01/08/11 → 31/07/12 |
Keywords
- 資訊科學--軟體
指紋
探索此研究計畫-專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。