Project Details
Abstract
由於本計畫主持人及共同主持人過去數年在國科會及長庚大學之經費支援下,已成功地建立以台語為主之智慧型語音處理環境(包含台語語音資料庫、華台雙語語音辨識以及台語語音合成技術),近年來更頻頻發表有關語者確認、音樂處理相關之論文。以此為基礎,本研究計畫擬以三年時間,針對台灣地區最廣泛使用的三種漢語,包括華語(Mandarin)、台語(Taiwanese)以及客語(Hakka),從事不特定人(Speaker Independent)語音辨識技術以及語音合成技術之研發,並期最終能開發出適用於各式嵌入式系統的多語語音處理技術。本計畫著重的重點在於以下幾點:1. 整理已有的多語語音資料庫以供本計畫之語音辨識技術使用2. 進一步為語音合成技術開發合適的資料庫3. 改善多語語音模型演算法,加入發音變異模型以解決中文漢語之「一字多音」問題4. 加強「強韌型」(Robust)語音辨識之技術研發,以適合多種應用場合之聲學環境5. 加入語者調適技術,以適合多種腔調之使用人6. 整合(本實驗室已有之)語音合成技術,並增加多語之選項7. 增加語者確認技術之研發並研究以之作為嵌入型系統之身份認證應用之可行性8. 精簡程式碼以轉移至嵌入型系統中,建立展示系統本計畫擬以三年時間並逐年依下列幾個步驟來達成上述研究目標:1. 多語言語音資料庫之整理 (Speech Corpus) (第一年)2. 多語言語音單位模型之建立及多語語音辨識核心程式 (Multilingual Acoustic Model& Speech Recognizer ) (第一年)3. 多語言關鍵詞「文對音」之轉換 (Grapheme-to-Phoneme) (第一年)4. 多語言語音合成 (TTS) (第二年)5. 強健性語音辨識技術之運用 (Robust Speech Recognition) (第二年)6. 關鍵詞確認 (Out-Of-Vocabulary Word Rejection for Speech Recognition) (第二年)7. 語者確認 (Speaker Verification) (第三年)8. 程式轉移至嵌入式系統之工程 (Porting to Embedded System) (第二、三年)
Project IDs
Project ID:PB9308-2756
External Project ID:NSC93-2213-E182-008
External Project ID:NSC93-2213-E182-008
Status | Finished |
---|---|
Effective start/end date | 01/08/04 → 31/07/05 |
Fingerprint
Explore the research topics touched on by this project. These labels are generated based on the underlying awards/grants. Together they form a unique fingerprint.