2010年5月31日 星期一

專│題│報│導-TTS讓電子書用聽的

2010.05.30 中 時電子報


剛上市的「遠流金庸機」,使用工研院最新一代TTS技術,讓金庸小說不止用讀的、也能用「聽的」。      在21世紀的數位時代,我們可以閉著眼睛,在車上享受一段小說的有聲朗讀;也能在陌生的城市裡,讓語音導航輕鬆帶路,再也不必站在街角心慌地翻找地圖。 隨著MP3、手機、閱讀器或iPad的普及,輕巧的行動電子產品逐漸取代厚重的書籍,而資訊除了透過書面呈現,也將更依賴聽覺語音;現在,我們甚至連眼睛 都不用張開,就能「聽」到自己所要的資訊。
     >>語音效果超越「機器人聲」
     然而,未來應用廣泛的語音介面,將與過去我們熟悉的「有聲書」概念不同,因為這些播音的內容並非透過耗時費力的「真人錄音」,而是仰賴最新發展的 「TTS」(Text To Speech文字轉語音合成)技術,自動將文章內容轉換成合成語音。
     這項國際上早已投入發展的技術,在台灣由工研院領先研發,近10多年歷經了三代的技術變革。本周剛宣布上市的電子書閱讀器「遠流金庸機」,便使用了工研 院最新一代的TTS技術,可語音朗讀機器內建的36冊金庸武俠作品,讓金庸武俠不止用讀的、也能用「聽的」,對視力不佳、或在行動中不便閱讀螢幕的讀者來 說,都是非常方便的功能。
     >>大師霍金靠TTS發聲
     這項技術雖名為「合成」音,但並非不自然的機器音。工研院資通所郭志忠副主任表示,他們仍需找配音員錄音,來產生合成需要的聲音與韻律的統計模型和參 數,因此語音效果早就超越那種聲調僵硬的「機器人聲音」。研發過程中,最重要、也最困難的部分,就是必須結合分析音韻與詞語結構的語言學知識、建構音韻特 性模型的統計方法,以及合成語音波形的訊號處理技術,讓最後合成的閱讀聲音,不僅可做出自然流暢的語音,沒有字與字間拼接、不連貫的現象,還可自動判別日 期、金額等特殊數字或破音字的讀法等等。
     TTS能夠將電子檔的文字自動轉成語音,對視障者來說是重要且必要的功能,因此過去工研院曾與愛盲文教基金會合作,建構有聲書下載的公益平台。除了視障 者之外,車上的導航系統,或老人、兒童、語言學習者也都是TTS技術服務的廣大對象。其中最特別也最著名的例子為全身麻痺的美國物理學大師霍金,他就是透 過TTS技術將想表達的文字即時轉成語音發聲,與人溝通。
     郭志忠認為,過去真人錄音的有聲書因製作成本高,價格貴,所以普及度低。進入電子書時代後,文字都已經數位化,TTS技術將更有機會搭配電子書而普及。 「亞馬遜於2009年2月發表Kindle 2時,主要的新增特色就是TTS語音朗讀功能,可見這是電子書閱讀器發展的趨勢。」
     >>最大瓶頸在授權
     因為同時預見了這個趨勢,工研院與「遠流金庸機」的合作一拍即合。但郭志忠坦言,目前電子書發展最大的瓶頸在於版權的授權與管控問題。即便是將電子書透 過合成有聲播放,大部分出版社仍主張有聲書另有版權,如Kindle 2朗讀功能推出後,即被出版社控告侵犯版權、觸犯重製罪,最後Kindle只好退讓,僅提供願意授權開放的書籍這項功能。
     不過,除了電子書外,TTS還可應用在各種行動裝置,能夠取代電腦的多媒體影音裝置iPad就是一個指標。郭志忠樂觀地說,未來我們不再是坐在桌前、打 開電腦才能上網與閱讀,類似iPad的行動裝置可以讓我們隨意地在路上「聽」路況、在廚房裡「聽」食譜、在參觀博物館時即時「聽」導覽。「這時,可以讓人 在行動中使用的語音介面變得不可或缺,TTS的角色也將更重要了。」

來源:上鋐書庫 最新快訊

沒有留言: