技術論壇
發文時間 2020/05/13 作者 linda.lin
瀏覽次數 4810 留言數量 4 按讚 0
自然語言類 語音助理中文閩南語
大家一定對於google語音助理和蘋果的siri小姐不陌生吧?!
但是如果要讓小眾的閩南語人士也可以一同感受語音助理的便利性,未來會有人開發閩南語的系統嗎?如果要開發這樣的語音辨識系統跟中文的有什麼不同?難易度又是如何呢?
發文時間 2020/05/14 作者 omnixri
按讚 0
我想你問的「閩南語」應該是指台語吧?
目前台語是非常難搞的,光主流腔調就有「漳州」、「泉州安溪」、「泉州同安」及混合腔,另外還有地方發展出的特有腔調如「宜蘭腔」,而台灣漳州腔使用人口較多,如有興趣可以參考一下陳淑娟著「台灣閩南語新興的語音變異」。若再擴大至外島如澎湖、金門、馬祖那又加入更多閩南、閩北語系的腔調。如果你的資料集只有漳州口音,那我講泉州口音可能就常會聽錯,資料建立時就會需花費更多人力物力。
另外台語還混雜很多外來語,尤其深受日語影響產生許多原本「閩南語」沒有的詞彙,如便當等等。若再加上不同語系對同一單詞的說法不同,那可能在建立詞庫、語料庫上就更加困難,如讀書會有讀書和讀冊,肥皂則有薩文、雪文、茶箍等不同發音。
發文時間 2020/05/14 作者 omnixri
按讚 0
先前工研院曾發展過台語版的智慧語音助理,但目前不知是否有繼續。
可參考影片:工研院ITRI智慧語音助理 台語嘛ㄟ通 https://youtu.be/KIbHKWsJkis
另外威盛轉投資公司歐拉蜜OLAMI,也有發展台語辨識服務,
可參考影片:唉呦不錯哦!~ (正港) OLAMI 說台語也會通! https://tw.olami.ai/blog/article/74
不過台語辨識會遇到更麻煩的地方是國台語混講問題,這就有賴技術開發人員多費些心力建構更大的語料庫及模型來改善了。
順帶說一下,客家話語音助理目前還沒什麼人投入,只有看到對岸科大訊飛有開發,希望台灣也能有廠商能投入,造福一下台灣客家族群。
發文時間 2020/05/15 作者 laisan86
按讚 0
其實就技術面的觀點來說, 語音也是被電腦變成數據來判讀, 舉例而言脈衝編碼調變(Pulse-code modulation, PCM)就常被用在將麥克風收到的聲音, 把訊號依照振幅(強弱大小)等分成數個不同的段, 然後每個不同的段都用獨特的二進位方式來編碼, 這樣就能達到量化的效果
因而我們人類的聲音, 不管你講的是哪一國的語言, 台語、客語、國語、英語...通通變成數值! 所以就很適合透過神經網路進行訓練形成模型, 藉由這樣保留下來就成了能夠識別語音的方式
發文時間 2020/05/16 作者 bioasura
按讚 0
在進行語音辨識之前, 有幾個基本的資料需要建立, 或者要有相關的技術已經完備, 資料方面, 主要需要有相關辨識語言所累積出來的語料庫, 以及相關針對語句的斷詞系統, 而在語音資料辨識的部份, 需要蒐集足夠資料量的各個語詞的說話輸入的資料, 所形成的資料集合, 這樣才能夠進行後續的語音辨識的訓練與預測模型.
語料庫的部份, 相關的台語的辭典, 或是字典, 有一些民間的人士長年的有在自己蒐集與累積, 其中教育部有提供了一個基本的台語的語料辭典, 不過如果對應回一般日常生活中的用語詞彙, 很多其實並沒有收入在裡面, 基本上語音辨識最後需要對應回語意的解析, 通常面對同音異詞的問題, 沒有前後文的語意對照, 一般很困難做出正確的解析與對應.
要做好台語的語音辨識, 最基礎的工作與資料集, 是需要建立一個語音的資料集, 並且標注這些語音資料集對應的台語詞, 沒有這一個基礎工作的完成, 後面的資料庫通常無法完成.
目前不確定台灣是否有這樣的公開資料集, 也許民間有公司對應自己蒐集了語料也做出了部份的特殊環境對應的語音指令辨識系統, 但是在通用對話的語料跟語音系統, 似乎沒有看到坊間有這樣的資料集的維護與出現.
教育部有提供了一些線上的臺語文資源可能會有一些用, 但是對應回臺語文語音輸入, 應該還有一段長遠的路要走, 另外臺語文的斷詞系統, 雖然華文的Parser已經很成熟, 但是對於台語本身的語言文法的整理與臺語文Parser的發展, 感覺在學術界總是做了一個階段以後, 學生畢業就沒有後續了, 這似乎是一個長年的困境.
這類型的神經網路模型, 一般大多以時間序列的方式加以展開整個語音的波形, 然後用長短期記憶法這類的演算法當作基礎, 訓練機器了解講話的聲音內容
不過話說回來, 機器到底是機器! 像是我自己之前去中台灣常常遇到不少人『ㄏ一ˊ是國語』這種台灣國語夾雜的, 就有可能導致機器無法識別了! 還有像最近的日本女高中生JK, 假如你到秋葉原或甚麼地方去聽JK講的日文, 別說機器了就連土生土長的日本人都很多人說聽不懂
所以, 像這類情況夾雜口音等等的都很常見, 實際上要用機器能夠含擴, 就目前的機器跟演算法來說...還是有很大的改善空間
作者 laisan86 發文時間 2020/05/15 按讚 0