跳到主要內容
 

技術論壇

主題:有沒有聽得懂閩南語的語音辨識?這種語言辨識的設置難度在哪?

2020/05/13linda.lin

222 4 0


自然語言類 語音助理中文閩南語

大家一定對於google語音助理和蘋果的siri小姐不陌生吧?!

但是如果要讓小眾的閩南語人士也可以一同感受語音助理的便利性,未來會有人開發閩南語的系統嗎?如果要開發這樣的語音辨識系統跟中文的有什麼不同?難易度又是如何呢?


4則留言

2020/05/14omnixri

0


我想你問的「閩南語」應該是指台語吧?

目前台語是非常難搞的,光主流腔調就有「漳州」、「泉州安溪」、「泉州同安」及混合腔,另外還有地方發展出的特有腔調如「宜蘭腔」,而台灣漳州腔使用人口較多,如有興趣可以參考一下陳淑娟著「台灣閩南語新興的語音變異」。若再擴大至外島如澎湖、金門、馬祖那又加入更多閩南、閩北語系的腔調。如果你的資料集只有漳州口音,那我講泉州口音可能就常會聽錯,資料建立時就會需花費更多人力物力。

 

另外台語還混雜很多外來語,尤其深受日語影響產生許多原本「閩南語」沒有的詞彙,如便當等等。若再加上不同語系對同一單詞的說法不同,那可能在建立詞庫、語料庫上就更加困難,如讀書會有讀書和讀冊,肥皂則有薩文、雪文、茶箍等不同發音。

 


2020/05/14omnixri

0


先前工研院曾發展過台語版的智慧語音助理,但目前不知是否有繼續。

可參考影片:工研院ITRI智慧語音助理 台語嘛ㄟ通 https://youtu.be/KIbHKWsJkis

另外威盛轉投資公司歐拉蜜OLAMI,也有發展台語辨識服務,

可參考影片:唉呦不錯哦!~ (正港) OLAMI 說台語也會通! https://tw.olami.ai/blog/article/74

不過台語辨識會遇到更麻煩的地方是國台語混講問題,這就有賴技術開發人員多費些心力建構更大的語料庫及模型來改善了。

順帶說一下,客家話語音助理目前還沒什麼人投入,只有看到對岸科大訊飛有開發,希望台灣也能有廠商能投入,造福一下台灣客家族群。

 


2020/05/15laisan86

0


其實就技術面的觀點來說, 語音也是被電腦變成數據來判讀, 舉例而言脈衝編碼調變(Pulse-code modulation, PCM)就常被用在將麥克風收到的聲音, 把訊號依照振幅(強弱大小)等分成數個不同的段, 然後每個不同的段都用獨特的二進位方式來編碼, 這樣就能達到量化的效果

因而我們人類的聲音, 不管你講的是哪一國的語言, 台語、客語、國語、英語...通通變成數值! 所以就很適合透過神經網路進行訓練形成模型, 藉由這樣保留下來就成了能夠識別語音的方式

 

這類型的神經網路模型, 一般大多以時間序列的方式加以展開整個語音的波形, 然後用長短期記憶法這類的演算法當作基礎, 訓練機器了解講話的聲音內容

不過話說回來, 機器到底是機器! 像是我自己之前去中台灣常常遇到不少人『ㄏ一ˊ是國語』這種台灣國語夾雜的, 就有可能導致機器無法識別了! 還有像最近的日本女高中生JK, 假如你到秋葉原或甚麼地方去聽JK講的日文, 別說機器了就連土生土長的日本人都很多人說聽不懂

所以, 像這類情況夾雜口音等等的都很常見, 實際上要用機器能夠含擴, 就目前的機器跟演算法來說...還是有很大的改善空間

laisan86 2020/05/15 0



2020/05/16bioasura

0


在進行語音辨識之前, 有幾個基本的資料需要建立, 或者要有相關的技術已經完備, 資料方面, 主要需要有相關辨識語言所累積出來的語料庫, 以及相關針對語句的斷詞系統, 而在語音資料辨識的部份, 需要蒐集足夠資料量的各個語詞的說話輸入的資料, 所形成的資料集合, 這樣才能夠進行後續的語音辨識的訓練與預測模型.

語料庫的部份, 相關的台語的辭典, 或是字典, 有一些民間的人士長年的有在自己蒐集與累積, 其中教育部有提供了一個基本的台語的語料辭典, 不過如果對應回一般日常生活中的用語詞彙, 很多其實並沒有收入在裡面, 基本上語音辨識最後需要對應回語意的解析, 通常面對同音異詞的問題, 沒有前後文的語意對照, 一般很困難做出正確的解析與對應.

要做好台語的語音辨識, 最基礎的工作與資料集, 是需要建立一個語音的資料集, 並且標注這些語音資料集對應的台語詞, 沒有這一個基礎工作的完成, 後面的資料庫通常無法完成.

目前不確定台灣是否有這樣的公開資料集, 也許民間有公司對應自己蒐集了語料也做出了部份的特殊環境對應的語音指令辨識系統, 但是在通用對話的語料跟語音系統, 似乎沒有看到坊間有這樣的資料集的維護與出現. 

教育部有提供了一些線上的臺語文資源可能會有一些用, 但是對應回臺語文語音輸入, 應該還有一段長遠的路要走, 另外臺語文的斷詞系統, 雖然華文的Parser已經很成熟, 但是對於台語本身的語言文法的整理與臺語文Parser的發展, 感覺在學術界總是做了一個階段以後, 學生畢業就沒有後續了, 這似乎是一個長年的困境.

 

 

 


最新發表
智慧農業除了種植上的監控系統,還有什麼其他應用?
智慧農業的應用常見的是導入資訊科技與自動化控制系統,藉由先進環境監控、資料收集分析,讓農業脫離天然環境的控制、降低栽種成本、提高作物收成率及品質 那麼,智慧農業除了種植上的監控系統,還有什麼其他應用?
有沒有專為室內或溫室種植的智慧系統?
如果沒有智慧農業技術在溫室種植方面帶來的幫助,零售業和當地種植戶就不能夠透過最佳化環境條件,來實現農作物產量最大化以及縮短培植時間。 沒有數據分析也讓這些產業也無法實現節能節水效益,達到可持續發展的成效。 有沒有智慧系統是專門設計給市內或是溫室種植的啊?
加拿大新創公司BlueDot怎麼用AI預測武漢肺炎的爆發?
全球疫情爆發的這麼沒有徵兆,甚至連疫情如何傳遞都不知道,直到各地開始大爆發為止。那這家加拿大公司是如何用AI預測武漢肺炎的爆發啊?
【資料標註】解題團隊及出題單位的資料標註及整理需求交流
我是 Kevin,來自專門開發數據標註平台及工具的團隊。記得去年我也在論壇發過文,因為正值新一屆競賽,希望可以跟這次的團隊及單位交流了解標註方面的想法及需求。而且在這段時間我們的標註平台也有完成開發新的標註工具及流程,所以就跑來看看新工具可不可以更好的幫助解題團隊解決資料整理及標註的難題。現在我們主要透過結合已經成熟的 AI 模型及遷移學習來開發及提供自動標註系統,系統會先把大量的資料交給機器做基本的標註預測,然後再交由專業人手來進行調整及審核,以此加快標註時間及減少需要投入的人員。   以下是簡單的自動標註流程圖例:  另外我們也會替資料在品質、完整度及多樣性等方面去進行基本的「健康」檢測,減少因為資料的品質導致影響產出模型的效能,浪費了研究團隊的心血。   應用案例: 1. 自動化工業製造瑕疵/工序品質辨識 (影片、圖片自動標註系統) 2. 文件OCR、檔案資料提取、電子化 3. 語音文字轉錄、字幕生成 4. 對話內容辨識及分析 5. 其他 AI 工具以協助企業流程的自動化   如果在解題時遇到在資料整理、標註上的困難歡迎一起提出交流,也希望能透過我們在做的工具幫助各出題和解題團隊,協助大家更快找到交集,順利讓 AI 應用完美落地。   Kevin Wong 黃偉俊 Datax 集智坊 網站:https://datax.io/zh/requester.html Email: kevin.wong@datax.io LINE ID: waichunwong
有沒有聽得懂閩南語的語音辨識?這種語言辨識的設置難度在哪?
大家一定對於google語音助理和蘋果的siri小姐不陌生吧?! 但是如果要讓小眾的閩南語人士也可以一同感受語音助理的便利性,未來會有人開發閩南語的系統嗎?如果要開發這樣的語音辨識系統跟中文的有什麼不同?難易度又是如何呢?

熱門發表
如果提供影像辨識的訓練資料不足,AI電腦視覺技術是不是就派不上用場了?
目前深度學習很火,從醫療、零售、倉儲、工業到監控等,好像各種影像辨識都能用到,但往往在一個地方卡關,那就是沒有足夠大量且有代表性的資料提供"訓練",有沒有可能用少量資料來達成好的辨識效果呢?
【解題建議】利用OpenPose來解決骨架(姿態、行為)分析
此次出題有很多項目和姿態(行為)分析有關(如下所示),而其根本就是要先找出人的骨架,再加上時間序列來分析骨架各特徵點的位移,進而判定使用者的動作(類型)。 【華碼數位】 體適能動作與姿勢辨識:以影像分析運動者姿態。 【宸訊科技】 利用動態影像辨識技術完成對農民於田間作業之行為分類與分析並能結合AI技術、配合專家互動,持續調整分類學習精準度:從串流影像中分析農業作業姿態(行為) 。 【集思動力】 iSEM多裂肌脊椎運動AI體況分析應用:透過影像、視頻分析人體動作姿態是否滿足特定位置、角度。 【百一電子】 AI電腦視覺辨識男生/女生的情緒與動作事件 :透過視頻分析十六種動作行為。 【良品嚴選】 客戶輪廓分析與服務人員及時輔助系統:從視頻分析客戶在店面行為以提供智能零售。 【良品嚴選】 線上連結線下新零售之AI分析:從視頻中分析行銷手段是否改變消費者行為。 【艾爾塔科技】 線下零售數據消費者行為洞察與全通路數據整合:透過人流資訊分析及預測消費者行為。 【卡訊電子】 智慧教室語音與影像偵測數據AI分析:建立語音、影像辨識老師、學生行為以增進學習效益。 而在開源技術中以CMU的OpenPose最為知名,包含有身體、頭(臉部)、手等部位,有興趣的朋友可以參考一下 https://github.com/CMU-Perceptual-Computing-Lab/openpose
Time is money!如何讓製程最佳化、讓生產更簡單?
從網路時代到物聯網興起,工業 4.0 強調自動化與生產線聯網功能,而新一代的智慧工廠發展,則更仰賴邊際運算、AI 和數據分析。然而,究竟要如何讓製程最佳化,使得生產速度提升呢?
「魚兒魚兒水中游」,有辦法辨識魚缸中魚的種類、數量的變化,甚至是活動力嗎?
最近在搞魚菜共生,想用"聰明"的方法來觀察魚缸中魚兒的數量變化(有沒有死魚),再與水質狀況(如含氧量)做關聯,想用深度學習與影像辨識來解決這問題,甚至進一步分析出魚的個別及群體活動力,不知各位大大有沒有相關的經驗或作法可供參考呢?
請問,「老闆來了!」偵測器該怎麼用開源AI做到?
小弟有個問題來請教AIGO社群的大大們,我有個有點Crazy的點子,想在老闆在我的座位附近出現時,馬上在電腦前跳出警示訊息,當然,我可沒在做壞事....XD,只是想有些心理準備,你知道的~~ 當然,只辨識出老闆來了沒對各位大大應該挑戰度太低,那可否再辨識出老闆現在的心情好不好呢? 不知能否推薦開源又好上手的自架作法呢?

主題分類