跳到主要內容

人工智慧之語音辨認

人工智慧(AI)應用將正式進入無所不在的時代。電腦在棋類博奕競賽中已經征服人腦,Alexa的貼心服務可以幫助人們處理各種數位化服務,Amazon Echo紅透半邊天,其經過人工智慧優化的語音助理Alexa,語音辨識與語意理解正確度高,儼然成為新一代智慧家庭中樞。本課程將幫助業界人員了解語音辨認領域,吸收語音辨認知識並建立語音辨認的正確觀念,進而熟悉CUDA、Gridengine操作及應用。

  • 開課單位:財團法人自強工業科學基金會
  • 課程大綱:1.引言
    2.語音信號的特徵
    2.1言語生產
    2.2語音聲學
    2.3言語感知
    3.聲學建模
    3.1特徵提取
    3.2隱馬爾可夫模型
    3.3深度神經網絡
    4.語言建模
    4.1 N元語法
    4.2神經網絡語言模型
    5.解碼
    5.1動態時間扭曲
    5.2維特比搜索
    5.3加權有限狀態傳感器
    6.高級主題
    6.1健壯性
    6.2遠程語音識別
    6.3演講者和語言識別
    7.工具包
    7.1 HTK
    7.2 Kaldi
    7.3 DeepSpeechmo
  • 開課日期:2019-08-16
  • 結束日期:2019-08-23
  • 上課時間:每週五09:00~16:00(8/16、8/23)
  • 上課時數:12
  • 課程費用:8,000元
  • 費用:學員負擔:4,000元/政府負擔:4,000元
  • 繳費方式:需先至開課單位繳交全額費用
  • 預計招生人數:20
  • 聯絡人:蕭小姐
  • 連絡電話:02-23113316 ext 2281
  • 先備知識:
    學員需具備數位聲訊的概念
  • 授課師資:台北科技大學電子系廖元甫副教授
  • 招生對象:
    大專以上畢業且具理工科系(資工、資管、電機等)背景且對數位聲訊(Audio)技術有興趣者
  • 上課地點:台北市博愛路80號3樓(自強基金會台北教育中心)
  • 課程報名網址: