題目敘述
(1)題目背景(含現行自身/同業處理方式)與產業重要性
產業重要性說明:新北市消防局119救災救護中心為能在短時間拯救生命危急的病人,必須搶時間在有限的時間抵達求救現場,並按照病人狀況給予正確的救護程序。
題目背景說明:當民眾撥打119後,透過電信中心系統轉接到服務縣市區域之119指揮中心,指揮中心值勤員須按照SOP詢問程序:確認消防或救護→詢問地址→確認急病或車禍→患者人數→意識狀態→呼吸狀況→派遣車輛→救護車與人員於途中與抵達現場回報指揮中心,確認救護人員抵達現場與相關處置。
119指揮中心的值勤員在接收救護電話後,於SOP詢問求救者相關問題後即啟動無線電通報救護程序,在救護人力抵達現場之移動途中回報指揮中心通話中會受到背景音干擾(救護車聲音、工地聲音、車聲…)。119指揮中心每一值勤員位置有5台螢幕,要在一個時間同步處理多項指令, 進行無線電通報作業時,往往只有當場作業聽取內容與值勤員的判斷後;通報救護人員派車進行搶救,但無線電通報時因為背景音吵雜,易造成指令與判斷錯誤。希用AI技術去噪及Super Resolution 等AI科技提高辨識率,以提高聲音清晰度,強化值勤員、救護人員正確判斷之處置。
(2)問題情境與痛點(Pain point)
無線電通報背景音容易影響消防值勤員判斷:一通救護電話到救護人力抵達現場,是持續且位置變動的通話,在此期間,往往因為救護人員移動通話中,造成無線電背景音吵雜,容易影響時間、判斷與處置。而現有狀態下,吵雜的背景音以及聲音取樣率低於16KHz都是無法使用語音轉文字技術的問題點。
在這邊的去噪問題會與傳統歌手演唱去噪問題不同之處在於,不存在完美沒有背景噪音的音頻可以提供,因為救災現場是不可能在錄音室中重現,因此本題中消防局提供一年份的實際環境錄音(其中有包括純背景噪音),同時也可以配合在安靜環境中錄製16KHz採樣率的模擬救災語音內容(配合局內的演習),因此解題團隊需要自行利用這些素材來重組成適合建模的數據集。
(3)預期透過AI達到的目的與利益點(Gain)
希透過AI去噪、Super Resolution 等AI技術提高聲音辨識度,強化語音清晰度,以提高執勤員、無線電通報系統使用者在對話溝通時,有良好的音質,溝通中能採取正確的判斷處置。以及便於進行後續的語音轉文字技術整合。
(4)技術完成後的使用對象
接受派遣救護之勤務人員
(5)成果應用方式及情境等內容
於消防局派遣中心進行無線電語音通話時,不受到背景音干擾,使通話品質提升,讓值勤員在通報與判斷時能即時且正確,與救護人員抵達現場前的溝通,也能因為音質清晰,有正確的判斷與處置。
資料型態
無線電語音檔,格式為8KHz mp3或Wav。
資料集整備度與細節說明
1.一年份救護無線電錄音(約300萬筆錄音檔,硬碟容量約110G)。
2.因為本案為噪音抑制問題,透過AI將噪音移除,故建議以用真實人類聲音建模後,將無線電錄音檔混合後,在進行聲音頻率分離,達成無線電噪音移除。
期望成果需求
評估指標為PESQ(Perceptual Evaluation of Speech Quality, PESQ),基於純淨音頻檔(此部分消防局會協助配合錄製)與去噪後前後比較,目標值希望去噪後PESQ值能在3以上(-0.5為理論最小值,4.5為理論最高值),或是去噪前後PESQ分數能提升0.5以上。
可提供之解題資源
1.無線電錄音檔
2.專業窗口一人
額外獎勵誘因
無
出題單位
新北市政府消防局
單位(公司)簡介
新北市政府消防局,為中華民國新北市最高消防行政機關,負責新北市的消防救災事宜,及市內所有消防行政、人事、教育及訓練等事務,下轄7個救災救護大隊、1個特種搜救大隊。
其他備註
無