跳到主要內容
 
:::

競賽細節

題目敘述
(1)題目背景(含現行自身/同業處理方式)與產業重要性 產業重要性說明:新北市消防局119救災救護中心為能在短時間拯救生命危急的病人,必須搶時間在有限的時間抵達求救現場,並按照病人狀況給予正確的救護程序。 題目背景說明:當民眾撥打119後,透過電信中心系統轉接到服務縣市區域之119指揮中心,指揮中心值勤員須按照SOP詢問程序:確認消防或救護→詢問地址→確認急病或車禍→患者人數→意識狀態→呼吸狀況→派遣車輛→救護車與人員於途中與抵達現場回報指揮中心,確認救護人員抵達現場與相關處置。 119指揮中心的值勤員在接收救護電話後,於SOP詢問求救者相關問題後即啟動無線電通報救護程序,在救護人力抵達現場之移動途中回報指揮中心通話中會受到背景音干擾(救護車聲音、工地聲音、車聲…)。119指揮中心每一值勤員位置有5台螢幕,要在一個時間同步處理多項指令, 進行無線電通報作業時,往往只有當場作業聽取內容與值勤員的判斷後;通報救護人員派車進行搶救,但無線電通報時因為背景音吵雜,易造成指令與判斷錯誤。希用AI技術去噪及Super Resolution 等AI科技提高辨識率,以提高聲音清晰度,強化值勤員、救護人員正確判斷之處置。 (2)問題情境與痛點(Pain point) 無線電通報背景音容易影響消防值勤員判斷:一通救護電話到救護人力抵達現場,是持續且位置變動的通話,在此期間,往往因為救護人員移動通話中,造成無線電背景音吵雜,容易影響時間、判斷與處置。而現有狀態下,吵雜的背景音以及聲音取樣率低於16KHz都是無法使用語音轉文字技術的問題點。 在這邊的去噪問題會與傳統歌手演唱去噪問題不同之處在於,不存在完美沒有背景噪音的音頻可以提供,因為救災現場是不可能在錄音室中重現,因此本題中消防局提供一年份的實際環境錄音(其中有包括純背景噪音),同時也可以配合在安靜環境中錄製16KHz採樣率的模擬救災語音內容(配合局內的演習),因此解題團隊需要自行利用這些素材來重組成適合建模的數據集。 (3)預期透過AI達到的目的與利益點(Gain) 希透過AI去噪、Super Resolution 等AI技術提高聲音辨識度,強化語音清晰度,以提高執勤員、無線電通報系統使用者在對話溝通時,有良好的音質,溝通中能採取正確的判斷處置。以及便於進行後續的語音轉文字技術整合。 (4)技術完成後的使用對象 接受派遣救護之勤務人員 (5)成果應用方式及情境等內容 於消防局派遣中心進行無線電語音通話時,不受到背景音干擾,使通話品質提升,讓值勤員在通報與判斷時能即時且正確,與救護人員抵達現場前的溝通,也能因為音質清晰,有正確的判斷與處置。


資料型態
無線電語音檔,格式為8KHz mp3或Wav。


資料集整備度與細節說明
1.一年份救護無線電錄音(約300萬筆錄音檔,硬碟容量約110G)。 2.因為本案為噪音抑制問題,透過AI將噪音移除,故建議以用真實人類聲音建模後,將無線電錄音檔混合後,在進行聲音頻率分離,達成無線電噪音移除。


期望成果需求
評估指標為PESQ(Perceptual Evaluation of Speech Quality, PESQ),基於純淨音頻檔(此部分消防局會協助配合錄製)與去噪後前後比較,目標值希望去噪後PESQ值能在3以上(-0.5為理論最小值,4.5為理論最高值),或是去噪前後PESQ分數能提升0.5以上。


可提供之解題資源
1.無線電錄音檔 2.專業窗口一人


額外獎勵誘因


出題單位
新北市政府消防局


單位(公司)簡介
新北市政府消防局,為中華民國新北市最高消防行政機關,負責新北市的消防救災事宜,及市內所有消防行政、人事、教育及訓練等事務,下轄7個救災救護大隊、1個特種搜救大隊。


其他備註


* 題目因實際數據改變或其他不可抗力之事由,出題企業保有修改、變更或取消題目之權利。

相關競賽
消防救護無線電通話AI降噪
新北市消防局救災救護中心每年平均接收到20萬通救護電話,當市民電話通報後,救護中心值勤員按著SOP程序確認救護對象狀況,就啟動無線通報系統派遣與引導相關救護車與救護人員到現場進行救護,這過程中必須持續透過無線電引導與溝通,在緊急且須搶時間的狀況下,無線電收聽訊息之清晰度是強化救護人員判斷、爭取短時間搶救生命的第一要件。但實際上,無線電本身會受到背景噪音(例如救護車聲響、民眾呼喊聲)以及訊號干擾所產生的雜訊。而無線電訊號除了供現場救護人員使用,同時也會提供給救災救護中心,現行作業是人工聽打輸入系統,以便進行各單位橫向溝通使用。但由於這些噪音造成無法順利透過現有語音識別技術進行語音轉文字。 此外,語音識別技術最適合的聲音採樣率是16KHz,而無線電傳輸則是8KHz,採樣率不足也是限制了無線電通話整合語音轉文字技術的關鍵。因此除了去噪之外,也需要將音頻訊號轉換到16KHz,因此需要借鑒AI的超解析度技術,將音頻採樣率提升。
消防救護通話語音AI意圖識別
在救災過程中,指揮中心值勤員與派遣救護人員之間的無線電通話內容是指揮中心唯一了解現場狀況的信息來源,然而在救災過程中,往往因為現場狀態多變,因此通話過程中與檔案,在新北市消防局未來推動與規劃救護自動派遣至關重要。透過語音檔案之清洗與整理,建立語料庫,使資料產生價值,並透過AI意圖識別技術解析通話傳達的意圖,以作為對應行動處置應用。
基於語音辨識於法庭筆錄之應用
審檢乃至警調系統訴追犯罪,筆錄的完整及製作效率非常重要,以往都是由書記官聽打製作筆錄,不但讓書記官業務繁重,尤其是當事人的應訊內容,對後續案件偵辦有牽一髮而動全身的效力,書記官繕打筆錄的完整性及正確性,在後續的審理過程中甚至成為攻防的重點。現有技術中的語音識別只是單純語音轉文字,但是要作為一份正確的筆錄仍是不足的,因此希望可以透過AI技術,除了可以利用該系統於偵訊過程即時產製應訊完整逐字稿,包含去除贅字、基於法律用語糾錯,並自動標示偵查庭發言人別,以完整記錄偵訊內容,保障民眾權益,另亦減輕書記官繕打筆錄工作負荷,加快開庭效率,同時可以推廣到警察或調查局乃至行政機關行政調查等筆錄製作。
護心守衛─提升救護車12導程心電圖病徵判讀準確率與加強後續應用的擴散效益
本局擬藉由過往救護車載12導程心電圖機EKG設備收集的資料,依循既有開放資料格式建置開放資料後,搭配坊間心電圖病徵樣本,提升判讀病徵的準確率,建立起相對應的AI-BOT,串接資料加強後續應用並提供線上輔助判讀服務,藉此充分利用12導程心電圖資料與加強後續擴散應用效益。
應用深度學習技術建構品牌輿情之公關危機估測模型
社群媒體的興起,對公關產業而言,意味著品牌與公眾溝通的管道變得更加複雜且即時,但越多的媒體管道對品牌猶如雙刃劍,如因未即時阻斷負面發酵或處理方式不恰當,便容易演變成公關危機,而公關危機處理其最佳因應方式,便是即時發現正在醞釀成形的危機關鍵訊息,在第一時間設法加以控制,避免對品牌的負面訊息繼續擴散,避免損害到客戶的品牌價值,甚至若能更進一步化危機為轉機,才能真正體現公關產業的價值所在。 本題希望能藉此開發一個足夠精確的品牌輿情之公關危機估測模型,能針對輿情報導自動化探勘出對品牌公關危機之評量分數,並發掘出危機關鍵詞組,提供公關處理人員決策輔助之用。