跳到主要內容
 
:::

競賽細節

題目敘述
(1)題目背景與重要性
病毒造成的流感已成為現代公共衛生領域的重要議題,SARS、H1N1、A型流感、MERS等惡名昭彰的流感在近代公衛史上留名,2019年底爆發的新冠肺炎(COVID-19)為2020年初的全球人民健康帶來了巨大威脅。病毒因現代便利的交通而擴散至全球,使確診人數不斷攀升,各國面臨防疫物資缺乏和醫療體系崩潰的風險,全球經濟遭受巨大衝擊,舉凡觀光旅遊業、運輸業、零售業、深受全球供應鏈牽動的製造業,乃至金融業,均受到雪崩式的影響。面對突發性的公共衛生危機,若能及早掌握疫情發展趨勢,有助於擬定應變策略、預防疾病蔓延,將可能的衝擊降到最低。
(2)問題情境與痛點(Pain point)
A. 疫情前期:
未能有效掌握潛在高危險群,低估疫情蔓延可能性。
B. 疫情中期:
未能掌握流行趨勢變化,可能導致醫療資源及防疫需求物資調度不及;此外,頒布各項非常措施所觸及之層面和影響範圍大,應有更全盤的階段性規畫以保障民眾行使個人權益。
C. 疫情後期:
景氣逐漸復甦,各產業需要提前掌握時機佈局以迎接經濟反彈。

(3)預期透過AI達到的目的與利益點(Gain)
透過輿情分析,偵測潛在的類流感案例,進而準確預測疫情趨勢,可協助衛生單位及早投入防疫準備工作:
A. 預防大流行發生,掌握民眾健康服務需求
B. 提前部署相關物資、醫療資源、相關措施,提供企業、校園預警,加強職場、教育現場的健康管理,或開發新的服務模式(遠距合作、電商服務、遠距教學等)
C. 降低疫情對各產業的衝擊。
(4)技術完成後的使用對象
疾病管制署、各縣市衛生局、醫療院所、企業(服務業)、校園、一般民眾
(5)成果運用方式等內容
A. 防疫資源整備及調度依據
B. 醫院急診分流、病房資源整備依據
C. 促使民眾加強預防措施:施打疫苗、勤洗手、戴口罩
D. 企業、教育產業提早開發新服務模式


資料型態
 氣象資料開放平台:Json/XML檔
 疾病管制署資料開放平台:Json/CSV檔
 資策會服創所:
1. Facebook 熱門文章 API:JSON檔
2. AI HUB Facebook 文章關鍵字搜尋 API:JSON檔
3. PTT 文章關鍵字搜尋 API:JSON檔
4. PTT 熱門文章 API:JSON檔
5. 論壇熱門文章 API :JSON檔
6. 新聞文章關鍵字搜尋 API:JSON檔


資料集整備度與細節說明
 資策會服創所:另外連結
1. Facebook 共26,000個粉絲頁
2. PTT共820個版
3. 論壇共3,000個channel
4. 新聞共2,300個channel
 CDC Open Data: (下載日期3/19,資料持續更新中)另外連結
1. 「地區年齡性別統計表-流感併發重症」數據14642筆(859KB)。
2. 「健保門診及住院就診人次統計-流感及其所致肺炎」數據134862筆(4.93MB)。
3. 「急診傳染病監測統計-類流感」數據73817筆(1.91MB)。
4. 「地區年齡性別統計表-嚴重特殊傳染性肺炎(C0VID-19)」93筆(5.52KB)。
5. 「每週肺炎及流感死亡監測」(2019至今)63筆 (1.43KB)。
 氣象資料開放平台:另外連結
1. 大氣水文研究資料庫:
https://dbar.pccu.edu.tw/
2. 中央氣象局-開放資料平台:https://opendata.cwb.gov.tw/index


期望成果需求
第一階段:
【類流感預測】
  • 第一階段解題目標:
  • 團隊必須在2020年6月最後一週繳交2020年7月份每週預測之類流感就診人次,由AIGO 計畫辦公室針對2020年7月份實際發生的類流感就診人次進行比對。
  • 相關時間點:
  • 當週統計結果,將於隔周三公布
    急診傳染病監測統計-類流感 (2020年)
    預測區間 / 分數核算結果公佈時間
    第28週:07/05~07/11 / 第29週:07/15(三)
    第29週:07/12~07/18 / 第30週:07/22(三)
    第30週:07/19~07/25 / 第31週:07/29(三)
    第31週:07/26~08/01 / 第32週:08/05(三)
  • 作法:
    • 解題目標範圍:
    • 第28週(07/05~07/11)~第31週(07/26~08/01)
    • 提交答案日期:
    • 提交答案截止日:7/4(六) ,第27週的最後一天。
    • 於08/05(三)公佈最後一週答案,並算出隊伍7月這四週的就診人次預測誤差 MAPE。


第二階段:
1. 解題目標及相關時程:
以即時更新之社群文章數據集、國內疫情資訊、天氣及相關敏感變數資料集,持續加入2020年7-9月份的所有資料,團隊必須於2020年9月起逐周做出往後一個月之預測,預測內容包含「類流感就診人次」以及「趨勢走向(上升、下降)」,共做出4次預測。
8/7(五)  公布第一階段評選結果及時程預告。
8/14(五) 公告成果報告及第二階段成果交付格式。

(1) 9月06日(第37周),預測:09/06~10/03 (第37周~第40周) 第1次成果收件:9/3(四)9:00~9/6(日)21:00
(2) 9月13日(第38周),預測:09/13~10/10 (第38周~第41周) 第2次成果收件:9/10(四)9:00~9/13(日)21:00
(3) 9月20日(第39周),預測:09/20~10/17 (第39周~第42周) 第3次成果收件:9/17(四)9:00~9/20(日)21:00
(4) 9月27日(第40周),預測:09/27~10/24 (第40周~第43周) 第4次成果收件及報告、程式碼提交:9/24(四)9:00~9/27(日)21:00

10/28(三) - 10/30 (五) 第二階段成果評選公布。


2. 評選方法:
(1) 以月為預測週期,連續四周針對病例數進行預測,以CDC「急診症候群監測系統」公佈之真值進行驗證,所預測的類流感就診人次誤差越小者為優。
(2) 期望模型每周預測結果平均準確率大於90%,且趨勢走向之預測符合真實狀況。
(3) 模型內容須涵蓋輿情分析數據,且必須使用題目提供之各項資料數據集;但不限制解題團隊納入其他資料來源訓練模型。解題團隊須提交使用之數據資料集、演算法、程式碼予AIGO計畫辦公室,進行成果查驗。
(4) 成果報告及程式碼須完整清楚提供,以確保成果可被重製(reproducible)及可被維護(maintainable), 資料前處理、參數設定、演算法模型必須程式化且妥善註解 ,以利成果落地應用時相關單位掌握模型的轉換內容與方式。
(5) 評分(總分為100分):
 成果採綜合評分,預測精準度(80%)與成果報告(20%)
 預測精準度權重:就診人次預測誤差(MAPE)佔80%、趨勢走向預測(Hit)正確與否佔20%。(計算方式:MAPE之PR值*0.8+(5*Hit))
 成果報告權重:詳見成果報告書格式。
 屆時若遇到解題團隊同分之狀況,將以運算能力(Computation Power)來衡量,花費的運算時間最少者為優。

*備註1:【就診人次預測誤差 MAPE(Mean Absolute Percentage Error)】為預測就診數與實際就診數之實際差距,採百分比計算,參考公式為: 參考公式

*備註2:【趨勢走向預測 (Hit)】為預測就診數上升或下降與實際是否上升或下降相符合。成功預測1次趨勢走向,則得到5分,共預測4次;參考公式為:
sign(第i期預測值−第i−1期預測值)=sign(第i期實際值−第i−1期實際值)
*註釋(1):sign(x)為符號函數
*註釋(2):第i期代表第i週
*備註3:主辦單位保有最終修改、變更、解釋之權利。


可提供之解題資源


額外獎勵誘因


出題單位
AIGO計畫辦公室


單位(公司)簡介


其他備註


* 題目因實際數據改變或其他不可抗力之事由,出題企業保有修改、變更或取消題目之權利。

資料下載
請登入後並組隊加入競賽