技術論壇
發文時間 2020/05/19 作者 jingrul691
瀏覽次數 3744 留言數量 7 按讚 0
用戶行為數據蒐集/分析/預測類 武漢肺炎預測AI學習
全球疫情爆發的這麼沒有徵兆,甚至連疫情如何傳遞都不知道,直到各地開始大爆發為止。那這家加拿大公司是如何用AI預測武漢肺炎的爆發啊?
發文時間 2020/05/19 作者 omnixri
按讚 0
此次加拿大新創公司BlueDot 也於CDC及WHO正式公告COVID-19前一週就已經利用AI分析出此次疫情將由中國爆發及可能傳播路徑,並警告其客戶提早準備,充份發揮AI的長處。BlueDot成立於2014年,其創辦人Khan就是受2003年SARS啟發,開始對各種病原體(如SARS,依波拉、茲卡等150多種)可能造成的疫情進行監控。其主要偵測方式是每天以65種語言掃描100,000多種官方和大眾媒體報導並進行自然語言處理(Natural Language Processing, NLP),找出可能傳播病原的訊息。另外利用大量的飛行路線和匿名移動通信裝置來分析擴散的可能路徑。同時參考各國即時氣候條件、衛生系統能力及各種動物和昆蟲種群的疾病資訊,以得到更可靠的預測結果。
更多利用AI預測疫情的方式,可參考小弟寫的「如何應用人工智慧技術精準預測疫情發展」
發文時間 2020/05/21 作者 laisan86
按讚 0
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7107534/
幸好我目前都在學校可以用學校網路查閱各國的期刊! 可這篇看來應該是免費的, 標題的中文翻譯應該是『中國武漢病因不明的肺炎:通過商業航空旅行國際傳播的潛力』
從文章中應該可以看到他們的做法, 主要有兩個重點 :
A. 透過網路收集各種相關資訊的資料與連結, 當作系統的標的, 這可以透過網路爬蟲的方式達成目的
B. 收集國際航班的時程表, 時程表通常都有班次、航程的起訖點、航行的預估時間, 而且也能透過這些記錄查出飛機的機型估算載客數量
如此一來, 就可以形成地理資訊系統上的不同點, 以每個點透過時間推估可能的擴散範圍, 這樣就能看到覆蓋率, 再由這些覆蓋的區域形成擴散和連結成各自的線段, 就不難一個個區域看出來擴散的潛力有多大了!
所以技術上不算很複雜! 比方說網路爬蟲可以透過optparse-pretty、BeautifulSoup4這類的Python3套件可以開發, 像是以前我就用Pi電腦透過BeautifulSoup做了一個範例 : https://www.youtube.com/watch?v=RGEFLsykaP4
但若是遇上像是現在的社交社全軟體, 那恐怕得用他們公司推出的API比較好! 好比FaceBook有『圖形API』、推特Twitter也有自己的API, 否則要保證抓到完整、正確內容比較難(我之前試過...)
所以純技術性來說, 就一個字 : 煩~~XXD, 但還有點要小心的 : 這時代網路上的東西是不是都能信, 那就見仁見智了!
作者 laisan86 發文時間 2020/05/21 按讚 0
發文時間 2020/05/21 作者 chengxiansong2
按讚 0
BlueDot的運作模式,是利用自然語言處理技術與機器學習,分析全世界60種語言以上的外國新聞報導、動植物疾病網路資訊以及官方公告等,整合可能的訊息後,向其客戶提前發出警告,以避開疾病可能爆發之危險區域(例如本次的武漢)。其速度早於美國疾病預防控制中心(Centers for Disease Control and Prevention, CDC)於1月6日發佈的警告。
發文時間 2020/05/22 作者 ypei91510
按讚 0
根據外媒《Wired》的 報導 ,BlueDot 使用 AI 演算法,從媒體報導等資料抓出武漢肺炎的資訊。Wired 解釋,CDC、WHO 等單位都依賴政府官方資料取得疫情資訊,但這會受到政治的影響,而且「中國官方在疾病、空氣汙染、自然災害等數據追蹤做得很差」,CDC、WHO 卻依賴這種資料監控疫情。
但是用 AI 抓取、分析數據可以降低人為的影響,它只要拿到數據就可以分析。BlueDot 的創辦人暨執行長 Kamran Khan 表示,我們不能依賴政府,但可以透過網路言論與新聞等消息,抓出最新的資訊。但為了確保數據的品質,BlueDot 避免使用社群媒體上的內容分析,因為社群媒體的資訊相對較亂,還可能會有假資訊
發文時間 2020/05/23 作者 omnixri
按讚 0
除了之前提到的方式,從下列新聞報導中亦可看到要從大數據中預測疫情發展的幾項重點。
“大數據是控制疫情的另一種有效工具。在緊急期間,它已被廣泛用於改善監控系統,以繪製病毒傳播圖。大數據的擷取和處理,需要設計用於收集和分析的新方法和新技術。例如以下四種大數據分析類型或方法:
- 描述性分析:發生了什麼?描述業務流程或計劃的現在與過去情況,以綜合和視圖方式呈現活動的績效指標;
- 預測性分析:將發生什麼?即使用回歸分析和預測模型等數學技術,協助了解未來可能發生事件的資料分析工具;
- 規範性分析:需要做什麼?用於確定有效的策略和營運解決方案;
- 自動化分析:根據執行分析的結果自動執行所需的操作與行動的工具。”
目前各國疫情受阻斷社交及交通,已有明顯趨緩,但隨著經濟活動停滯,又開始慢慢開放,亦有可能造成下一波或下一個爆發點的產生,因此要更加將相關數據收集自動化、透明化、區域化,如此才有機會獲得更有效預測。
參考新聞來源:打贏新冠病毒抗疫戰要靠AI和大數據
發文時間 2020/05/25 作者 shuechang886
按讚 0
Bluedot是一家以自然語言處理與機器學習技術進行傳染病監控的平台,他們的邏輯很簡單──網路上訊息發佈的速度,會比疾病傳播的速度更快;因此,Bluedot監控的不是醫院就診資料,而是篩選全球各地65種語言的新聞報導、動植物疾病爆發報告、官方公告、部落格或論壇中的小傳聞、航空公司數據等,透過大數據自動分析後,會請公司的流行病學專家判斷,如果確認無誤,就會向政府機構、企業、公衛部門等客戶發送警報。
發文時間 2020/05/26 作者 hannibal34
按讚 0
BlueDot創辦人暨執行長卡恩表示,他們靠的是自己在2018年開發的一套AI預警系統,透過AI分析來自官方和非官方來源的各種資訊,找出相關的詞彙和片語,快速發現到這波疫情。
BlueDot系統的資訊來源包括:每天在當地和國際報紙上用65種語言發表的逾10萬篇新聞報導;CDC、世界衛生組織(WHO)、聯合國糧食暨農業組織(FAO)和世界動物衛生組織(OIE)的官方報告;衛星即時氣候數據;國際航空運輸協會(IATA)的航班資訊和匿名航班行程數據;人口數據、具傳染病的昆蟲數據、各地區人均醫生和護理師數量數據,以及世界各地經濟和政治局勢資訊等政府來源數據。
這些數據都會進入一個中央資訊庫,資訊庫內還存有150多種病原體的詳細資訊。
BlueDot表示,對於這次的武漢肺炎疫情,這套系統發現了許多信號,包括各種提到武漢「不明原因肺炎」的敘述。之後這套系統也透過分析民眾搭機離開武漢的交通數據,準確預測出肺炎接下來將在曼谷、香港、東京等城市擴散。
BlueDot並非唯一利用AI快速發現和追蹤到這次疫情的公司。波士頓兒童醫院的附屬非營利機構HealthMap表示,和BlueDot一樣,他們也在去年12月底就對武漢肺炎發出預警。
BlueDot的卡恩也說:「在政府機構發布的官方資訊和非官方管道發布的資訊間必須權衡的是,官方資訊經過了額外的驗證與核實。雖然非官方數據更加即時,但在發布前未必經過類似流程。」
作者 zhoujieren8 發文時間 2020/05/20 按讚 0