跳到主要內容

數據「學」無止盡!機器學習、深度學習、統計學究竟差在哪?

經由 allen chen 提問 ‧ 118 天前

IoT數據資料蒐集/分析/預測類

數據當道的現今,多少人、事、物受惠於這些龐大的數據分析和學習,但你知道機器學習、深度學習、統計學的差異是什麼嗎?

回答 7

經由 omnixri 回答 ‧ 114 天前

「機器學習」是「人工智慧」的一個分支,而「深度學習」又只是「機器學習」下的「類神經網路」所發展出的子技術。而統計學中所應用到的理論,大量使用於「機器學習」中。

早期人們希望機器能從一堆數據中找出關連並像人類一樣具有「學習」能力,進而進行推論,所以大量使用到機率學與統計學領域的技術。「機率學」部份不須依靠資料集,單純從數學角度去推論,較不具學習的過程,而是直接找出規律及答案。而「統計學部」份則需要大量格式化資訊進進行分析,再依據資料分佈樣態找出可能規律,進而得到類似學習的成果。而「深度學習(或稱神經網路)」則是利用大量資料進行網路的權重值訓練,進而找出超高維超多組非線性函數來推論一個結果,較類似人類反覆練習(歸納)的結果,但和人類具特徵提取、舉一反三(演繹)的分析方式有很大不同。

目前所謂「大數據」、「資料採礦」大多數是建立在格式化資料,就像在EXCEL填資料,每個欄位都只是簡單的文字或數字且都要填滿。而這類應用多半採用統計方式找出特定模型,其得出結果較具解釋性,而新進資料即可依此模型進行推論。而「深度學習」的彈性就較大,可容許格式化(如影像)及離散式(如聲音、文章)資料輸入,而透過反覆訓練最後得到巨量參數(權重),達到理想的推論結果,雖有很好結果但幾乎無法解釋其原理。兩者皆是利用過去(已存在)資料去建模對未來資料進行推論,而前者運用到較多統計學方法,而後者僅用到很小部份,甚至有些算法根本沒用到。

如果想更深入了解,推薦大家一篇不錯的文章:

機器學習跟統計學差在哪?哈佛博士:機器學習重視預測結果,統計學在乎因果推理
https://buzzorange.com/techorange/2019/05/02/difference-between-statistics-and-machine-learning/

經由 linda.lin 回答 ‧ 110 天前

其實我一直以為人工智慧、機器學習和統計學是差不多的東西。但是聽說機器學習已經存在幾十年了,只是最近數據和運算能力快速進步,才開始了這一系列的討論。

經由 j;6u045j6 回答 ‧ 104 天前

我知道,其中的機器學習是指透過統計分析和預測,找出大量資料中的變動模式、和隱藏的資訊,這樣就不需要重複寫程式來指示分析方向,也就是不需要程式導引的前提之下,機器就可以具備分析和執行的能力。

經由 yinghsuan1217 回答 ‧ 103 天前

機器學習較著重決定和預測能力!
反之,統計學更關心其可解釋性~
比如說,機器學習說我預測明天下雨的機率是0.8
統計學家就會說
我預測明天95%的可能性下雨機率落在(0.7,0.9)之間

經由 omnixri 評論 ‧ 103 天前

其實機器學習的範圍還滿大的,大部份都還是具有解釋性,如線性迴歸、邏輯迴歸、決策樹、隨機森林、支持向量機(SVM)、KNN、K-Mean、主成份分析(PCA)…。目前最廣為大家熟知的深度學習,只不過機器學習下神經網路(NN)下的一個分支系統,而它最被人詬病就是預測、分類結果極佳,但幾乎不具可解釋性。雖然已有許多資料科學家正在努力找,甚至重新設計具可解釋性算法,但短時間可能還是難以看到。

經由 laisan86 回答 ‧ 101 天前

實際上統計學、機器學習、深度學習, 嚴格上來講都是各自一門可專攻的, 不過三者之間常常拿來互相應用或者當作競爭比較標的. 不過, 統計學可以說是機器學習、深度學習這兩者在應用開發上常見的工具! 真要說這三者有甚麼不同, 我個人淺見 : 統計學注重的是這些數據資料透過統計模型、檢證方式處理後, 可以解釋出來這個統計結果與來源數據資料之間究竟有甚麼樣的關聯性. 比如說以溫室種金針菇來說好了! 金針菇在最後菇蕾形成時, 需要提高二氧化碳濃度 這時候溫室的環境調節條件與金針菇的品質兩者間, 很顯然就有關聯性! 那麼調節到多高濃度的二氧化碳, 當然就用統計學很容易描述了. 反觀機器學習與深度學習兩者, 就學理上應該是為了達成人工智慧AI這個目的, 而衍生出來的其中一種解決方案分支, 我個人的看法嘛~~機器學習跟深度學習比較統計學起來, 倒像是以預測這個當賣點比較好! 其實深度學習對於結果的預測相當不錯, 不過深度學習常常被視為一個黑盒子, 從結果看不出來與來源資料之間關連性的案例, 時常發生!

經由 chuckmails 回答 ‧ 88 天前

機器學習和統計的主要差別在「目的」,機器學習模型旨在使最準確的預測成為可能。統計模型是為推斷變數之間的關係而設計的。

最明顯的例子是線性迴歸,在統計學中,建模的目的是描述數據與輸出變數之間的關係,而不是對未來數據進行預測。反之機器學習重視的是結果

,目的只在於用資料來預測未知的可能數據。至於深度學習,他算是機器學習的分支,差異在於訓練方法的差愈與技術演算法的不同。

經由 mileen.tsai 回答 ‧ 42 天前

機器學習和統計做主要的差別在於他們的目的性不同,機器學習是為準確的預測,而統計則為推理而設計,沒有數據就無法進行統計。

需登入才能回答問題