Skip to content

四、數據分析中的AI應用:迴歸分析與數學AI

你還記得在高中或大學課堂上學過的統計學迴歸分析嗎?沒關係,就算你不記得,這裡有一個簡單有趣的迴歸分析回顧和說明它是能加入AI的新分析方法!

Markmap

4.1. 迴歸分析:X和Y的愛恨情仇

迴歸分析就像是在找自變數(X)和應變數(Y)之間的戀愛關係(直線關係)。我們要找出這對情侶的數學關聯,通常是迴歸假設一條直線。這個假設非常強烈,強烈到舉凡你看到的文獻或應用都以此為分析模型。但自變數與應變數之間真一定是直線嗎?那未必!所以課本上就會提到拋物線關係。在高次方的關係就不提了,還可能被打上過度配適(overfitting)的問題。

比如,當X是你的學習時間,Y就是你的考試分數。要是X和Y的關係像直線那麼簡單,迴歸分析就能搞定。但是,生活沒那麼簡單。你有時候努力學習卻沒考好,或者隨便看看書卻得了高分。這時候,我們就需要調整模型,包含檢查數學模型是否改變、檢查是否有其他變量影響了結果等。

4.2. 自我相關迴歸:自己解釋自己

在數據的蒐集上,我們最常獲得時間序列資料。所以迴歸分析中有一種方法叫自我相關迴歸(Autocorrelative regression)。簡單來說,這就是一組數據集就是用前一段時間的數據來預測現在的數據。比如,你每天的運動量會影響你接下來幾天的體重。

這種方法很厲害,但也有問題,比如它只是線性的,不能解釋所有的變化。

另外,自我相關迴歸模型也衍伸出指數平滑模型,並成為Excel的預測分析功能的基礎模型。

4.3. 人工智慧加入後的神操作

現在,讓我們來聊聊人工智慧怎麼讓這一切變得更真實、更客觀。人工智慧不僅能夠根據數據自動選擇最佳模型,還能夠處理選擇更多變量或建立多條直線。就像是找到了很多X和一個Y之間的戀愛故事,或者是X在不同成長階段愈到不同的Y,這讓數據分析步驟的更能達到準確。

除上所述,人工智慧還能幫你處理複雜的數學運算,甚至可以給你超過一頁的數學公式來解釋數據的特徵和規律。別擔心,這些公式人工智慧都幫你搞定了,我們稱之為「模型選擇」,你只需要享受要不要顯示結果(參考Hsiao et al., 2021)。

總之,數據分析因為迴歸分析得以與人工智慧結合在一起,產生「數學AI」。數學AI的基本要求就是數據特徵或規律要有數學式結果。如此才能進行人工智慧的下一個步驟 - 驗證。人工智慧能讓我們更輕鬆地進行迴歸分析,找到真正準確的模型,並自動進行複雜或需要反覆的數學運算。人工智慧是幫助人類省時又省力的工具,在數據分析上同樣如此!