Skip to content

二、AI做不到的數據分析挑戰

人工智慧做不到的數據分析是有原因的。

第一,數據分析出現在兩個地方,一個是「數據分析過程」的數據分析,一個是「數據分析過程的步驟」,也叫數據分析。如果無法分清楚我們指的是什麼數據分析是過程還是步驟,人工智慧的數據分析就無法被定義清楚。

數據處理≠數據分析

想像一下,你的房間亂七八糟,你開始整理,把衣服、書本和零食都放好,這就是數據處理。但如果你要分析一下房間裡的零食消耗速度、哪本書看得最多,這才是數據分析。很多人把這兩者混為一談,結果就是誤會重重。數據分析需要數學和統計的支持,而不只是把數據整理好。

過去工具還沒有那麼普及前,數據處理和數據分析是能清楚識別的。但隨著工具和技巧為主導的學習方式興起後,數據處理和數據分析就逐漸混在一起。那什麼叫「數據處理」,什麼叫做「數據分析」呢?我們在下節做簡單的說明。

人工智慧是取代人類在數據分析的運算與判斷

第二,人工智慧是取代人類在數據運算與判斷的。

文字是非數字,屬於數據類型之一。在第一章的內容中,我提到了「數據類型會對應分析方法」,所以當人工智慧想進入數據分析時,它所使用的分析方法就會對照到數據庫(資料庫)所蒐集的數據類型。而分析方法的蓋括性受到數據類型影響,例如文字如果不轉換成數字,就只是計算頻率,圖像就是直方圖。如果要將頻率轉為機率模型,那就得回到數據類型中的累加性數字所對照的分析方法。

就像「分段」的概念,不是「AI數據分析」的數學AI獨有。試想我們過去所受的教育中,曾經學過「函數的範圍限制」。這是舊有的觀念,可是如何去創新與應用呢?這就是為什麼AI數據分析系列方法中,能夠為人工智慧的數據規律提供最基礎且核心的建模理由。

其實人工智慧加入到數據分析後就是取代人類的作用。

人類在數據分析過程中從蒐集數據、整理數據、清理數據、處理數據、分析數據,這幾個步驟都能使用電腦自動化處理,而分析數據則可使用人工智慧取代人類的判斷。所以當人工智慧能都在數據分析中取代人類,那麼人工智慧就能稱之為AI數據分析。

大型語言模型的侷限

不同的分析方法,人工智慧就會在其中扮演不同角色。理論上愈是客觀的情況應該更容易使用人工智慧,但目前的人工智慧發展反而不是如此。所以人工智慧做不到的數據分析挑戰,反而是愈客觀的內容愈難以做到。

大家都覺得AI很聰明,但其實在一些基礎數學問題上,AI中的大型語言模型經常出洋相。例如讓ChatGPT計算四位數相乘,結果錯了。讓它算13個數字的平均數,它連數字個數都搞錯,還得我們提醒它數字有幾個。這就像讓AI幫忙買菜,結果它買回來的都是我們不需要的東西。這些問題說明,AI在複雜數據分析上還是有很大局限的。

數學AI的核心挑戰

AI和數據分析的結合聽起來很炫酷,但目前的情況是,即使openAI推動的AGI希望讓人工智慧能夠推理,AI仍無法完全取代傳統數據分析。由於數學和科學只有對和錯,沒有模棱兩可,現在的AI更多是依賴機器學習系列的方法。當機器學習遭遇到數據特徵和規律必須使用數學模型來揭示結果時,多數的文獻或報告都無法揭露這點,代表無法印證人工智慧背後的數據運行是能有數據特徵或規律的數學式結果。簡單來說,AI在數據分析上還是個菜鳥,需要數學這個大佬的幫助。

不過,我們得說研究人工智慧,不是只有走到機器學習這條路才是,這只是目前的主流。另一條路走的是數學AI。所以數據分析可以與AI結合,但整個的核心原理並非現在從「機器學習」開發上來的AI。數學AI經過漫長超過10年的研發,已經可以說是完整地被開發出來,並且放在GitHub上免費非商用提供所有人使用。喜歡人工智慧,也喜歡數據分析的人可以下載嘗試使用AI數據分析工具,幫助你從數據中獲得關鍵資訊。

總之,AI在數據分析上的挑戰很多,我們不能指望它一手包辦所有的分析工作。數據分析還是需要我們掌握數學和統計的基礎,這樣才能真正理解和利用數據。