統計學本質和架構筆記-101認識統計學的兩大版塊

AI新知力系列

統計學本質和架構筆記 - 101認識統計學的兩版塊

數學和統計學是大數據分析和人工智慧領域中的基礎,也是核心。多數已經將大數據分析和人工智慧視為高等分析和高等技術領域,其人才具備的知識量是高深且需要花費大量時間才能有所成。確實也是如此,因為要真正成為大數據分析和人工智慧核心技術研發人員就得具備數學、統計、機率、電腦科學的高等專業知識。

在美國1970年代,正在研發人工智慧的時候,曾有一項學術計畫 - 他們想要培養可以同時具備上述四類專業知識的理科人才。很可惜這項計畫最終失敗,並且人工智慧後來也不再被提起,直到網路時代開展到一定程度後,再一次被提及並實現著。網路時代下的人工智慧不同於1970年代前後所做的人工智慧。所以主導的學科也不相同。

我開啟AI新知力的新篇章,將和學校教學的內容全然不同,從統計學的本質出發,以簡單易懂的方式,讓對此有興趣的你能夠快速理解統計學整體架構,脫離統計學和機率論的數理推導。

什麼是統計學兩大板塊

統計學的世界觀就是這兩大板塊組成 - 母體(population)和樣本(samples)。一般教科書也就提個一句話,然後定義一下什麼是母體,什麼是樣本,就開始進入統計學主題。可我要說,別小看這樣的兩大板塊,這就是統計學的立基。我用此二板塊歸納對應出哲學觀、背後的方法(見上圖)。

  1. 母體和樣本就像柏拉圖和亞里士多德的哲學世界觀。

兩的板塊從哲學觀來說,就如同柏拉圖和亞里士多德的哲學關係。柏拉圖認為這世間萬物都有原型,你可以將原型當作是完美的型態。而世間萬物就是原型的投射,帶著原型特徵。柏拉圖的世界觀是站在全知全能的神的角度在看世界,而亞里士多德則是主張從世間萬物去觀察、拼湊出老師所說的原型。

於是,母體和樣本的關係中,母體就像柏拉圖所說的原型。你是全知全能的神,母體的所有資訊你都知道。樣本就像亞里士多德所說的世間萬物,我們需要觀察樣本才能知道母體長怎樣。

  1. 母體和樣本都需要數學,差異是在於母體是機率論,樣本是統計學。機率是統計之母,如果知道機率,那麼統計就可以退休了。

了解統計學兩大板塊的重要性

萬事皆有起頭,任何學科都是如此。知識傳承需要這樣的做法,而非照本宣科。你會以為我在譁眾取寵,特立獨行地用些和課本上不同的架構和名詞,讓你感覺不同。

我和團隊超過10年以上的研發後,已經發展出MathAI,做到人類做不到的「為數字建立精準數學模型」- 這也是人工智慧中的建模技術,也是模擬技術的核心之一。我想我有資格來分享這樣的世界獨一無二的成果。

在外國,MathAI這詞被用來指稱使用AI來做數學解題。說實在的,要說數學解題的軟體技術在我當讀碩士當下就已經有了成熟的技術。無論是理工商科都在使用。我的指導教授是作業研究博士,帶領我和同期的同學一起入門。所以MathAI這詞如此用在使用AI做數學解題一事,真的沒有意思。

對我來說,人工智慧就是要做到人類做不到的事情!當你跟隨我的「統計學本質和架構筆記」內容後,就會發現為什麼我會如此講述統計學的本質和架構。因為這就是人工智慧的核心之一,也是為什麼我和團隊能做到全球獨一無二的MathAI。

所以我歸納出了解統計學兩大板塊的重要性。

  1. 探索方法本質,並正確使用它們

進入數據分析、大數據分析,和人工智慧所需的統計學知識,就要探索其本質。你無法改變這樣的方法本質,用在不適合的地方,造成隱性錯誤的成形。隱性錯誤最可怕的是用錯方法卻認為是正確的,造成的災難又被歸因到另一個原因上,反反覆覆下,這個世界也無法承受這樣的錯誤代價,最終走向滅亡。為了避免這樣的情形發生,探索方法本質,並正確使用它們是很重要的。這也是為何我要從了解統計學兩大板塊開始分享統計學本質和架構的理由。

  1. 兩大板塊是引發統計學後續的重要起點

別以為這兩大板塊就只是定義或名詞而已。它們就是為什麼有統計學的原因,引發統計學分析的起點。沒有這樣的母體和樣本概念,又怎麼需要統計學,你可以直接用機率不就好了,對吧?而我們只要學到高中數學的機率,又何必在大學時學統計學呢😂

結語

我分享「AI新知力系列 - 統計學本質和架構筆記」,幫助你建立大數據分析和人工智慧需要的統計學理論基礎。這是從不同於教科書和網路上所提及的統計學知識分享。本篇文章分享最關鍵的觀念之一,認識統計學的兩大板塊。統計學的母體和樣本,不只是定義,也不是單純的名詞,而是主導著統計學觀念、理論、方法的根源。我從根源開始說起,因為大數據分析和人工智慧的突破點都是起於這些方法論的根源和本質。

希望你會喜歡這系列的分享

關注追蹤、點讚和分享我的文章