統計學本質和架構筆記-104抽樣分配是樣本產生的統計量尋找母體參數的重心

AI新知力系列

統計學本質和架構筆記 - 104樣本的抽樣分配只為找母體參數

今天分享第四篇統計本質和架構筆記,從上一篇的母體和對應的機率分配概念,同樣可以沿用到樣本和對應的抽樣分配。不過樣本到抽樣分配不會如母體那麼簡單,中間還需要一個橋梁 - 統計量。

如果你還沒看過前三篇筆記,可以先複習一下喔。

101《認識統計學的兩大板塊

102《了解統計學兩大板塊關係

103《機率分配參數代表母體特性

樣本是你從母體抽樣出來的。怎樣抽樣出來是另一門學問,我在這就不討論了,屬於數據分析過程中的蒐集程序,而我分享的主軸都是「分析方法」的內容。原本樣本是要對應到母體,但母體特性是由參數表現,所以樣本也得對應到母體參數。

母體參數控制著母體分布的平移位置、高度、偏度等,你可以想像對應到一維空間、二維空間、三維空間。那麼樣本也得從一堆數字轉換成一個指標,例如平均數、中位數、四分位數、標準差、平均絕對離差等。這些在統計學的敘述性統計係數都會被介紹,有的在小學就開始學習了。只是沒有被統整在一起說。而這些係數從樣本得到時就可以形成統計量。

如何從樣本轉出統計量

我直接用步驟來說明

  1. 做一次抽樣,抽出m個樣本
  2. 計算平均數,得到一個平均值
  3. 重複步驟1和2,做n次,得到n個平均值
  4. 平均值做次數分配表,產生值和頻率
  5. 第4步驟的值為統計量

這樣的步驟說明就能讓你快速理解樣本如何轉出統計量。至於第4步驟的次數分配表,是為了能夠產生頻率,此處的頻率其實就是機率值。

如何從統計量找出抽樣分配

我繼續上方的步驟。

  1. 為第4步驟的值和頻率,建立數學模型
  2. 第6步驟的數學模型即為抽樣分配的數學式

抽樣分配的連續型如何產生,甚至第4步驟如何變成真實的抽樣分配,因為版權問題,我在這就不多解釋。有興趣的朋友可以上亞馬遜網路書店《Excel calculating the probability distribution simulated data》和《Demythologize Durbin-Watson Test Statistic》購買書籍(英文版)。

對統計量找抽樣分配的結果,我就以Durbin-Watson統計量的抽樣分配動圖了解。這動圖中是上方的n =1億,m = T,再用Java打出來的分配圖。

結語

當我們能夠知道母體對機率分配,樣本對抽樣分配。這兩大板塊成為統計學的基礎,樣本的抽樣分配直指機率分配的參數。至於如何直指過去,這就是統計分析的重點了。