如何找出一組數據的來源 - 已知機率分配的適合度檢定

1. 前言

我前面已經寫了如何做《45種機率分配的適合度檢定》,這種方法可以讓我們的數據從45種機率分配中檢定出合適且知道參數的機率分配。不過,有時我們可能只需要知道數據的機率分配對應的參數為何,這篇文將說明第二種的適合度檢定:已知數據的機率分配,參數未知的情況。

準備好數據,打開軟體到上圖的選單畫面後,鍵入【2】後,點擊【end】上方的圓點。

點擊【是】後,繼續下一步。

此時,我們因為已知機率分配(前篇已經測定出是代號31的機率分配),不過使用其他軟體檢定出來的機率分配可能沒有這些分配,所以我選擇代號2的機率分配。

鍵入【2】後,點擊【end】上方的圓點後會跳出下圖。

點擊上圖的【是】後,繼續下一步,運算適合度檢定。

運算適合度檢定完成後,跳出視窗顯示下圖的最佳結果。

完整的運算結果儲存在 C:\建模軟體\輸出\statistic_output.txt

我們打開儲存的檔案就可看到上圖。由於我認定是常態分配,但參數未知,所以經過適合度檢定後,可以找出最小的卡方統計量數值對應之參數,分別為 $\mu = 65.846792$ 和 $\sigma = 17.367713$。

不過,一般羅吉斯型I分配的數據並不符合常態分配,P值 = 0.000131 < 0.05,拒絕虛無假設。我認定的常態分配,即使適合度檢定出最佳的參數也不是數據的機率分配。