1. 基本介紹
數據來源:漁產品全球資訊網
數據期間:1989年1月2日至2021年12月31日
數據類型:日資料
數據筆數:6790筆
數據類別:加州鱸(鱸魚的一種)
數據特色:消費市場的價格
2. Excel畫次數分配圖
使用分類270組的方式繪製出下圖
觀察上圖可以發現加州鱸魚的消費市場價格呈現雙峰分配。我們需要了解到這是市場的均衡價格觀念,這價格會出現在需求線上,也可能是需求線移動後的新需求線上。這些能夠反映影響因素的成因都沒有被收集在統計數據中,所以無法說這就是某條特定的需求線。
想要估計這種雙峰分配並不容易,可能是兩個機率分配的組合,也可能是特定的分配。因此,我們可以先使用「適合度檢定」測定數據是否來自特定的分配。如果無法得到顯著的結果,就需要使用曲線估算法(Curve fitting)配適出符合此數據規律的機率模式。本篇文章只說明到適合度檢定,至於曲線估算法可參考「機率分配模擬器_prsimulated」公開社團的影片。
3. 敘述統計係數表
係數 | 值 |
---|---|
sample Mean | 87.45415 |
Geometrical Mean | 85.14020 |
Harmonic Mean | 82.63353 |
sample variance | 388.62191 |
sample S.D. | 19.71350 |
Skewed Coef. | 0.07312 |
Kurtosis Coef. | 2.32699 |
MAD | 16.82220 |
Range | 163.80000 |
MIN | 5.00000 |
MAX | 168.80000 |
Median | 90.70000 |
Q1 | 60.00000 |
Q2 | 90.70000 |
Q3 | 109.70000 |
IQR | 49.70000 |
C.V. | 0.22542 |
3. 適合度檢定
經過45個分配的適合度檢定後,可以得到最佳的結果為
H0: population distribution~Generalized normal distribution(mu=87.454153,alpha=32.938249,beta=3.308851),
H1:against H0,
由p值可知,拒絕虛無假設。這表示數據的適合度檢定顯著拒絕數據來自一般常態分配。
這顯示加州鱸魚的消費市場價格並非來自這445種分配。
不過,我們得注意到在45種分配的適合度檢定確實可以幫助我們找出數據最合適的分配。
加州鱸魚消費市場的價格次數分配圖中,雙峰中間相對低的機率可視為高原的特性。如果數據量足夠多,很可能有更能反映這種一般常態分配的高原特性,亦即在這段價格區間出現可能相等。
當我們得到了適合度檢定的分配後,就能夠利用機率分配模擬器生成此分配與原數據的分配進行比對,如下圖。
我生成1百萬筆的一般常態分配數據計算得到次數分配圖,再與原數據的次數分配圖進行比對。從上圖就能清楚看到為什麼會顯著拒絕虛無假設。
此時,你可以選擇停止建立數據的機率模式,或者繼續尋找更加精確的機率模式。
下篇文章將是以曲線配適法估算加州鱸魚消費市場價格的機率模式。