認識常態分配(Normal distribution) Part 2

延續上篇的《認識常態分配(Normal distribution) Part 1》,繼續分享常態分配的特性,隨機變數轉換可以變成其他分配。

3. 轉換常態分配可產生其他分配

常態分配可轉換成其他分配的關係如下圖,不過,本文只分享其中數個。

3.1. 樣本平均數是常態分配

若母體為常態分配,獨立抽取n個隨機樣本,每個隨機樣本服從母體分配。可計算出樣本平均數的分配為

\[\overline{X}=\frac{X_{1}+X_{2}+ \cdots +X_{n}}{n} \sim N \left(\mu, \frac{\sigma^{2}}{n} \right)\]

3.2. 標準化的常態分配平方服從卡方分配

令 $Z=\frac{X-\mu}{\sigma} \sim N \left(0,1 \right)$,和根據1.3節設定,

\[Z^{2}=\left(\frac{X-\mu}{\sigma} \right)^{2}=\left(\frac{\varepsilon}{\sigma} \right)^{2} \tag{6}\]

式(6)服從卡方分配,自由度為1。自由度為1代表一個常態分配。由標準常態分配可知 $E(Z^{2})=1=\sigma^{2}$,所以,式(6)根據線性分析概念可改寫為 $Z^{2}=1+\theta$,$\theta$ 為誤差。該誤差的期望值為

\[E(\theta)=0\]

變異數為

\[E(\theta^{2})=Var(Z^{2})=E \left[(Z^{2})^{2} \right]- \left[E(Z^{2} \right]\]

其中,$E(Z^{4})=3$ 為峰態係數,所以, $E(\theta^{2})=3-1=2$。

卡方分配的特性為期望值 = 自由度,變異數 = 2*自由度。

3.3. 常態分配指數轉換後變成logNormal分配

logNormal分配又稱為Galton分配,通常用於描述自然現象。許多自然生長的過程是由許多小「百分比變化」的累積驅動的,這些變化在對數計算中變成相加模式。所以在「適當的規律性」條件下,累積變化的分配將會愈發接近對數常態分配。

如果這些小變化的累積速度不隨時間而變,則增長與規模無關。現實情況是隨著時間而成長的事物,在任何年齡類型的分布上往往呈現對數常態形式。相關應用請看下方的參考資料 1

3.3.1. 概念

令 X服從常態分配,我們將 $X$ 做指數轉換為 $Y = e^{X}$。將 $X$ 以 $Y$ 表示,式(1)的機率密度函數變為

\[f_X(ln(Y))=f_Y(y)=\frac{1}{\sqrt{2 \: \pi} \: \sigma \, y} \times e^{\frac{-1}{2} \: \left(\frac{ln(y)-\mu}{\sigma} \right)^{2}}, \tag{7}\]

其中,$ - \infty < x < \infty$。我們同樣可以得到係數為

\[E(Y) = E(e^{X}) = e^{\mu + \sigma^{2} / 2} \\ E(Y^{2}) = E(e^{2X}) = e^{2 \, \mu + 2 \, \sigma^{2}} \\ Var(Y) = E(Y^{2})- \left[E(Y)^{2} \right]=e^{2 \, \mu + \sigma^{2}} \times \left(e^{\sigma^{2}}-1 \right)\]

3.4. 兩獨立標準常態分配相除為柯西分配

柯西分配又稱為Lorentz分配,Breit-Wigner分配,擁有兩個參數,一個位置參數(\mu),一個比例參數(\sigma)。柯西分配的平均值計算得到之平均誤差不會收斂到任何有限數。

令 $X \sim cauchy(\mu, \sigma)$,機率密度函數為

\[f_{X}(x)=\frac{1}{\pi} \times \frac{\sigma}{(X-\mu)^{2}+\sigma^{2}} \tag{8}\]

當 $\mu=0, \sigma=1$,式(8)

\[f_{X}(x)=\frac{1}{\pi} \times \frac{1}{X^{2}+1} \tag{9}\]

令 $Z_{1} \sim N \left(0,1 \right), Z_{2} \sim N \left(0,1 \right)$,$X_{1}$ 和 $X_{2}$ 獨立。

令 $X=\frac{Z_{1}}{Z_{2}}$,可得到 $X$ 的機率密度函數為式(9),所以 $X \sim cauchy(0,1)$。

柯西分配的特性是 $E(X) \rightarrow \infty, Var(X) \rightarrow \infty$。所以柯西分配的平均數和變異數不存在。

參考資料

  1. 維基百科:對數常態分配。