t分布の意味と性質、期待値と分散について



1. t分布の概要
t分布(Student’s t-distribution)は、母集団の標準偏差が未知の場合に使用される標本分布です。この分布は、母平均の信頼区間や仮説検定に用いられ、正規分布に似ていますが、自由度が小さいほど裾が厚い特徴を持ちます。
2. t分布の性質
2.1. 確率密度関数(PDF)
t分布の確率密度関数は以下の式で表されます。
\[ f(t) = \frac{\Gamma\left(\frac{\nu + 1}{2}\right)}{\sqrt{\nu\pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu} \right)^{-\frac{\nu+1}{2}} \]
ここで、\(\Gamma(x)\) はガンマ関数、\(\nu\) は自由度です。
2.2. 期待値と分散
t分布の期待値と分散は以下のようになります。
- 期待値: \(E[T] = 0\) (ただし \( \nu > 1 \))
- 分散: \( \text{Var}(T) = \frac{\nu}{\nu - 2}, \quad \nu > 2 \)
t分布の確率密度関数は次の式で与えられます。
\[ f(t) = \frac{\Gamma\left(\frac{\nu + 1}{2}\right)}{\sqrt{\nu\pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu} \right)^{-\frac{\nu+1}{2}} \]
ここで、\( \Gamma(x) \) はガンマ関数、\( \nu \) は自由度です。
確率密度関数 \( f(t) \) の式を確認すると、\( t \) が含まれる項は \( t^2 \) であり、これは二乗のため \( t \) を \( -t \) に変えても値は変わりません。したがって、
\[ f(-t) = f(t) \]
が成り立ち、\( f(t) \) は偶関数であることがわかります。
ここで、\( g(t) = t f(t) \) を考えます。
\[ g(-t) = (-t) f(-t) \]
ですが、\( f(t) \) が偶関数であるため、\( f(-t) = f(t) \) となります。したがって、
\[ g(-t) = (-t) f(t) = - (t f(t)) = -g(t) \]
が成り立ち、\( t f(t) \) は奇関数であることが確認できます。
t分布の期待値は次の式で定義されます。
\[ E[T] = \int_{-\infty}^{\infty} t f(t) dt \]
ここで、積分の被積分関数 \( t f(t) \) は奇関数であり、積分区間は \( (-\infty, \infty) \) という対称な区間です。
奇関数の性質により、対称区間での積分は常に 0 になるため、
\[ E[T] = 0 \]
が成り立ちます。
3. t分布の導出
3.1. \(\chi^2\) 分布からの導出
- \(Z \sim N(0,1)\) (標準正規分布に従う確率変数)
- \(W \sim \chi^2_{\,\nu}\) (自由度 \(\nu\) のカイ二乗分布に従う確率変数)
- しかも \(Z\) と \(W\) は互いに独立である。
このとき、 \[ T \;=\; \frac{Z}{\sqrt{W/\nu}} \] と定義すると、\(T\) は自由度 \(\nu\) の \(t\) 分布に従う。
3.2. 標本平均・不偏分散との関係
- 母集団が平均 \(\mu\)、分散 \(\sigma^2\) の正規分布に従うと仮定する。
- そこからサンプルサイズ \(n\) の標本 \(\{X_1, X_2, \dots, X_n\}\) を抽出する。
標本平均を \[ \bar{X} \;=\; \frac{1}{n}\sum_{i=1}^n X_i \] とする。
不偏分散を \[ s^2 \;=\; \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 \]
とする。母集団が正規分布 \(N(\mu, \sigma^2)\) に従うので、
\[ \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \;\;\sim\;\; N(0,1). \]
同じく、母集団が正規分布の場合、
\[ \frac{(n-1)\,s^2}{\sigma^2} \;\;\sim\;\; \chi^2_{\,n-1}. \] これは自由度 \((n-1)\) のカイ二乗分布に従う。
上で導入した
\[ Z \;=\; \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \quad\text{と}\quad W \;=\; \frac{(n-1)\,s^2}{\sigma^2} \]
はそれぞれ独立とみなせる。
そして \(W\) は \(\chi^2_{n-1}\) に従うので、
\[ T \;=\; \frac{Z}{\sqrt{W/\nu}} \]
の \(\nu = n-1\) に対応させると、
\[ T \;=\; \frac{\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}} {\sqrt{\frac{\frac{(n-1)\,s^2}{\sigma^2}}{\,n-1\,}}} \;=\; \frac{\bar{X} - \mu}{s/\sqrt{n}} \]
となる。これが、自由度 \((n-1)\) の \(t\) 分布に従う標本平均の「統計量」です。