第1種極値分布

 \pi

 

離散選択でおなじみの第1種極値分布の好きなところを書いてみます。

 

好きなところその1、最大統計量も極値分布に従う。 

d個の確率変数$Y_1, Y_2, \dots, Y_d$がlocation parameterを$\alpha_1, \alpha_2, \dots, \alpha_d$、scale parameterをsとする第1種極値分布にそれぞれ従うとする。

この時、

$$F_{Y_i}(y) = P(Y_i \leq y) = \exp\left(-\exp\left(-\frac{y - \alpha_i}{s}\right)\right)$$

 である。

以下のようにして最大統計量の分布を計算できる。

\begin{align*}P(\max{Y_i}\leq x) &=\Pi_i \exp\left(-\exp\left(\frac{x - \alpha_i}{s}\right)\right) = \exp\left(-\sum_i \exp\left(-\frac{x-\alpha_i}{s}\right)\right)\\ &= \exp\left(-e^{-\frac{x}{s}}\sum_i \exp\left(\frac{\alpha_i}{s}\right)\right) = \exp\left(-\exp\left(-\frac{x-s\ {\rm log}\ \sum_i e^{\frac{\alpha_i}{s}}}{s}\right)\right)\end{align*}

これからわかるように、最大統計量はlocation parameterが$s\ {\rm log}\ \sum_i e^{\frac{\alpha_i}{s}}$でscale parameterがsの第1種極値分布に従う。

 

好きなところその2、平均値にオイラー定数が出てくる

locationが$\alpha$でscaleがsの第1種極値分布に従う確率変数xの期待値は以下のように計算できます。

$$E[x] = \int_{-\infty}^{\infty} x \frac{1}{s}\exp\left(-\frac{x-\alpha}{s}\right)\exp\left(-\exp\left(-\frac{x-\alpha}{s}\right)\right)\mathrm{d}x$$

$y = \exp\left(-\frac{x-\alpha}{s}\right)$で変数変換すると、

\begin{align*}&= -\int_{0}^{\infty} (\alpha - s{\rm log}\ y)\exp\left(-y\right)\frac{y}{s}\left(-\frac{s}{y}\mathrm{d}y\right)\\&=\alpha \int_0^{\infty}\exp(-y)\mathrm{d}y + s\int_0^{\infty} {\rm log}\ y \exp(-y) \mathrm{d}y\\&=\alpha + s\gamma\end{align*}

ここで$\gamma$はオイラー定数と呼ばれる自然対数の底$e$や$\pi$などと同じような数学定数です。定義は上の式からもわかるように

$$\gamma = \int_0^{\infty} {\rm log}\ y \exp(-y) \mathrm{d}y$$

です。(他にも定義の仕方があります。)

計算すると0.57721...ぐらいらしいです。ここだけでなく数学のいろんなところに出てくるのでググると幸せになれます。