sigma

統計に関すること

平均値と中央値の比較

ある確率分布からのサイズnのサンプルの標本平均と標本中央値の比較をシミュレーションしてみました。

n=11, 101, 1001の3パターン、分布は一様分布、正規分布、指数分布の3パターン、それぞれサンプリングして標本の平均と中央値をとるというのをN=1e+5回繰り返し、結果をヒストグラムにしたものがこちらです。

まずは一様分布です。nを増やすと横幅が狭くなって、高さがやや高くなっているでしょうか。

f:id:unaoya:20181225170551p:plainf:id:unaoya:20181225170603p:plainf:id:unaoya:20181225170616p:plain
一様分布

次に正規分布です。こちらもnを増やすと横幅が狭くなっていますが、高さはあまり変わっていないようです。

f:id:unaoya:20181225170501p:plainf:id:unaoya:20181225170513p:plainf:id:unaoya:20181225170533p:plain
正規分布

最後に指数分布です。nを増やすごとに平均と中央値がどんどんずれていくのが印象的です。指数分布が左右対称でないことに起因しているのでしょうか。

f:id:unaoya:20181225170406p:plainf:id:unaoya:20181225170425p:plainf:id:unaoya:20181225170444p:plain
指数分布

標本平均の分布については母平均の推定であったり中心極限定理であったりと比較的馴染みがありますが、中央値の分布については改めて可視化してみると面白いですね。今後はこれらがどのような分布になっているか調べてみようと思いますのでお楽しみに。

今回用いたRのコード及び同内容pythonのコードはこちらです。

giste11eaaeda5d5c8a6c7d5b627a36486f3