全てに中途半端なお豆

なんじゃこりゃ

統計学を理解したい:「確率変数・確率質量関数って何だよ」

はじめに

こんにちは。まめプロと申します。
2020年度、秋学期に「統計学」という「確率論」と結構関係している講義を履修しました。
が、講義で先生が何を言っているのか全くわからねぇ!!
現状だと、講義ビデオを見れば見るほど、先生の解説を聴けば聴くほど、統計学が分からなくなってしまっています。そこで、統計学をある程度のレベルまで理解するために、これまでの講義でよくわからない点、「先生何言ってるんだ?」と感じる点を私のやる気と空き時間が存在する限り、アウトプットの勉強を兼ねて自分の言葉で解説してみようと思います。
多分、すぐ飽きてしまうのでシリーズ化はしないでしょう。
この記事では「確率変数」「確率質量関数」等の「確率論」の内容の確認をしていきます。

おことわり

理解や解釈が誤っている可能性があります。もし、間違いがあれば、コメント等で指摘して下さると助かります。

確率変数って何?

恐らく、統計学とか確率論がよく分からんくなる原因の単語(自分はこの単語が毎回よく分からなくなる)
抽象的な話ばかりだと、頭が痛くなるので、少し具体的な話をしましょう。

例:サイコロのデスゲーム

A君B君の二人が、それぞれサイコロを2つ振って出た目の和が大きい方が勝ち、負けた者は1050年地下行きになるゲームがあったとしましょう。
今、A君が出した目が「1と6」B君が足した目が「3と4」だっとします。その時、「A君は「1と6」の目を出してB君は「3と4」の目を出した!よってゲームは引き分けだね!!」と考える人間は少ないはずです。
多くの人間は「A君、B君のそれぞれの目の和は7だからゲームは引き分けだ!」という風にサイコロの目の和という数値に注目するはずです。(ゲームの勝敗を出すにあたって、「1と6の目が出た」という結果よりも、「目の合計」という数値が大事ということです。)

例:おみくじに点数をつける

別の例を考えてみましょう。 おみくじってありますよね。おみくじには大吉、吉、末吉、凶、大凶・・・など様々な種類がありますが、日本語が分からない外国の方はこれらの違いが、さっぱり分からないでしょう。そこで、「おみくじの結果に点数をつける」操作をします。
例えば、大吉なら100点、吉なら40点、大凶なら0点・・・みたいに結果と数値を結び付けてやれば、数の大小で何となく結果の良し悪しが日本語が分からなくても伝わるでしょう。 おみくじが今10コあって、そのうち1つが大吉、1つが大凶、残りが吉だとすると、例えば「大吉を引く確率= \frac{1}{10}」というのを「100点を取る確率= \frac{1}{10}」と言い換えられる様になります。

結局のところ確率変数って何だよ

上の例では、どれも「確率的試行の結果」を「数値」に結び付けていたと思います。
この数値のことを「確率変数」と呼びます。
我々が確率の絡む事象を考える時、「結果ではなく結果と結びつく数値」に興味がある場合があります。例えば、さっきのサイコロのデスゲームがそうです。そういう時に、いちいち「結果と結びつく数値」なんて言うのは面倒くさいから「確率変数」と言う名前で呼んでしまおう、としてる様です。

確率質量関数って何?

以下の説明では、「確率変数=数値」と言うことを頭に入れておいた方が良いです。(多分)
さて、今度は「確率変数が特定の値になる時の確率」を求めたくなってきます。

少し例え話:サイコロのデスゲーム

さっき述べたサイコロのデスゲームを考えます。デスゲームを繰り返していると、「一番出やすい目の和の数ってなんだろう?」「目の和が7になる確率って何だろう?」みたいな疑問が湧くと思います。
例えば、「目の和が7」になる確率を求めてみましょう。(ただし、使用する2つのサイコロは大きいサイコロと小さいサイコロであったとします)
目の和が7になる組み合わせは、(大サイコロの目,小サイコロの目) = (1,6),(2,5),(3,4),(4,3),(5,2)(6,1)の6通りであり、求める確率は \frac{6}{36}=\frac{1}{6}になります。
上の例の様に「「目の和が7」という確率変数を受け取り、それを確率に対応させるもの」を確率質量関数と呼びます。

「関数」?

上に挙げたデスゲームの例、見方によっては「7という数値を渡してあげたら、計算結果として確率が返ってきた」と見ることもできます。
「引数として確率変数を受け取り、返り値として確率を返している」と考えてやれば、これは関数と見做せるので、「関数」と言う名前がついてるみたいです。

確率質量関数の見方

返り値として確率を持つ確率質量関数は「確率である」と見做せるようです。
なぜか?

int func(int a, int b)
{
    return a+b;
}
int c = 5 + func(1, 2);

上みたいなコード、 int c = 5 + func(1, 2);の部分で数値を返すfunc()関数を、あたかも「数値であるかの様に見做して」計算してますよね。
だから確率を返す関数である確率質量関数を確率と見做せるのです。*1

まとめ

ざっくりとまとめると、
確率変数=数値
確率質量関数=確率 終わり。

*1:そう言うわけで確率質量関数は確率の公理を満たします。