先輩、統計って何で必要なんっすか?
ある研究室の先輩後輩のお話
後輩 「先輩、何を読んでるんっすか」
先輩 「ちょっと面白い記事見つけてね。アカデミア同士の会話に重要なたちつてと、だって」
アカデミア同士の会話に重要な「たちつてと」https://lne.st/2014/09/19/tachitsuteto/
後輩 「いつも先輩が俺に突っ込んでくるような内容っすね。でも、最後の「統計的な裏付けは」ってあんまり俺らには関係ないっすよ。統計を使うのってアンケート結果とかですよね」
先輩 「ぼくらも、実験結果がどれくらい分散しているかを求めたり、有意差があるか確かめたりするのに使うよ」
後輩 「平均値を使えばいいんじゃないっすか。それが比べる値と違えば差があるんですよね」
先輩 「いや、それじゃダメだろ」
先輩の解説
統計は差を議論するのに必要
実験でパラメータを振ったら変化が見られた。これは発見?それともただの誤差範囲? 本当に意味がある差「有意差」があるかどうかを判断するのに統計が使われるんだ。
統計の一番基本は「平均」と「標準偏差」
平均の計算は小学生でもできるよね。だけど平均が同じでもデータが同じとは限らない。
63点,62点,60点,58点,57点でも、85点,80点,75点,60点,0点でも平均点は60点。だけど、60点の人の立ち位置が違うよね。後者では平均値が真ん中の値(中央値)からずれている。そこで、各点が平均点からどれくらいずれているか、という指標を加えたい。
この時に使うのが「標準偏差」(Standard Deviation, S.D.)と言って、平均点との差(偏差)を2乗して足し合わせた値をデータ数で割り平方根を取ったもの。標準偏差はどれくらいデータが分散しているかを表す値として良く使われるよ。
後輩「なるほど、統計って差を正しく解釈したり、データの分散を議論するのに必要なんすね。俺、ちょっと賢くなった気がします。先輩、ありがとうございました!」
参考
Excelで学ぶ統計解析入門 管 民朗 オーム社(2013)