先輩、統計って何で必要なんっすか?

先輩、統計って何で必要なんっすか?

ある研究室の先輩後輩のお話

後輩 「先輩、何を読んでるんっすか」

先輩 「ちょっと面白い記事見つけてね。アカデミア同士の会話に重要なたちつてと、だって」

アカデミア同士の会話に重要な「たちつてと」https://lne.st/2014/09/19/tachitsuteto/

 

後輩 「いつも先輩が俺に突っ込んでくるような内容っすね。でも、最後の「統計的な裏付けは」ってあんまり俺らには関係ないっすよ。統計を使うのってアンケート結果とかですよね」

先輩 「ぼくらも、実験結果がどれくらい分散しているかを求めたり、有意差があるか確かめたりするのに使うよ」

後輩 「平均値を使えばいいんじゃないっすか。それが比べる値と違えば差があるんですよね」

先輩 「いや、それじゃダメだろ」

 

先輩の解説

統計は差を議論するのに必要

実験でパラメータを振ったら変化が見られた。これは発見?それともただの誤差範囲? 本当に意味がある差「有意差」があるかどうかを判断するのに統計が使われるんだ。

 

統計の一番基本は「平均」と「標準偏差」

平均の計算は小学生でもできるよね。だけど平均が同じでもデータが同じとは限らない。

63点,62点,60点,58点,57点でも、85点,80点,75点,60点,0点でも平均点は60点。だけど、60点の人の立ち位置が違うよね。後者では平均値が真ん中の値(中央値)からずれている。そこで、各点が平均点からどれくらいずれているか、という指標を加えたい。

この時に使うのが「標準偏差」(Standard Deviation, S.D.)と言って、平均点との差(偏差)を2乗して足し合わせた値をデータ数で割り平方根を取ったもの。標準偏差はどれくらいデータが分散しているかを表す値として良く使われるよ。

 

後輩「なるほど、統計って差を正しく解釈したり、データの分散を議論するのに必要なんすね。俺、ちょっと賢くなった気がします。先輩、ありがとうございました!」

 

参考

Excelで学ぶ統計解析入門 管 民朗 オーム社(2013)