よくテレビ番組などで、「ゴマを1日30グラム食べるだけで、やせられることが証明された!」「リンゴを1日1個食べることでやせられる」など様々な情報が飛び交っています。
実験の多くは、食べる人と食べない人で分けてその結果を比較します。ゴマでやせることの証明の例をとると、以下のように検証していました。
8人の女性を被験者として、実験前に体重と体脂肪率を測定し、採決をして血液中のコレステロール値を検査していました。その後、4人には1週間ゴマ30gを食べてもらい、あとの4人には食べないようにしてもらって、1週間後にもう一度血中コレステロール値を測定して全治と比較する、という検証の内容でした。
【検証結果】
ゴマを食べた人 → 4人中3人
ゴマを食べてない人 → 4人中1人
検証の結果、上記のような結果が出ました。
この結果は「すごい!!」と思いますか?それとも「ただの偶然では?」と思いますか?
統計的にはもちろん「3回対1回は偶然に起こったに過ぎない」と判断します。
では、次の例はどうでしょうか?
1週間後に血中コレステロール値が低下した人数
ゴマを食べた人 : 400人中300人
ゴマを食べてない人 400人中100人
この結果が出た場合は、ほとんどの人は「ゴマを食べることにより血中コレステロール値が低下した」と判断するのではないでしょうか?ただの偶然では300人対100人にはならないはずだ、と判断するからです。
ではその基準は何でしょうか?母数が400人ではなく100人ならどうでしょうか?40人ならどうでしょうか?…
どこからが偶然で、どこからが有意な差なのか、それを判断するのが統計になります。
知りたいことを確実に検証するには、地球上のすべての人で検証して、その効果があるか、どの程度の頻度で副作用が起こるのかを調べればいいわけです。
しかし、それは非現実的です。そこで実際の研究では、1部の人で検証し、それをもって地球上のすべての人に有効か、副作用が無いかを判断するわけです。
一部の人から得た結果からみんなんいとって一体どのくらい有効なのかを知るようにするのが統計処理になります。
統計処理では必ず津使われる記号「P」。ではP値(p value)とは具体的に、何なのか見ていきましょう
使用されている例として…
●試験薬の投与後の血中コレステロール値は男女間で有意差が認められなかった(P=0.07)
●薬物投与後の血圧の低下は、AグループがBグループに比較して有意に大きかった(P<0.05)
●Aグループでは治療前に比べ、血糖値(P<0.0001)及び尿中ケトン値(P<0.05)は優位に低下したが、Bグループでは血糖値(P<0.01)のみが低下し、尿中ケトン値(P=0.67)は有意には低下しなかった。
このP値は
「P<0.05であれば、比較したデータに関してグループ間に有意な差があると解釈する」
とされています。
何となくわかっていはいますが、P=0.07とかP<0.05とか、これらの数字や記号はいったい何を意味しているのでしょうか?
このP値はどんな値であって、なぜ0.05未満になると有意差があると判断するのでしょうか?これについて整理していきたいと思います。
私たちは、統計で比較検討をしてまず知りたいのは、「比較するデータに差があるかどうか」です。
例を挙げると…
例1:2004~2008年のサラリーマンの平均年収はそれ以前の5年間に比べて本当に下がったのか?
例2:ゴマを1週間食べると、血中コレステロール値が本当に下がるのか?
例3:新薬Aは従来薬Bに比べて本当により強く新パック数を減少させるのか?
例1は国税庁の出したデータを基にした場合は、すべての人からとったデータとなりそれを解釈するときには、P値などがでてくる統計処理は必要ない。
例2の場合は、全世界の人で調査しているわけではなkう、一部の人から得た結果となり、一般化できるか、適応できるかを知るには統計が必要となる。
ゴマ | 低下した | 低下しなかった |
---|---|---|
食べた | 3 | 1 |
食べてない | 1 | 3 |
上記8人のデータの場合、P=0.23(統計検索法)となる。
P<0.05の場合、「両グループで有意な差がある」と判断する為、この比較検討結果からは、「ゴマを食べたら血中コレステロール値が下がる」とは言えないことになる。
800人からデータを取って比較した場合は、
ゴマ | 低下した | 低下しなかった |
---|---|---|
食べた | 300 | 100 |
食べてない | 100 | 300 |
上記800人の場合P=0.0000000…と限りなく0に近い値になる。
P<0.05の為、ゴマを食べた後、血中コレステロール値が有意に下がったと解釈してよい。
【課題】結果として得られたグループ間の差は、状検査によるものなのか、個体差から出たただの「偶然」の差なのか、を鑑別する必要がある。
→グループ差から個体差を取り除き結論づけるのは難しい
→そこで、”グループ間には個体差しかない。”という考えで、「得られたグループ間の差は、条件(例えば投与された薬)の違いによるものではなくて、ただの個体差による偶然の差に過ぎない。」という前提に立って調べていく。(帰無仮説)結果は、P(probability(確率))値で表せれる。
→P値が小さいほど、グループ間に差がある確率が高くなる。
一般的に P < 0.05 の場合、グループ間に有意な差があるという。
ここで使用する0.05という数値を有意水準という。
グループ間に差があるとわかった時に、次に知りたいのが、
”グループ間に差があるのであれば、どのくらいの差があるのか?”
仮説検定→グループ間の三尾程度は求められない。
例えば、女子高生と男子高校生の身長差のP値をとるとP<0.001となり、男子高校生は女子高校生に比べて有意に身長が高いと判定することが出来る。が、P値をいくら見ても差の程度を知ることはできない。
「真の差」がどの辺にあるかを算出する方法を「信頼区間」という。