お客さんから「イェーツの補正で検定かけて欲しい」という依頼にお答えしてモノ作ったら、データ入れて「この統計結果本当ですか」と来た。
うんまあ統計使うヒトが統計を理解しているとは限らないとは言え、自分が指定したものがどういう結果をもたらすものだというのくらいは、要望を出す側には抑えておいてもらいたいものである。
今回はSASを使わずに手で計算するという方法をちと。
とりあえずのデータ
あるお薬を投与された群Aと、プラセボ投与された群Pがあるとする。群Aで、とある有害事象が「発生した」のは200例中3例であった。群Pで、とある有害事象が「発生した」のは200例中2例であった。
群 | 計 | |||
---|---|---|---|---|
A | P | |||
有害事象 | 有 | __3 | __2 | __5 |
無 | 197 | 198 | 395 | |
計 | 200 | 200 | 400 |
計算方法をイメージしてもらう為のものである。はてな記法で書けそうにないので久々テーブルタグ使った。
群 | 計 | |||
---|---|---|---|---|
A | P | |||
有害事象 | 有 | O11 | O12 | O11+O12 |
無 | O21 | O22 | O21+O22 | |
計 | O11+O21 | O21+O22 | O11+O12+O21+O22 |
ピアソンのカイ二乗検定(Pearson's chi-squared test)
カイ二乗値の計算は、とりあえず汎用の定義を用いてみようかと。
カイ二乗検定 - Wikipedia
独立性の検定
Eij=ΣOin*ΣOnj/ΣΣOij
わかりづれえので今回のを書き下すと、
E11=(O11+O12)*(O11+O21)/(O11+O12+O21+O22)=5*200/400=2.5
E12=(O11+O12)*(O12+O22)/(O11+O12+O21+O22)=5*200/400=2.5
E21=(O21+O22)*(O11+O21)/(O11+O12+O21+O22)=395*200/400=197.5
E22=(O21+O22)*(O12+O22)/(O11+O12+O21+O22)=395*200/400=197.5
で、Σの個々の値を計算すると(便宜上個々の値をX^2_ijとしておく)
X^2_11=(O11-E11)^2/E11=(3-2.5)^2/2.5=0.025/2.5=0.01
X^2_12=(O12-E12)^2/E12=(2-2.5)^2/2.5=0.01
X^2_21=(O21-E21)^2/E21=(197-197.5)^2/197.5=0.000126582
X^2_22=(O22-E21)^2/E21=(198-197.5)^2/197.5=0.000126582
なので、
カイ二乗値は合計して0.020253165...という事になる。
ちなみに、2×2の場合には、青木先生の簡便公式が大変楽。
カイ二乗値からP値を計算する事はExcelでCHIDIST、あるいはCHISQ.DIST.RTを使う。
ここで、自由度という事を考える必要があるのだが、自由度はこの場合には1。m×nのクロス表の場合には(m-1)(n-1)。
P値は0.886832294...という事になるが、
話を端折ったが、この場合、この確率の仮説となっているのは、帰無仮説の「二つの要因に関係性はない」という確率であり、帰無仮説は棄却出来ないな、というだけである。
帰無仮説と対立仮説
イェーツの連続性の補正
ただ、さっきのカイ二乗検定は、計算は出来るものの、用いるべきではないという論文が発表されている。
カイ二乗検定では、「セルのどれかが度数1未満あるのはダメ」「度数5以下のものがセルとして20%超えているのはダメ」という話。
故に、こういう場合にイェーツの連続性の補正をしてカイ二乗検定を用いる事があった。
手計算でもなんとかなるので。
イェイツのカイ二乗検定 - Wikipedia
但し、Wikipediaで記載されてはいないのだが、|O-E|-0.5<0の時には0にしとくのがお作法。
X^2_11=(|O11-E11|-0.5)^2/E11=(|3-2.5|-0.5)^2/2.5=0
X^2_12=(|O12-E12|-0.5)^2/E12=(|2-2.5|-0.5)^2/2.5=0
X^2_21=(|O21-E21|-0.5)^2/E21=(|197-197.5|-0.5)^2/197.5=0
X^2_22=(|O22-E21|-0.5)^2/E21=(|198-197.5|0.5)^2/197.5=0
イェーツの補正を入れたカイ二乗値は0となり、まあ問答無用でP=1となる。
連続性の補正というのは、要はこの度数は整数なので離散値なのだけど、カイ二乗分布は連続値で考えてる事もあり、まあ、四捨五入的に整数になってるパターンだってあんじゃないのというお話。関係性を見つける側からすると保守的になる。
念の為
これはどういうことか、という事を念の為に付け加えておく。
元々、200例中2例しか発生しない、200例中3例しか発生しないという話なので、その有害事象の発生有無に関して薬剤の差「だけ」とは見られないという事であり、薬剤が全く原因でないのかというとそれは分からない。
これが例えば20000例中200例、200000例中300例、であると、カイ二乗値は20.253...となり、P値は0.0001未満となる。
例数が十分に足りていると考えられるか、という事も考える必要がある。逆に言うと、例数を増やすと大抵は「統計的に有意な差を発見するのは簡単」。ただ、この比率の差、自体に意味があるのかないのかは「そもそもの値の意味を問わねばなるまい」という事になる。そこは統計は回答を出せない。