フリーソフトG*powerを使った必要なサンプルサイズの計算(検出力分析・検出力検定)-Mann-WhitneyのU検定やWilcoxonの符号付順位検定におけるサンプルサイズの計算-

サンプルサイズ設計
スポンサーリンク
スポンサーリンク

サンプルサイズの計算がなぜ必要なのか?

統計学的検定を行う際には,サンプルサイズを決定することが重要となります.

なぜかというと統計学的検定というのは,仮に有意確率P値が0.05未満であっても,その結果が偶然ということもあり得るからです

サンプルサイズが大きいとP値が小さくなる

統計学的検定には実はからくりがあって,サンプルサイズ(n数)が大きくなると,必然的にP値は小さくなります.

Mann-WhitneyのU検定Wilcoxonの符号付順位検定ではZ値と呼ばれる統計量を使用して,有意かどうかを判断します.

例えばMann-WhitneyのU検定の場合には,Z値は以下の数式で算出されます.

正規化検定

少しややこしい数式ですが重要なのはn1やn2が大きくなるとZ値が大きくなるといった点です.

Z値が大きくなるとP値が小さくなりますので,Z値が大きいほどMann-WhitneyのU検定では有意差が出やすくなります.

これはWilcoxonの符号付順位検定でも同様です.

このようにサンプルサイズが大きくなると,差が出やすくなってしまうわけです.

統計学的には有意差があってもnが大きいから差が偶然出るってことがあるの?

その通りです.本当に2群間に差があって有意差が出る場合もあれば,サンプルサイズが大きいために有意差が出るといった場合もあります.

したがって適切なサンプルサイズで統計学的な検定を行わないと,サンプルサイズが大きかったから有意差が出たということになってしまいます.

そのため通常は,事前にサンプルサイズを決定して必要なサンプルサイズを決定してから,研究を行うことが重要となります.

 

 

 

 

G*powerを用いて事前にサンプルサイズを決定するためは何が必要か?

サンプルサイズの計算がなぜ必要なのかについてはご理解いただけたかと思います.

サンプルサイズってどうやって決めればよいの?

 

サンプルサイズを決定するためには,4つの要因を決定する必要があります

 

  1. 1.効果量
    2.αエラー
    3.検出力(βエラー)
    4.Allocation ratio
    (対応のある検定の場合には比較する群のサンプルサイズが同等なので,Allocation ratioは必然的に1になりますので必要ありません.この場合には,Mann-WhitneyのU検定ではAllocation ratioを入力する必要がありますが,Wilcoxonの符号付検定では入力する必要がありません)

 

ここからはこの3つの要因の決め方についてご説明いたします.

1.効果量

効果量にはいくつかの設定方法があります.

まずサンプルサイズを事前設計する(研究を行う前にサンプルサイズを決める)場合には,①先行研究における効果量を用いる方法,②予備調査における効果量を用いる方法,③中間解析データを用いる方法があります.

①先行研究における効果量を用いる方法

自身の研究と類似した研究があれば,類似した研究の効果量を用います.

Mann-WhitneyのU検定やWilcoxonの符号付検定の場合には効果量(d)を算出することは稀で,効果量(r)を算出することが多いと思いますので,G*powerを用いて計算をします.

Mann-WhitneyのU検定

Test family⇒t testを選択

Statistical test⇒Means:Wilcoxon-Mann-Whitney test(two groups)を選択

Type of power analysis⇒A priori:Compute required sample size

Determineをクリックして効果量(d)を計算

①A群の平均値を入力(この場合,20)

②B群の平均値を入力(この場合,30)

③A群の標準偏差を入力(この場合,10)

④B群の標準偏差を入力(この場合,5)

⑤Calculateをクリック

⑥効果量(d)=1.264を確認

⑦Calculate and transfer to main windowをクリック

これで効果量(Effect size d)のところに”1.264″と表示されるのが確認できます.

①one=片側検定,two=両側検定ですが,通常はtwoを選択

②分布ですがわからなければNormalを選択

③効果量(Effect size d)のところに”1.264″の表示を確認

④αエラーを設定します.通常は0.05としますが,0.01でもかまいません

⑤検出力(1-βエラー)を設定します.デフォルト設定では0.95となっておりますが,0.8とされていることも多いです.通常はβがαの4~5倍になるように設定します.

⑥Allocation ratioはA群とB群の比を入力します.ここではA群が8例・B群が12例といった状況を想定しておりますので,Allocation ratioは12/8=1.5としております.

⑦Calculateをクリック

⑧最終的にA群10例,B群14例,合計24例のサンプルサイズが妥当だといった結論が得られます.

 

 

 

 

Wilcoxonの符号付順位検定

次にWilcoxonの符号付順位検定についても手順をご説明いたします.

Test family⇒t testを選択

Statistical test⇒Means:Wilcoxon-single rank test(matched groups)を選択

Type of power analysis⇒A priori:Compute required sample size

Determineをクリックして効果量(d)を計算

①治療前の平均値を入力(この場合,20)

②治療後の平均値を入力(この場合,25)

③治療前の標準偏差を入力(この場合,10)

④治療後の標準偏差を入力(この場合,10)

⑤治療前と治療後のデータの相関関係を事前に検証し,ここに入力する必要があります.この場合,ノンパラメトリックの分布データに対してWilcoxonの符号付順位検定を用いているわけですから,相関係数もスピアマンの順位相関係数を用います.

⑥Calculateをクリック

⑦効果量(d)=0.790を確認

⑧Calculate and transfer to main windowをクリック

これで効果量(Effect size d)のところに”1.264″と表示されるのが確認できます.

①one=片側検定,two=両側検定ですが,通常はtwoを選択

②分布ですがわからなければNormalを選択

③効果量(Effect size d)のところに”1.264″の表示を確認

④αエラーを設定します.通常は0.05としますが,0.01でもかまいません

⑤検出力(1-βエラー)を設定します.デフォルト設定では0.95となっておりますが,0.8とされていることも多いです.通常はβがαの4~5倍になるように設定します.

⑥Allocation ratioはA群とB群の比を入力します.ここではA群が8例・B群が12例といった状況を想定しておりますので,Allocation ratioは12/8=1.5としております.

⑦Calculateをクリック

⑧最終的にA群10例,B群14例,合計24例のサンプルサイズが妥当だといった結論が得られます.

 

 

②予備調査における効果量を用いる方法

予備調査における効果量を用いる場合も基本的には先行研究における効果量を用いる方法と同様です.

予備調査における平均値や標準偏差を用いて効果量を算出した上で,サンプルサイズの設計を行います.

 

 

 

③中間解析における効果量を用いる方法

中間解析とはある程度,測定を行った段階で解析を行い,残りどのくらいのサンプルが必要かを検討する方法です.

中間解析における効果量を用いる場合も基本的には先行研究における効果量を用いる方法と同様です.

中間解析における平均値や標準偏差を用いて効果量を算出した上で,サンプルサイズの設計を行います.

最終的に算出されたサンプルサイズを目標に残りの調査を行うこととなります.

 

事前にサンプルサイズを設計できなかった場合には事後にG*powerを用いてサンプルサイズが適当だったか検出力を確かめよう

 

サンプルサイズって事前に決めるんでしょ?事後でも対応できるの?

 

サンプルサイズは事前に設計することが多いですが,事後にサンプルサイズが妥当であったかを調べる方法もあります.これを事後分析と呼びます

 

ここでG*powerを用いた事後分析の方法をご紹介いたします.

Mann-WhitneyのU検定

①Test family⇒t testを選択

②Statistical test⇒Means:Wilcoxon Mann-Whitney test(two groups)を選択

③Type of power analysis⇒Post hoc:Coputed achieved powerを選択

④Tailsはtwo(両側検定)を選択

⑤distributionはNormalを選択

⑥効果量(d)を入力(効果量(d)を算出していない場合には,Determineをクリックして,平均値と標準偏差から効果量を算出.ここでは仮に”1.0″とします)

⑦αエラーを設定.通常は0.05としますが,0.01でもかまいません検出力(1-βエラー)を設定.

⑧A群のサンプルサイズを入力(ここではn=18とします)

⑨B群のサンプルサイズを入力(ここではn=24とします)

⑩Calculateをクリック

⑪最終的に検出力が0.863と出力される(検出力が0.80を上回っているので検出力は高いと判断できます).

 

Wilcoxonの符号付順位検定

 

①Test family⇒t testを選択

②Statistical test⇒Means:Wilcoxon Single-rank test(matched groups)を選択

③Type of power analysis⇒Post hoc:Coputed achieved powerを選択

④Tailsはtwo(両側検定)を選択

⑤distributionはNormalを選択

⑥効果量(d)を入力(効果量(d)を算出していない場合には,Determineをクリックして,平均値と標準偏差から効果量を算出.ここでは仮に”1.0″とします)

⑦αエラーを設定.通常は0.05としますが,0.01でもかまいません検出力(1-βエラー)を設定.

⑧サンプルサイズを入力(ここではn=11とします)

⑨Calculateをクリック

⑩最終的に検出力が0.826と出力される(検出力が0.80を上回っているので検出力は高いと判断できます).

 

 

事後分析の検出力って高ければいいの?

 

事後分析の検出力が1になっている場合には注意が必要です.検出力が1になっている場合には,サンプルサイズが過大な可能性が考えられます.つまりサンプルサイズが大きいために偶然差が出ている可能性があります.したがって検出力が0.80~1.00の値になることが理想です.

 

 

 

 

SPSSを使って統計解析をお手伝いします.5000円から格安で対応させていただいておりますのでお気軽にご相談ください.
スポンサーリンク
スポンサーリンク
サンプルサイズ設計
シェアする
spss-statistics2020をフォローする
素人でもわかるSPSS統計

コメント

タイトルとURLをコピーしました