サンプルサイズの計算がなぜ必要なのか?
なぜかというと統計学的検定というのは,仮に有意確率P値が0.05未満であっても,その結果が偶然ということもあり得るからです
統計学的検定には実はからくりがあって,サンプルサイズ(n数)が大きくなると,必然的にP値は小さくなります.
t検定やノンパラメトリック検定ではサンプルサイズが大きくなるとP値が小さくなるといったお話については過去にもご紹介させていただきました.


Pearson(ピアソン)の積率相関係数やSpearman(スピアマン)の順位相関係数でもこれは同様です.
サンプルサイズが大きくなればP値が小さくなりますので,有意な相関が出やすくなります.
このようにサンプルサイズが大きくなると,有意な相関が出やすくなってしまうわけです.

統計学的には有意な相関関係があってもnが大きいから差が偶然出るってことがあるの?

その通りです.本当に2変数に強い関係性があって有意な相関が導かれる場合もあれば,サンプルサイズが大きいために有意な相関が出るといった場合もあります.
したがって適切なサンプルサイズで統計学的な検定を行わないと,サンプルサイズが大きかったから有意な相関が出たということになってしまいます.
そのため通常は,事前にサンプルサイズを決定して必要なサンプルサイズを決定してから,研究を行うことが重要となります.
G*powerを用いて事前にサンプルサイズを決定するためは何が必要か?
サンプルサイズの計算がなぜ必要なのかについてはご理解いただけたかと思います.

サンプルサイズってどうやって決めればよいの?

相関分析におけるサンプルサイズを決定するためには,3つの要因を決定する必要があります
- 1.効果量
2.αエラー
3.検出力(βエラー)
ここからはこの3つの要因の決め方についてご説明いたします.
効果量にはいくつかの設定方法があります.
まずサンプルサイズを事前設計する(研究を行う前にサンプルサイズを決める)場合には,①先行研究における効果量を用いる方法,②予備調査における効果量を用いる方法,③中間解析データを用いる方法があります.
ちなみに相関分析におけるサンプルサイズを決定する場合には,効果量=相関係数となりますので差の検定に比較すれば話が分かりやすいと思います.
自身の研究と類似した研究があれば,類似した研究の効果量(相関係数)を用います.
ちなみに今回ご紹介する方法はPearson(ピアソン)の積率相関係数やSpearman(スピアマン)の順位相関係数どちらにも使用できる方法ですので,とても便利です.
Test family⇒t testを選択
Statistical test⇒Correlation: Point biserial modelを選択
Type of power analysis⇒A priori:Compute required sample size
①one=片側検定,two=両側検定ですが,通常はtwoを選択
②効果量(Effect size)中間解析の段階における相関係数(または予備実験,先行研究における相関係数)を入力(ここでは仮にρ=0.50とする)
③αエラーを設定します.通常は0.05としますが,0.01でもかまいません
④検出力(1-βエラー)を設定します.デフォルト設定では0.95となっておりますが,0.8とされていることも多いです.通常はβがαの4~5倍になるように設定します.
⑤Calculateをクリックすると,最終的に必要なサンプルサイズは26例といった結論が得られます.
予備調査における効果量を用いる場合も基本的には先行研究における効果量を用いる方法と同様です.
予備調査における平均値や標準偏差を用いて効果量を算出した上で,サンプルサイズの設計を行います.
中間解析とはある程度,測定を行った段階で解析を行い,残りどのくらいのサンプルが必要かを検討する方法です.
中間解析における効果量を用いる場合も基本的には先行研究における効果量を用いる方法と同様です.
中間解析における平均値や標準偏差を用いて効果量を算出した上で,サンプルサイズの設計を行います.
最終的に算出されたサンプルサイズを目標に残りの調査を行うこととなります.
事前にサンプルサイズを設計できなかった場合には事後にG*powerを用いてサンプルサイズが適当だったか検出力を確かめよう

サンプルサイズって事前に決めるんでしょ?事後でも対応できるの?

サンプルサイズは事前に設計することが多いですが,事後にサンプルサイズが妥当であったかを調べる方法もあります.これを事後分析と呼びます
ここでG*powerを用いた事後分析の方法をご紹介いたします.
事後分析に関してもPearson(ピアソン)の積率相関係数やSpearman(スピアマン)の順位相関係数で方法は同様です.
①Test family⇒t testを選択
②Statistical test⇒Correlation: Point biserial modelを選択
③Type of power analysis⇒Post hoc:Coputed achieved powerを選択
④Tailsはtwo(両側検定)を選択
⑤効果量(Effect size)中間解析の段階における相関係数(または予備実験,先行研究における相関係数)を入力(ここでは仮にρ=0.50とする)
⑥αエラーを設定します.通常は0.05としますが,0.01でもかまいません
⑦実際のサンプルサイズを入力(ここではn=15とします)
⑧Calculateをクリック
⑨最終的に検出力が0.543と出力される(検出力が0.80を下回っているのでもう少しサンプルサイズを増やして検出力は高める必要があると判断できます).

事後分析の検出力って高ければいいの?

事後分析の検出力が1になっている場合には注意が必要です.検出力が1になっている場合には,サンプルサイズが過大な可能性が考えられます.つまりサンプルサイズが大きいために偶然差が出ている可能性があります.したがって検出力が0.80~1.00の値になることが理想です.
コメント