SPSSによる正規性の検定Shapiro-wilk(シャピロウィルク)検定

未分類
スポンサーリンク
スポンサーリンク

正規性の検定

間隔尺度データや比率尺度データを扱う場合には,データの正規性を確認する必要があります.
データの正規性を確認することでパラメトリック検定を使用するべきか,ノンパラメトリック検定を選択するべきかを判断することができます.

正規性を確認せずに検定を選択しちゃダメなの?

正規性を確認せずに,正規分布でないデータにパラメトリック検定を適応したり,正規分布のデータにノンパラメトリック検定を適応してしまうと,正しい結果が得られません!

ちなみにパラメトリック検定よりもノンパラメトリック検定の方が有意な結果が得られにくいといった特徴があります.このような特徴から正規性の検定を行うことなく,正規分布のデータであろうが,非正規分布のデータであろうがノンパラメトリック検定を使う方がおられますが,これは誤りです.本来であれば有意な結果が得られるにもかかわらず有意な結果が得られない(第Ⅱ種の過誤)といった問題を引き起こしてしまいます.

正規性分布ってどうやって判断するの?

正規性(データが正規分布しているかどうか)を判断するためにはいくつかの方法が存在します.

  1. ヒストグラムを確認する
  2. 正規確率プロットを確認する
  3. 正規性の検定を行う
このうち1のヒストグラムを作成する方法や,2の正規確率プロットを確認する方法は,特別な統計ソフトを必要とすることなく,Excelなどの表計算ソフトを用いても行うことができるといった特徴が挙げられます.

ヒストグラムから正規性を判断しちゃだめなの?

ヒストグラムからの正規性の判断には限界があります!

ただし1のヒストグラムを作成する方法や,2の正規確率プロットを確認する方法には大きな問題があります.
それは正規性があるか無いかといった判断が主観的な判断になってしまうといった点です.

例えばヒストグラムを作成した際に左側のような分布になれば誰も正規分布だといった結論に反対する方はいないと思います.

また中央のような分布になれば,これも正規分布ではないと判断する方がほとんどでしょう.

ただ右側のような分布になった場合にはいかがでしょうか?

これは正規分布と判断するか非正規分布と判断するか非常に難しいところだと思います.

このようにヒストグラムによる正規性の判断というのは主観的な判断にすぎません

またサンプルサイズが小さい場合にはヒストグラムを使って正規性を判断することが困難な場合が多いです.

2の正規確率プロットを用いた正規性の検定も,最終的には散布図からプロットしたデータの直線性を確認するものですが,これもやはり主観的な判断に終わってしまいます.

そこで最も勧められる方法が正規性の検定(Shapiro-wilk(シャピロウィルク)検定)というわけです.

 

 

 

 

 

 

 

 

 

 

正規性の検定が実施できる統計ソフト

正規性の検定ができる統計ソフトってどんなのがありますか?

正規性の検定ができる統計ソフトって実は少ないんですよね

エクセルで簡易的に正規性の検定ができればよいのですが,実は正規性の検定が搭載されている統計ソフトというのは比較的少ないのです.

例えばすぐできるリハビリテーション統計に付属しているJ-STATなんかは正規性の検定が搭載されていないことで有名です.

SPSS,R(EZR),エクセル統計なんかが正規性の検定が搭載されている統計ソフトとしては有名でしょうか.

 

 

 

 

 

 

 

 

 

SPSSによる正規性の検定の方法(1標本の場合)

ここでは1標本を想定して性別(0=女性)と身長のデータを例にSPSSを使用した正規性の検定の方法をお示しいたします.

 

①分析⇒記述統計⇒探索的と選択

 

②正規性を確認したいデータ(身長)を従属変数へ移動させ,作図にチェック

 

③作図をクリックし,正規性の検定とプロットにチェックを入れ,続行⇒OKをクリック

 

これで数秒待てば結果が出力されます.

 

 

 

 

 

 

 

 

 

SPSSによる正規性の検定の確認方法・結果の見方(1標本の場合)

このように結果にはいろいろな情報が表示されますが,基本的にはShapiro-Wilk検定の部分の有意確率を参照すればよいだけです.

ちなみにShapiro-Wilk検定の左横にKolmogorov-Sminornov検定の結果も表記されますが無視して問題ありません.

結果の判断の方法ですが,

有意確率(p)<0.05:正規分布に従わない

有意確率(p)≧0.05:正規分布に従う(厳密にいえば正規分布に従わないとは言えない)

となります.

この場合には,p=0.969で有意確率が5%を上回っておりますので,正規分布に従う(厳密にいえば正規分布に従わないとは言えない)と解釈できます.

したがってこの場合には,パラメトリック検定を使用することとなります.

 

 

 

 

 

 

 

 

 

SPSSによる正規性の検定の方法(2標本の場合)

ここでは1標本を想定して性別(0=女性,1=男性)と身長のデータを例にSPSSを使用した正規性の検定の方法をお示しいたします.

例えば男性と女性の身長を比較したいといった場合に,2群間の比較検定を行う前にまずはデータの正規性を確認して,対応の無いt検定を用いるか,Mann-WhitneyのU検定を用いるかを判断することになります.

1標本と2標本って何が違うの?

2標本の場合には,グループ毎(ここでは性別毎)に正規性を判断する必要があります.つまり男性のデータの正規性と,女性のデータの正規性を別々に判定する必要があるわけです.

 

 

①分析⇒記述統計⇒探索的と選択

 

 

 

 

②正規性を確認したいデータ(身長)を従属変数へ,性別を因子へ移動させ,作図にチェック

 

 

 

③作図をクリックし,正規性の検定とプロットにチェックを入れ,続行⇒OKをクリック

 

 

 

 

 

 

 

 

 

 

SPSSによる正規性の検定の確認方法・結果の見方(2標本の場合)

このように結果にはいろいろな情報が表示されますが,基本的にはShapiro-Wilk検定の部分の有意確率を参照すればよいだけです.

2標本の場合には,性別毎に有意確率を見ていく必要があります.

結果の判断の方法も1標本の場合と同様です.

 

有意確率(p)<0.05:正規分布に従わない

有意確率(p)≧0.05:正規分布に従う(厳密にいえば正規分布に従わないとは言えない)

標本の場合には,男性・女性それぞれの有意確率を確認する必要があります.

この場合には,女性でp=0.781で,男性でp=0.170ですので,男性・女性ともに有意確率が5%を上回っておりますので,男性・女性ともに正規分布に従う(厳密にいえば正規分布に従わないとは言えない)と解釈できます.

したがってこの場合には,パラメトリック検定を使用することとなります.

仮にどちらか一方の群(男性だけとか女性だけとか)でも有意確率(p)が5%未満であれば,この場合にはノンパラメトリック検定であるMann-WhitneyのU検定を用いて比較を行うこととなります.
参考文献
対馬栄輝:SPSSで学ぶ医療系データ解析 第2版,東京図書
SPSSを使って統計解析をお手伝いします.5000円から格安で対応させていただいておりますのでお気軽にご相談ください.
スポンサーリンク
スポンサーリンク
未分類
シェアする
spss-statistics2020をフォローする
素人でもわかるSPSS統計

コメント

  1. […] ・正規分布に従うデータであること(正規性の判断についてはコチラを参照) […]

  2. […] ・正規分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  3. […] ・正規分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  4. […] ・正規分布以外の分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  5. […] ・正規分布以外の分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  6. […] ・正規分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  7. […] ・正規分布以外の分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  8. […] ・正規分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  9. […] ・正規分布に従うデータ(正規性の判断についてはコチラを参照してください) […]

  10. […] ・正規分布以外に従うデータ(正規性の判断についてはコチラを参照してください) […]

  11. […] SPSSによる正規性の検定Shapiro-wilk(シャピロウィルク)検定今回は統計ソフトS… […]

  12. […] SPSSによる正規性の検定Shapiro-wilk(シャピロウィルク)検定 […]

タイトルとURLをコピーしました