SPSSを用いて相関係数を算出するには? ピアソン(Pearson)の積率相関係数の見方とグラフの作成方法まで解説

未分類
スポンサーリンク
スポンサーリンク

パラメトリック検定であるPearson(ピアソン)の積率相関係数の適用の条件

Pearson(ピアソン)の積率相関係数を算出する場合には,いくつかの条件を満たす必要があります.

ここではパラメトリックの検定であるPearson(ピアソン)の積率相関係数を適用するための3つの条件をお示しいたします.

・正規分布に従うデータ(正規性の判断についてはコチラを参照してください)

・データが比率尺度データ・間隔尺度データ
(多段階の順序尺度のデータに対して用いることも可能です)

・対応のある2変数以上のデータ

相関係数にはPearson(ピアソン)の積率相関係数とSpearman(スピアマン)の順位相関係数がありますが(あまり使用されることはありませんがKendallの順位相関係数もあります),Pearson(ピアソン)の積率相関係数がパラメトリックな手法であり,Spearman(スピアマン)の順位相関係数がノンパラメトリックな手法と考えるとわかりやすいと思います.

対応があるって何?

対応があるというのは関係性を調査するデータが同一対象例のデータであることを意味します

 

例えばある集団における身長と体重の関係性を明かにする場合に相関分析が用いられます.

2つのデータの関係性を分析する検定には,パラメトリックの検定であるPearson(ピアソン)の積率相関係数と,ノンパラメトリックの検定であるSpearman(スピアマン)の順位相関係数が存在します.

2変数がともに間隔尺度データ・比率尺度データであってデータに正規性が確認できる場合にはPearson(ピアソン)の積率相関係数を用います.

2変数のうち1変数が順序尺度データ(多段階のものは除く)の場合や,1変数が間隔尺度データ・比率尺度データであってもデータの正規性が確認できない場合には,Spearman(スピアマン)の順位相関係数を使用することとなります.

ちなみに2変数ともに順序尺度データ(多段階のものは除く)の場合や,2変数がともに間隔尺度データ・比率尺度データであってデータの正規性が確認できない場合にも,Spearman(スピアマン)の順位相関係数を使用することとなります.

2変数ともに正規分布の間隔・比率尺度データ

⇒ Pearson(ピアソン)の積率相関係数

1変数が順序尺度または非正規分布の間隔・比率尺度データ

⇒ Spearman(スピアマン)の順位相関係数

2変数ともに順序尺度または非正規分布の間隔・比率尺度データ

⇒ Spearman(スピアマン)の順位相関係数

 

 

 

 

 

 

 

SPSSを使用したPearson(ピアソン)の積率相関係数-データ入力の方法-

SPSSでPearson(ピアソン)の積率相関係数を算出する場合にはデータの入力方法は簡単です.

このように横列に関係性を分析したい同一対象者のデータ(身長と体重)を並べます.

 

 

 

 

 

 

 

SPSSを使用したPearson(ピアソン)の積率相関係数の算出方法-2変数の関連性を明かにしたい場合-

まずは関連性を明かにしたい変数が2つの場合の方法をご紹介いたします.

①分析⇒相関⇒2変量を選択

 

 

 

 

 

②関連性を見たい変数を選択(crtlを用いると選択しやすい)して,右矢印ボタンを使って変数欄へ移動させ,Pearsonにチェックを入れてOKをクリック

 

 

SPSSを使用したPearson(ピアソン)の積率相関係数の結果の見方・確認方法 -2変数の関連性を明かにしたい場合-

これがPearson(ピアソン)の積率相関係数の結果です.

①有意確率

相関分析の結果を見る際にははじめに必ず有意確率を確認しましょう.

有意確率(p)<0.05:相関がある

有意確率(p)≧0.05:相関がない(厳密にいえばあるともないとも言えない)

この場合には,有意確率が0.006で5%未満ですので,身長と体重には有意な相関があるといった解釈ができます.

 

 

②相関係数(r)

有意確率が有意水準未満(ここでは5%)であれば,合わせて相関係数(r)を確認します.

この場合には相関係数は0.796であることが確認できます.

相関係数って0.796って相関が強いの?弱いの?

相関係数には以下のような目安があります.ただこれはあくまで目安であって絶対的な基準ではない点にも注意が必要です.

 

|r|=1.0~0.7

強い相関がある

|r|=0.7~0.4

中等度の相関がある

|r|=0.4~0.2

弱い相関がある

|r|≦0.2

ほとんどなし

今回の場合には相関係数は0.796ですので身長と体重の間には有意な強い相関があると解釈できるでしょう.

③もう1つ相関係数(r)が出力される

相関分析を行うと変数の数に応じた表が出力されます.

この場合には変数は身長と体重で2つですので,2×2の表が出力されます.

出力された表には対角線上に同じ有意確率と相関係数が出力されます.

この場合にはどちらの有意確率と相関係数を確認しても問題ありません.

右上は体重と身長の関係を,左下は身長と体重の関係を見ているわけですが,結局は同じことです.

 

 

 

SPSSを使用したPearson(ピアソン)の積率相関係数の算出方法-相関行列を作成して3変数以上の関連性を明かにしたい場合-

次に関連性を明かにしたい変数が3つ以上の場合の方法をご紹介いたします.
これは相関行列を作成する方法になりますが,2変数ずつの組み合わせで複数回相関分析を行うのは骨が折れますが,相関行列を作成する方法は非常に効率的です.
難しい話にはなりますが相関行列を作成する場合には,検定の多重性(相関分析を複数回繰り返すと有意な相関が出やすくなる)にも注意が必要です.
①分析⇒相関⇒2変量を選択

 

 

②関連性を見たい変数を選択(crtlを用いると選択しやすい)して,右矢印ボタンを使って変数欄へ移動させ,Pearsonにチェックを入れてOKをクリック

 

 

 

SPSSを使用したPearson(ピアソン)の積率相関係数の結果の見方・確認方法 -3変数以上の関連性を明かにしたい場合-

これがPearson(ピアソン)の積率相関係数の結果です.

①有意確率

相関分析の結果を見る際にははじめに必ず有意確率を確認しましょう.

相関行列の場合には複数の組み合わせの有意確率を確認する必要があります.

有意確率に応じて以下のように解釈します.

有意確率(p)<0.05:相関がある

有意確率(p)≧0.05:相関がない(厳密にいえばあるともないとも言えない)

この場合には,「身長×体重」,「身長×腹囲」,「体重×腹囲」といった3つの組み合わせが考えられますが,いずれも有意確率が5%未満ですので,身長・体重・腹囲の間には有意な相関があるといった解釈ができます.

ちなみに関係性を分析したい変数の数が増えると表から有意な相関が得られた数値を読み取るのに時間がかかります.

そのためSPSSでは有意確率が5%または1%未満のものにはアスタリスク(*)が表記されるようになっております.

ちなみに有意確率が1%未満であればアスタリスクが2つ,有意確率が5%未満であればアスタリスクが1つ表示されます.

 

②相関係数(r)

有意確率が有意水準未満(ここでは5%)であれば,合わせて相関係数(r)を確認します.

この場合には相関係数は「身長×体重:0.796」,「身長×腹囲:0.812」,「体重×腹囲:0.979」であることが確認できます.

|r|=1.0~0.7

強い相関がある

|r|=0.7~0.4

中等度の相関がある

|r|=0.4~0.2

弱い相関がある

|r|≦0.2

ほとんどなし

今回も「身長×体重」,「身長×腹囲」,「体重×腹囲」いずれも相関係数が0.7を上回っておりますので,身長・体重・腹囲の間には強い相関があると解釈できるでしょう.

 

③もう1つの組み合わせの相関係数(r)が出力される

相関分析を行うと変数の数に応じた表が出力されます.

この場合には変数は身長・体重・腹囲で3つですので,3×3の表が出力されます.

出力された表には対角線上に同じ有意確率と相関係数が出力されているのが確認できます.

この場合にはどちらの有意確率と相関係数を確認しても問題ありません.

 

 

 

 

 

Pearson(ピアソン)の積率相関係数を算出したら合わせて相関係数の95%信頼区間を算出しよう

 

相関係数の信頼区間って何?

相関係数の信頼区間を算出することで相関係数を幅を持って推定することが可能となります.例えば相関係数が0.60という場合にも,95%信頼区間が0.1~0.9の場合もあれば,0.5~0.7の場合もあります.前者の場合には相関係数が低い可能性もあるという解釈ができますが,後者の場合には最低でも相関係数が0.5以上であり,中等度から強い相関があるといった結論を導くことができます.

相関係数の95%信頼区間を算出した場合には,信頼区間の下限値に着目することが重要です.

下限値が一定の値以上であれば,より強く関係性の強さを主張できることになります.

 

 

相関係数の信頼区間ってどうやって算出するの?

残念ながらSPSSでは相関係数の信頼区間を算出することはできません.相関係数の信頼区間を算出するには以下のエクセルファイルを使用することをお勧めします.

エクセルファイルはこちら

ここではこのエクセルファイルを用いて相関係数の信頼区間を算出する例をお示しします.

仮に相関係数が0.60でサンプルサイズが40であったとします.

使用方法は非常に簡単です.

①に0.60,③に40と入力すればよいだけです.

この場合は95%信頼区間を算出するために②を95としておりますが,99%信頼区間を算出した蹴れば②に99と入力します.

最終的に④に相関係数の信頼区間の下限値と上限値が出力されます.

この場合には,0.35~0.77が相関係数の95%信頼区間ということになります.

 

 

 

 

SPSSを用いてPearson(ピアソン)の積率相関係数を行った際のグラフ作成

Pearson(ピアソン)の積率相関係数を用いる場合には2変数の関連性を分析することとなりますので,Pearson(ピアソン)の積率相関係数を用いた場合に使用すべきグラフは散布図です.

 

①グラフ⇒レガシーダイアログ⇒散布図/ドットを選択

 

 

②単純な散布にチェックして定義をクリック

 

③関連性をみたい変数(身長・体重)をそれぞれY軸・X軸へ移動させてOKをクリック

オプションは特に設定する必要はありません.

 

 

④散布図が完成

 

これが完成した散布図です.

散布図からも右肩上がりの比例関係が読み取れます.

非常に重要なのはただ相関係数を算出するのではなく,相関係数を算出する前にこのような散布図を描出することです.ピアソンの積率相関係数というのはあくまで直線関係をみているにすぎません.散布図を描出してみると直線関係以外の他の関係性が見えてくる場合もあります.

 

 

 

 

 

 

 

 

Pearson(ピアソン)の積率相関係数における効果量(r)の算出

 

相関分析でも効果量の算出が必要なの?

いえ,必要ありません.実は相関分析では有意確率と合わせて相関係数をみるのが一般的です.実はこの相関係数というのが効果量に当たるものですので,相関分析の場合には効果量を改めて算出する必要はありません.

 

 



SPSSを使って統計解析をお手伝いします.5000円から格安で対応させていただいておりますのでお気軽にご相談ください.
スポンサーリンク
スポンサーリンク
未分類
シェアする
spss-statistics2020をフォローする
素人でもわかるSPSS統計

コメント

  1. […] 2変数の関係性を見る方法については,パラメトリックの検定であるPearson(ピアソン)の積率相関係数とノンパラメトリックの検定であるSpearman(スピアマン)の順位相関係数についてご紹介させていただきました. […]

  2. […] 2変数の関係性を見る方法については,パラメトリックの検定であるPearson(ピアソン)の積率相関係数とノンパラメトリックの検定であるSpearman(スピアマン)の順位相関係数についてご紹介させていただきました. […]

  3. […] ⑤治療前・治療後のデータの相関係数を入力 対応のあるt検定を使用しているということは正規性のあるデータということになりますので,パラメトリックの分布に使用する相関係数であるPearsonの積率相関係数を事前に算出しておく必要があります […]

タイトルとURLをコピーしました