1. トップ
  2. 看護記事
  3. 看護管理
  4. 看護研究
  5. Step22【看護研究】データの集計方法

【連載】初歩からわかる看護研究

Step22【看護研究】データの集計方法

  • 公開日: 2012/8/4
  • 更新日: 2020/10/22

今回から、質問紙の回答をデータ集計していく手順に入ります。まずは統計学の基本である、データ全体の傾向を示す記述統計について。まずは、度数分布について解説します。


【看護研究まとめ記事】
* 看護研究とは?テーマ選びと書き方まとめ(計画書、文献など)

質問紙の回答をエクセルに入力していく

質問紙を回収したら、質問紙にID番号を付けていきます。赤字で番号を振るかナンバリング(スタンプ)を使って番号を付けていきます。次にデータを入力していきますが、その前に項目ごとに入力するデータの番号を決めておきます。

質問紙の回答が年齢のような実数あるいは、選択肢に番号が付いている場合はそのまま採用します。番号がついていないものについては、例えば性別を問う項目で「男性」に丸が付いている場合は「1」、「女性」に丸がついている場合は「2」というように決めておきます。これをコーディングといいます。

データの集計はExcelや統計ソフトを用いて行う場合がほとんどです。本稿ではExcelで集計する方法を説明します。

>> 続きを読む

ID番号に合わせて、1行に1人分のデータを入力していきます。データは半角英数で入力します。全角で入力したり、「1,2」などカンマを付けて2個以上のデータを入力したりすると計算できません。必ず1つのセルに半角で数字を1つ入力してください。無回答の場合は空白にします。平均値が誤って計算されますので、「99」などとはしないでください。

複数回答の場合は、複数回答の数だけ「ある」か「ない」かをたずねているのと同じです。丸が付いていたら「1」、丸がついていなかったら空白とします。

比率、平均値などを計算してグラフ化しデータの特徴をみる

記述統計とは、データを要約することを目的とする統計学の基本です。度数分布や比率(%)、平均値、標準偏差、相関係数などを算出したり、グラフ化したりすることによって、データ全体としての特徴を明らかにします。

数字の分析をする上での基本であり、どんなに難しい解析をするとしても、まずは記述統計によってデータの全体の傾向をしっかりつかむ必要があります。

それでは、度数分布から説明していきましょう。

度数分布を算出する

各質問項目の回答数を度数といいます。例えば男性何名、女性何名、あるいは「はい」が何名、「いいえ」が何名といった数です。Excel関数ではCOUNTIFを用いて計算することができます。無回答の空白はCOUNTBLANKを用います。その数を小さい順に個数を表示するのが度数分布です。

[1] COUNTIF:5段階それぞれに回答した人数を数える。人数を入れたいセル(例:B列22行)をクリックし、数式タブ→ その他の関数→ 統計→COUNTIFをクリック(図1-1)。

[2]「範囲」にQ1の20人分のデータ(B列2行から21行)を選択(関数の引数パレットの「範囲」にデータが入ったことを確認)。「検索条件」をクリック→回答者数を数えたい番号「1」を入力→OKを押す(図1-2)。

[3]次にB列23行をクリックして、同様の作業を行い、検索条件を「2」にする。「3,4,5」も同様に行う。

度数分布を算出

※ここではExcel2007の操作方法について紹介しています。

[4]COUNTBLANK:無回答数を数える。人数を入れたいセル(例:B列27行) をクリックし、数式タブ→ その他の関数→ 統計→COUNTBLANK→「範囲」にQ1の20人分を選択→OKを押す(図2)。

度数分布を算出②

※ここではExcel2007の操作方法について紹介しています。

度数分布のグラフを作成する

[1]前頁のCOUNTIFで計算した度数(例:B列22~26行)を選択し、挿入タブ→縦棒→2-D縦棒を選択すると、図3のような度数分布のグラフができる。

度数分布のグラフ作成

※ここではExcel2007の操作方法について紹介しています。

グラフにすると図3のようになります。Q1のように釣鐘様の正規分布に近い分布なのか、Q2のように右に偏った分布なのかが、グラフで表すと確認できます。

次は、平均値と標準偏差、中央値、比率について解説します。さらに2つの項目の相関関係を調べる方法を解説します。

比率、平均値などを計算してグラフ化しデータの特徴をみる

平均値は、集団全体の中心を代表値として示すものです。全てのデータ値を合計し、データ数で割って算出します。標準偏差はデータのバラツキを表します。

図1を見てください。AとBの数字を年齢だとしましょう。4人の平均年齢は同じく75歳ですが、Aは60歳、70歳、80歳、90歳、Bは50歳、65歳、85歳、100歳で年齢の幅が違います。Bのほうが幅が広くバラツキが大きいことがわかります。この標準偏差を計算すると、Aは13、Bは22です。

平均値と標準偏差

標準偏差は、平均値を中心にどの位の幅でデータのバラツキがあるかを示します。標準偏差が大きいほど幅が広く、バラツキが大きいことがわかります。このように同じ平均値でも全体のデータの傾向が違うので、平均値を表示するときは、標準偏差も必ず付記してください。Excel関数のAVERAGE(平均値)、 STDEV(標準偏差)を使って計算することができます。

図2のQ1のように、平均値を中心としてプラス方向とマイナス方向に等しくデータがバラついている分布の場合は、平均値と標準偏差で表すのが適していますが、データに偏りがある場合は、中央値で示す方がデータの中心を的確に示します。

中央値とは、全てのデータを小さい順に並べた時にちょうどまん中になる値です。図2のQ2のように偏っている分布では、平均値と中央値がずれてしまいます。中央値は、Excel関数のMEDIAN(中央値)を使って計算することができます。

度数分布のグラフ

平均値と標準偏差、中央値を出す

■AVERAGE:平均値を算出する。結果を入れたいセルをクリックし、数式タブ→その他の関数→統計→AVERAGE→「数値1」にQ1の人数分のデータを選択→OKを押す。

■STDEV:標準偏差を算出する。結果を入れたいセルをクリックし、数式タブ→ その他の関数→ 統計→STDEV→「数値1」にQ1の人数分のデータを選択→OKを押す。

■MEDIAN:中央値を算出する。結果を入れたいセルをクリックし、数式タブ→ その他の関数→ 統計→MEDIAN→「数値1」にQ1の人数分のデータを選択→OKを押す。

■コピーで楽々計算:Q2も同様の結果を出す。Q1について度数「1~5」、無回答、平均値、標準偏差、中央値の結果を算出したセルを選択し、右下角にカーソルを置いてポインタが+になったら右横にドラッグ(クリックしたままカーソルを右に)する。質問項目が多数あっても同様にドラッグすれば、結果が算出される(図3)

結果の算出

※ここではExcel2007の操作方法について説明しています。

比率の出し方

比率とは、全体に対する割合です。全体の人数は小文字の「n」で表します。図4は度数と比率を表したものです。表の右肩には「n=」というように全体数を入れます。表は、縦線は入れず、横線も少ない方が見やすいといわれています。

比率の出し方

グラフで度数と比率を表すには、円グラフか横棒または縦棒の比率で示したグラフがよいでしょう。ただし、円グラフはスペースが必要です。字数制限などスペースに制限がある場合は不向きです。

比率で表すとき、人数が少ない場合は注意が必要です。例えば全体数が100人だった場合(n=100)、1人分は1%になります。ところが10人のデータ(n=10)では1人が10%です。もしこの中に特殊な人が含まれていたとしたら、比率にすると正しく全体像を表すことができません。統計は集団を表すものであり、「誤差」を含みます。全体数が非常に少ない場合は、度数だけを示し、比率表示をしない方が無難です。

次は相関係数について解説します。

2項目のデータの関係の強さを相関係数で表す

度数分布や比率、平均値などは、1項目のデータの傾向を示すものです。2項目について関係の強さを表すものに、相関係数があります。
例えば身長と体重のように「身長が高ければ高いほど体重が重くなる傾向がある」といった、一方が増すと他方も増す場合を、正の相関と言います。逆に一方が増すと他方は減るというような場合は、負の相関といいます。

散布図の作り方

2項目の関係を調べるには、まず散布図を作成し相関があるかどうかを概観しましょう。Excelのグラフ機能の「散布図」を使います。散布図をみると、一方が増えれば増えるほど他方も増えることが確認できます。
[1]図1の身長と体重を入力したデータを選択→挿入タブ→散布図ボタンをクリック→(身長と体重が0の軸の散布図ができる)
[2]縦軸を右クリック→軸の書式設定→最小値を40に変更→横軸を右クリック→軸の書式設定→最小値を140に変更→(目盛り線を消したり色を変えたい場合は縦軸を右クリック→目盛り線の書式設定で変更する)

散布図の作り方

※ここではExcel2007の操作方法について説明しています。

次のページでは相関係数について説明します。