備忘録として臨床研究について学んだことを記します
今回は連続変数とカテゴリー変数の使い分け方を
それぞれの長所と短所に着目して解説致します
.
【復習】連続変数とカテゴリー変数
変数は、その値が切れ目のない値をとるか否かによって分類することが出来ます。
.
● 連続変数(continuous variable):年齢、BMI、気温のように切れ目のない値をとる変数
● カテゴリー変数(categorical variable):FIM、性別、大腿骨近位部骨折の種類のように切れ目のない値では表現できない変数
ちなみにFIMはあたかも連続変数のように扱われますが、
無限の能力の程度が存在するところを、1点=自立度25%未満、2点=自立度25%以上50%未満のように切れ目のない値では表現できていないのでカテゴリー変数に分類されます
.
.
連続変数の長所と短所
● 長所:得られた情報を余すところなく詳細に利用できる、比較のための統計的検出力が高い
● 短所:直感的に情報の持つ臨床的な意味を理解しにくい、要因(E)と結果(O)ともに連続変数を使用する場合は両者の関係が一次方程式で表される(=線形性)ことが前提としなければならない
.
例えば、8名の人のBMIを算出したとします。
結果をそのまま表にすると、一人ひとりがどのような値なのか詳細に分かります。
8名の平均値を算出したりBMIの高い順番に並べようとしたりするならば、このような連続変数は利用しやすいでしょう。
一方で、誰が痩せていて誰が太っているのかは直感的に理解しにくいと思います。
.
カテゴリー変数の長所と短所
● 長所:直感的に情報の持つ意味を理解しやすい、要因(E)と結果(O)との関連が非線形性(U字型や指数関数型)であっても使用できる
● 短所:情報の一部が失われてしまい詳細が分かりにくくなる、比較のための検出力が低くなる
.
先の例と同様に8名の人のBMIを算出した上で、それをBMIの判定基準に従って「痩せ」「普通」「肥満」の3つのカテゴリーに分類したとします。
カテゴリー変数にして表にすると、このように直感的に数値の臨床的な意味を理解しやすくなります。
誰が痩せていて、誰が太っているのか分かりやすくなります。
一方で、一人ひとりの値は読み取れなくなってしまい、痩せている人でもより痩せているのは誰か?太っている人でもより太っているのは誰か?などの更なる詳細な比較はしにくくなります。
.
連続変数とカテゴリー変数の使い分け方
これまでの説明を元に連続変数とカテゴリー変数の使い分け方をまとめると
以下のようになります
.
.
最後に
今後も臨床研究に関して学んだことを記していきたいと思います
.
ありがとうございました!!
コメント