備忘録として臨床研究について学んだことを記します
今回は臨床研究においてカテゴリー変数を用いるときの注意点を解説します
.
変数のカテゴリー化は「悪用」出来てしまう
臨床研究でカテゴリー変数を用いる場合、カテゴリーの仕方は研究者に委ねられています。
.
しめしめ、カットオフ値をココに設定してカテゴリー化すると
都合の良いように統計的な有意差がある結果になるゾ
このように研究者の都合の良いように、恣意的にカテゴリー化することも出来てしまいうるのです。
.
もちろん、研究内容を吟味する側もカテゴリー変数にそのような性質があることは承知しています。
そのため、どのような理由でそのようなカテゴリー化がなされたのかは重大な関心事です。
研究者はカテゴリー変数を用いる際には、どうしてそのようにカテゴリー化がなされたのか、皆が納得するような理由を提示する必要があります。
.
カテゴリー変数の「悪用」と誤解されない対策
この研究の変数のカテゴリーの仕方は、
研究者の都合の良いように設定されたものではないかしら?
.
このような、あらぬ疑いをかけられないためにも、変数をカテゴリー化する際は事前にカットオフ値を決めておくことをお勧めします。
.
それでは代表的なカテゴリー化の仕方を3つ紹介致します
.
パーセンタイルで等分にカテゴリー化する
得られたデータを値が小さい順に並べて、下から25%のところを25パーセンタイル、下から50%のところを50パーセンタイル(=中央値)と言います。
パーセンタイルで等分にカテゴリー化するのは、一般的に用いられる方法の1つです。
.
● 二分位(0~50パーセンタイル・50~100パーセンタイル)に分ける、つまり中央値で分ける
● 三分位(0~33パーセンタイル・33~66パーセンタイル・66~100パーセンタイル)に分ける
● 四分位(0~25パーセンタイル・25~50パーセンタイル・50~75パーセンタイル・75~100パーセンタイル)に分ける
.
この場合、何等分であっても構いません。
ただし、データの分布にあまりに極端な偏りがある場合はあまりお勧めしません。
.
臨床的に意味のあるカットオフ値でカテゴリー化をする
例えばBMIなどであれば
● ~18.5:痩せ
● 18.5~25.0:普通
● 25.0~:肥満
.
このように臨床的に意味のあるカットオフ値が既に定められている場合は、そのカットオフ値によってカテゴリー化することがお勧めです。
このカテゴリー化の仕方は臨床的に理に適っているから
研究者の都合の良いように操作されたものではないネ!
このように研究を吟味する人からも
納得が得られることでしょう
.
先行研究で一般的に用いられているカットオフ値でカテゴリー化する
先行研究で、ある値がカットオフ値として設定されている場合には同じ値を用いてカテゴリー化することも出来ます。
例えば、10m歩行時間であれば
● ~12.5秒(0.8m/s以上):屋外歩行自立
● 12.5秒~25.0秒(0.4~0.8m/s):屋内歩行自立
● 25.0秒~(0.4m/s以下):屋内でも実用的な歩行自立に至らない
.
このように、研究の目的に応じて先行研究の報告を参考にカットオフ値を設定しカテゴリー化するのです。
この方法は先行研究との比較がしやすいという利点もあります♪
.
最後に
今後も臨床研究に関して学んだことを記していきたいと思います
.
ありがとうございました!!
コメント