2011年10月17日月曜日

多変量解析―説明変数の選び方

週刊医学界新聞の最新号第2949号2011年10月17日に、今日から使える医療統計学講座【Lesson6】多変量解析―説明変数の選び方、が掲載されています。

http://www.igaku-shoin.co.jp/paperDetail.do?id=PA02949_04

多変量解析で交絡因子の影響を取り除く重要性は理解していましたが、いかに取り除くかということは知っているようで間違って理解していました。昔は多変量解析の意味さえまったく理解できなかったので、それを思えば進歩はしていますが…。

まず多変量解析で入れることのできる説明変数の数について知りませんでした。以下、引用です。

「ロジスティック回帰では,アウトカムの死亡者,生存者のいずれか少ないほうの数を10で割った数までを説明変数として加えることができます。この研究では,死亡者数69人,生存者数175人でした。ですから,69を10で割った6または7つまで変数を入れることができます。」

以上、引用です。次に長い引用になりますが、多変量解析でいれる交絡因子の選び方についてです。以下の(1)-(6)から1つ選んでくださいと文中にあります。以下、引用です。

(1)それぞれの交絡因子を「せん妄あり」「せん妄なし」の2群間でスチューデントのt検定やピアソンのカイ2乗検定などを用いて比較し,有意差の出たもののみ(またはP値の小さい順に5つ)モデルに加える。
(2)それぞれの交絡因子を「死亡」「生存」の2群間でスチューデントのt検定やピアソンのカイ2乗検定などを用いて比較し,有意差の出たもののみ(またはP値の小さい順に5つ)モデルに加える。
(3)すべての交絡因子をモデルに入れ,ステップワイズ法を用いてコンピューターで自動計算し,有意差の出る交絡因子のみを選択する。
(4)すべての交絡因子をモデルに入れ,有意差の出ない交絡因子をコンピューターによる自動計算ではなく自分でモデルから取り除く。
(5)(1)のように,せん妄との関連を単変量解析で調べた後,有意差の出た交絡因子の中からさらにステップワイズ法で有意差の出る交絡因子を探す。
(6)データを一切見ず,文献や医学的見地を参照し,アウトカムである死亡に対するリスク因子の中からリスクの大きい順に5つ選び出す。

以上、引用です。私は今まで上記のいずれでもなく、単変量解析で有意差の出た項目と年齢、性別をモデルにいれて行っていましたが、正解は(6)だそうです。(1)から(5)の方法では多重検定の問題が出てくるためです。雑誌によっては(1)から(5)の方法を使用しないよう指示している場合もあるそうです。

データを一切見ないでリスクの大きい順に選ぶというのは勇気がいる気がします。でも研究実施前の臨床研究デザインのときにここまで決めておけば、後で苦労することはないという点ではむしろ明確で楽な気もします。でも統計学の専門家と相談することが本当に重要ですね。

今回の医療統計学講座の連載は学ぶことが多いです。興味のある方はLesson1~5も読まれることをお勧めします。

0 件のコメント:

コメントを投稿