Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 980

Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 980
  1. ホーム
  2. 保険医療領域における主な統計方法
  3. ≫複数の説明変数を同時に用いる解析

複数の説明変数を同時に用いる解析

複数の説明変数を同時に用いる解析

解析変数の型に意味はない
表4.1の全体像を理解する上でこれが最後のセクションになるが、複数の説明変数を同時に用いるような解析は、説明変数が二値データだろうが名義データだろうが連続データだろうが、基本的に回帰分析を拡張した手法を用いることができる。

例えば、先のセクションの連続データ回帰分析について、複数の説明変数同時に扱い、それぞれの説明変数を同時に扱い、それぞれの説明変数の回帰係数を推定できるようにした手法は重回帰分析と呼ばれるが、これを用いれば連続データだけでなく、二値データを説明変数として組み込んでも全く問題はないし、二値データえ問題がないのであれば、ダミー変数化した順序データや名義データを用いることも同様に問題はない。
そもそも、説明変数が二値で結果変数が連続値の場合には平均値の差とt検定のp値を用いる、と記述したが、実はこの状況で回帰分析を行っても、ある程度データの数さえあれば、まったく同じ結果が得られる。
下記の図4.1t検定の場合と図4.2回帰分析の場合を解説しよう。
図4.1t検定

図4.2回帰分析

この図は両方とも、治療薬Aと治療薬Bを行った場合で結果変数となる何らかの臨床検査値に差があるかどうかを見た場合の図となっているが、t検定の方で検定の対象としている平均値の差と、回帰分析において「真ん中」すなわち両群の平均値を通る直線の傾きがまったく等しくなっている。傾きとは説明変数がx増加した時のyの平均的な増加分なので、二値の説明変数が0から1に増えた時の平均的な結果変数の増加が傾きとなるのは当然である。
同様に、説明変数が二値データや順序データなどで結果変数が二値データである場合に、普通に表を書いてオッズ比を推定してx2乗検定を行った場合と、ロジスティック回帰によって推定したオッズ比の推定と検定を行った場合についても、まったく結果が変わらない。
ロジスティック回帰については重回帰のように説明変数が増えたからといって特別呼び名が変わることはないが、複数の説明変数を扱えるように拡張されているので結果変数が二値あるいは二値に変換したものであれば、どんな説明変数の型であってもロジスティック回帰に含めて構わない。
表4.1に載せた相関係数以外の手法は、説明変数の型によって使い分けたはずなのに、実はまったく同じであった。この考え方に則ってすべての手法をまとめて「一般化線形モデル」と呼ばれている。
保険医療の領域で行われる何らかの変数間の関連性を見る統計手法のほとんどはこの一般化線形モデルの枠組みの中で説明できるため、手法の整理の仕方が可能になった。

その他の色々な回帰

ここまで解説した手法を理解すれば、説明変数と結果変数の関連を見るようなものである限り、問題はない。
例えば、「共分散分析」とか「多変量分散分析」とかいう手法について解説をしなかったが、これも一般化線形モデルの枠内で説明できる。
近いうちに「共分散分析」と「多変量分散分析」も解説していく予定。
基本はP値を見て、「何と何が関連しているのか・していないのか」を理解すれば良い。この世の中にはまだまだたくさんの○○○回帰という名前の手法がある。比較的有名な回帰では、ボアソン回帰やプロビット回帰というのがある。これらも普通の回帰分析をロジスティック回帰分析に拡張した時のように、直線的な関係性が当てはまりにくい場合はに異なる関係性に当てはめるよう拡張したものである。
ボアソン回帰やプロビット回帰は一般的な保険医療分野の研究では見られることが少ないが、出てきたとしてもかいき3に該当する関連性を示す指標の値と信頼区間、そしてP値に着目し、論文の文中の結果に関する記述を丁寧に読めば、読み解くことは難しくないはずだ。逆に保険医療分野でこのセクションで取り上げなかったがよく見かける手法にコックス回帰がある。
これは一般化線形モデルの枠組みで説明するには高度な手法である。使い方は死亡したかどうかや、疾患を発症したりといった特殊なイベントが起こったかどうかという二値で表される結果をただ割合の形で解析するのではなく、「起こる時間」についても考慮する手法である。
コックス回帰の背景にある数理的な説明をしようとすると、多くの統計の専門家にとって骨が折れる作業であるが読み解く上で着目しなければならないことはハザード比の推定値と、その信頼区間とP値である。ハザードというのは、死亡率や発症率などの「一定の期間あたりでイベントが起こる度合い」のことであり、その比であるハザード比に対しては、たとえばオッズ比などと同じように、「ハザード比にして○○倍死亡率が高い」という解釈を行う。
何度も同じことを言うかも知れないが、結局統計学は多数のデータをわかりやすく解説(記述)することと、変数間の関連性の強さとその信憑性について記述することである。

スポンサーリンク

この記事が参考になりましたら、シェアをお願いします。


Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 984

Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 984