Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 980

Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 980
  1. ホーム
  2. 医療統計学
  3. ≫観察と介入研究

観察と介入研究

観察と介入研究

ランダム化比較試験

事実を観察するだけで手を出さない研究を観察研究、研究者が治療や投薬などの手を加える研究を介入研究という。観察研究は現実の描写・データの記述・仮説の提唱には適しているが、仮説の実証はできない。
一方、介入研究は研究者が治療法を割り付けるコホート研究で、仮説の立証に適している。

介入研究では、バイアスを最小限に抑えることが重要だ。
A学者の納豆研究では、C町の住民をランダム(クジ引き式)に納豆をを毎日摂取群と非摂取群の2群に分け、発症率を追跡していくコホート研究が最も客観性が高いデザインといえる。
このような試験をランダムか比較試験という。

ランダムに分けることで、両群の年齢・性別・生活習慣などが均等に分かれるため、バイアスが減り妥当性が高くなる。その結果、より緻密な結論を出すことができる。さらに、どちらが介入群でどちらが比較対照群か、研究者にも被験者にも分からないようにする(盲検化)と、一層妥当性が高まる。

クロスオーバー試験

例として「チョコレートは記憶力が向上する」という仮説を検証してみる。
被験者(10人を対象)にチョコレートとキャンディーを摂取してもらい、摂取前後で記憶力テストの正答率が変化するかどうかで効果を判定するということをやってみる。
研究としてはランダム化比較試験(クジ引き式に2群に割り付ける)が理想だが少人数では均等化は難しい。
そこで10人全員に、チョコレートとキャンディーを両方摂取させるとどうか。10人全員が両方を摂取するので、当然2群の特徴も均等になる。
しかし、ここで次の問題が出てくる。それは、摂取する順番で結果が左右される可能性があるということである。
どうしても2ラウンド目は記憶力テストに慣れてきているので、チョコレート関係なく成績が上がる可能性がある。それとチョコレートの影響が2ランウド目ににも及ぶ可能性もある。

そこで10人をx→y順番チームとy→x順番チームにランダムに分けることにより、慣れによるバイアスを均等化できる。この方法をクロスオーバー試験といい、テストの内容を知らせないでやることを(盲検化)といい、暗示効果を消すことが可能になり、一層バイアスが減ることになる。

大規模研究はエビデンスレベルが高い?

数千人を対象にした大規模研究には、一般に次のような特徴がある。

①対象層のバイアスが減り、結果の普遍性・汎用性が高まる。
数千人以上が対象であれば、同じ疾患の患者であっても文字通り千差万別のプロフィールになるので、対象層のバイアスが減り、結果の普遍性・汎用性が高まる。その結果、実際の臨床現場での適応性向上にもつながるため、「使える」エビデンスになる。

しかし高まるのは「外的」妥当性であり、エビデンスレベル・質(内的妥当性)も高まるとは限らない。エビデンスレベルは研究法におけるバイアスに左右されるので、研究の質は自分で鑑識しなければいけない。

②偏差を検出しやすくなる(有意差が出やすくなる)
研究結果の偶然性による誤差(信頼区間)は標本数が多いほど小さくなるため、結果検出力が高まりわずかな差異でも有意差が出やすくなる。
しかし、有意とは「統計学的に確実である」という意味であり、有意差があるからといって必ずしも臨床的意義があるとは限らない。
そもそも臨床研究の標本数は確実な差異を検出するために必要な数として算出されているわけなので、見方を変えれば、数千人以上集めなければならない場合は治療効果がわずかしかない可能性もある。論文では印象を高めるために僅差をグラフで誇張する針小棒大のことが多いので、自分で真実を見抜いて惑わされないようにすることが大事だ。

統計学的に有意差を認めても、臨床的に意義があるかは別問題。僅差であれば一般には臨床的意義が薄れるが、疾患や患者の意向によって異なる。
致死率100%の疾患に対する治療薬であれば、たとえリスク差がわずかであっても、臨床的意義は大きい。一方、重篤性がないような疾患であれば、無治療という患者選択も尊重すべきである。数値は臨床の枠組みの中で初めて意味を持つ。実際のデータをもとに個々の患者と協働判断し、唯我独尊とならないように気をつけることが重要である。

有意差なし=非劣性?

優越性試験

治療群と対照群(プラセボや無治療や他の薬物)を比較する標準的な臨床研究を、優越性試験という。優越性試験では、「新薬は標準薬より有効性に関して優れている」(リスク比<1.0または絶対リスク差<0)という仮説を立てて研究を組み検証する。ただし、「効果あり」の基準は直感的で人によって違う。一方、「効果がない」(リスク比=1.0または絶対リスク差=0)ことは誰にとっても同じなので、通常の検定法では「効果がない」ことを否定する(二重否定=強い肯定)ことで、優越性を確率的に立証する。

優越性試験では、「優越性がある」という結論が間違っている確率をp値として算出する。このときに、どちらが優性かは分からないため、対等とみなして両側検定(両者に公平な見方)で評価します。評価結果は

P<0.05→有意差あり=優劣あり
P≦0.05→有意差があるとはいえない=判定保留
の2通りです。

非劣勢性試験

非劣勢性試験は、「新薬は標準薬より劣ってはいない」というように、同等以上の有効性(リスク比≦1.0)を立証する方法。すでに有効性が立証されている他剤と新薬の比較をする時やプラセボや無治療が非倫理的な場合に用いる。研究者の本心としては、新薬は古参の薬より優れていると言いたいところだが、新薬は確立したエビデンスが少ないので強いことが言えないため、このような立証法をとる。

非劣性試験では、許容範囲の境界線(ハンディ)を研究開始前に設定し、信頼区間がその線をまたいでいなければ「劣ってはない(同等かそれ以上)」と評価する(「優越している」という判定はない)。「劣ってはない」という結論が間違っている確率をP値として算出しますが、片側検定で評価する。
非劣性試験で気をつけるべき点は、判定境界線の設定法だ。統計学的な基準設定法がガイドラインなどで推奨されているが、その値に臨床的意義や現実性があるとは限らない。重篤な疾患の場合やエンドポイントが死亡であるある場合は、許容境界線を小さくするのが適切である。

優越性試験と非優越性試験の違い

非劣性試験は「同等かそれ以上の有効性」を実証する研究で、優越性試験においてp≧0.05であるという意味ではない。
一方、優越性試験では優劣を判定することができるが、非劣性(同等または優越)や同等性を立証することはできない。p≧0.05というだけでは、差がなかった(同等だった)のかサンプル数不足で検出できなかったのか、わからない。
このように、両者の使用目的は最初から違うのだ。

スポンサーリンク

この記事が参考になりましたら、シェアをお願いします。


Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 984

Warning: Use of undefined constant analytics_location - assumed 'analytics_location' (this will throw an Error in a future version of PHP) in /home/iryoutoukei/www/wp/wp-content/themes/msx-02-170929/functions/adminpages.php on line 984