日本的医学の課題にEBMは迫れるか?
EBMジャーナル Vol.8 No.4 pp.102-107, 2007, 中山書店 への投稿
柳 元和
Motokazu YANAGI
帝塚山大学 現代生活学部 食物栄養学科
分析と総合.それは科学の基本的論理である.しかし筆者の長い,ながーい学歴の中でも,ついに総合の科学を教わることは無かったように思う.これは大変不幸なことで,科学,いや医学といえば生命体を切り刻んで分析するというイメージしか湧いてこない.医学界は還元主義花盛りである.だから立派な医学者になろうと思うなら試験管を振らなければならない.筆者のように試験管を振ることの無かった落ちこぼれは,いつも肩身の狭い思いをすることになる.
以下は,その落ちこぼれによる,総合の科学についての語りである.この語りがEBMの役に立つかどうかは知らないが,日本の医学が抱えている深刻な問題を知る手助けにはなるだろう.
現実世界の不確実性
不確定性原理をご存知の方は多いだろう.量子力学における基礎的原理で,原子や電子などの世界では,一つの粒子について,時間とエネルギーのように互いに関係ある物理量を同時に正確に決めることは不可能であるというものである(『大辞泉』小学館参照).筆者がこの原理を初めて学んだ時,大変混乱した.それまでの物理学の学習からは,世界が精密時計のように動いていて,数学的に確実な予測ができるようなイメージを抱いていたからである.原子は実在するのかしないのか?などという奇妙な観念に囚われたことを思い出す.しかし測定尺度の相対性に気づけば,これはごく当たり前の話である.たとえば筆者が明日12:00どこにいるかを1 cmの誤差もなしに予測することは不可能である.だからと言って筆者の存在自体が疑われることはない.明日も奈良近辺に存在する確率は50%以上であり,交通事故死の可能性を考慮に入れても,日本のどこかにいる確率は100%近いからである.ことほど全ての存在は確率的にしか捉えることができない.また実用上もそれで十分で,日常でも無意識的に利用されている.
筆者が初めて統計学的手法の意義を理解したのは,大学生時代に薬の評価方法を学んだ時だった.高橋晄正先生らの書かれた本1)を読んで勉強したものである.
「いわば個人的なばらつきは,薬の働きを評価し,よいものを選び出す過程に,いま一つの不確実性を加えます.現在のところ,このような不確実性を合理的に処理をするには,近代統計学の知恵を借りるほかはありません.」
結論から言うと,総合の科学には統計学が必要不可欠である.そして今思うと,この統計学との出会いが筆者の人生を決めて(狂わせて?)しまったようである.
分析的医学の推奨?
では日本の医学の中で統計学はどのように扱われてきたのであろうか.じつは分析の道具の一つとしてしか扱われて来なかった.それは日本の医学を代表する人の声2)を聞けば分かる.
「…生体のメカニズムを解明する医学は『純系を求める医学』ということができよう.…薬物など治療法の有効性を集団で検証するためには,プラゼボを対照とした無作為割付法が広く用いられるが,…特定因子を抽出するための『純系の医学』と看做すことができよう.」
ここではrandomized controlled trial(ランダム化比較試験:RCT)が「純系の医学」としか紹介されていない.つまりRCTは分析のための道具であって,有効性を総合的に評価する方法ではないのである.堀氏は続く「個の医療」でも遺伝子解析,つまり分析について展開しておられるのみで,総合の医学をどのように構築すべきか語っておられない.要するに現実世界(人間)での有効性をいかにして確かめるのか,有効性をさらに高めていく方法論は,という観点は述べられていないのである.
このような雰囲気は日本の学術界全体を覆っているように思われる.学問の世界では分析に分析を重ねて,自由に思弁的世界を構成すれば良いという雰囲気である.つまり思弁的世界(公理系)の無矛盾性さえ追及すれば良いのである.しかし,公理系は,その中で定式化された論証方法を用いるだけでは無矛盾性が証明できないことが証明されている3)(ゲーデルの不完全性定理.形式的整合性があるだけでは証明にならないことを証明した).言い換えるとコンピュータ・プログラムの正しさを証明するプログラムを開発することは不可能である,とも言える.プログラムの正しさは,その計算結果を現実世界と照らし合わせて矛盾がないときに,初めて確認できるものなのである.
中国伝統医学批判?
このような分析一辺倒の学問がはびこる背景には,西洋医学と東洋医学という安易な2元論的理解が存在する.「分析は西洋医学で,総合は東洋医学で」ということである.しかし東洋医学の代表として中国伝統医学が語られる時,その科学的方法論の欠如は深刻なものである.高橋先生によれば,中国伝統医学の本質を整理すると4),
「@粗大な解剖知見はあるものの,実質科学としての精密解剖学,生理学,病理学はなく,…C治療効果の評価は,自然治癒・心理効果・悪化例の脱落をとくに分離しない状況のもとで,術者の主観によっておこなう D治療中に起こった好ましくない症状の発現は,病気の回復過程の一環として発生した瞑眩(めんけん)であり,それを通り越して回復に向かうものであると理解してきた と要約することができる.」そして「結局,古代中国人が天人相関説に沿って人体内に投影した臓腑経絡システムや五行論システムをシミュレーションという現代用語で美化」しているだけで,科学的根拠はないと断じておられる.
筆者は,大学を卒業するまで,このような中国伝統医学を礼賛する態度を対岸の火事のように受け止めていた.ところが卒業後,高槻赤十字病院(当時)の林敬次先生に誘われて日本の臨床研究,特に治験を批判的に検討する機会を得,その非科学的方法論に愕然とすることになる.
高橋先生は漢方薬批判で次のように語っておられる5).
「科学的な薬効試験を設計するにあたって,どんな観察(症状,所見)や検査を行うべきだろうか.第一の条件は,それが薬の効果をよく反映することであり,第二の条件はそれが何回やっても誰がやっても同じ結果が得られる(客観性)ということである.…ところが,我が国では右のような(1)個別項目の評価法のほかに,(2)総合評価という評価法が用いられている.…症状・所見・検査データのどこに有効であるか(ターゲット),が全く”実証”されていない.」
高橋先生は中国伝統医学の批判を展開されるに当り上記のような分析をされたのだが,実はこれが「日本の西洋医学」にも当てはまることを示されたのが林先生である.筆者は卒業後間もないころ「そんなはずがない」と,にわかには信じがたく,林先生と大論争をした記憶がある.しかし日本の論文を読めば読むほど,中国伝統医学を批判された高橋先生の言葉がそのまま当てはまるような,非科学的な記述がされていたのである.
信頼性と妥当性の検討なし?
治験論文では,従来,治療効果の評価は,3つの項目で行われて来た.全般改善度,安全度,有用度である.これは漢方薬の評価方法と全く同じである.全般改善度は,脱落をとくに分離しない状況のもとで術者の主観によって評価されていたから,中国伝統医学と全く同じ方法である.安全度は,治療中に起こった好ましくない症状の発現が治療法と関係するかどうか術者の主観によって決められていたから,これも同じ方法と言える.ましてや有用度は,全般改善度と安全度を「総合」して術者が主観的に決めるのだから,それが臨床的に何を意味するのか全く不明である.これではこれら評価尺度の妥当性を検討することができない.
次に信頼性の問題であるが,筆者の悲惨な経験談を示そう.日本で販売されている脳循環代謝改善薬の治験論文の中から,被験薬と対照薬のペアが同じものを選び出し,各観察項目の改善度による評価の一致率を検討した6) .賢明な読者諸氏は,一致率がどれくらいであったと予想されるだろうか.60%?いやいや50%を切るくらいか….実は観察項目が1項目でも一致している例は皆無であり,一致率は0%であったのだ.脳循環代謝改善薬は,このような信頼性0%の尺度を用いて開発・認可・販売され,数千億円の医療費が無駄に使われてしまったのである.
エビデンスのレベル?
筆者が「正しい治療と薬の情報」誌編集長,別府宏圀先生の紹介でオックスフォードにコクラン・システマティック・レビューの勉強をしに行ったのは,そんな日本の臨床試験に嫌気が差している時だった.コクラン共同計画の全てのRCTを集めて治療の有効性を確認し,有効な治療は全ての人に無条件で提供されるべきだという考え方は心躍るものだった.何より筆者の訪れた老年医学教室のSir John Grimley Evans教授は優れた臨床家でありながら公衆衛生にも造詣の深い方で「英国でフォートランのプログラムを組んで脳卒中の分析を初めてしたのは私だよ.」という話を聞いて大変勇気づけられた.医学関係の教室には,それぞれ生物統計を扱う専門家が配置されていると聞いて,これまた仰天したの覚えている.どうも日本とは様子が違いすぎる.当時,筆者はEBMという言葉を良く知らなかったが,教室で「エビデンス」という言葉は日常的に使われていたし,医療情報のエビデンスを評価することは,科学の一分野として認められつつあると強く感じた.
帰国してから筆者が非常に奇異に感じたのは,エビデンスのレベルの話が一人歩きしていることだった.エビデンスのレベルが高いとレッテルを貼られた治療法は優れているという宣伝の仕方は,本当にEBMなのかということである.一方でEBMは料理本医療じゃないのかという批判も聞いた.このような一面的な理解は,エビデンスの持つ意味を活用することを教えないことから来ると思われる.もっと言うと有害だ.いや料理本を作っている人にも失礼である.こんなたわ言は自分で料理を作ったことがない人が言っているに違いない.我々は料理を作るときにレシピを参考にするけれども,素材や季節,体調に応じて微妙な「さじ加減」をしている.だからレシピを使って料理を作る人たちをけなしたりしない.レシピだけでおいしい料理はできないことを皆が知っているからだ.
医療だって同じだ.教科書に書いてあることは平均値や最大公約数である.そこに個人差や地域差,季節などのバリエーションを加味して治療をするために医師は長い間の研鑽を積む.バリエーションを知ることも含めてEBMは研鑽の方法に科学の光を当ててくれたと思う.臨床研修医の最初の仕事はケースレポートの作成であることが多いが,それこそエビデンスの集積という医学の一大事業への輝かしいエントリー宣言である.ところが日本では「ケース・レポートなんてエビデンスのレベルが低い」と真顔で言うから驚きだ.一体全体ケースレポートを抜きにして医学の発展が考えられるだろうか.自分が診た患者の情報が,疾患群ジグソーパズルでどの1ピースとなるのかを知ろうとしない者に,EBMが理解できるとは筆者にはとうてい思えない.
「失敗学」の立ち遅れ
エビデンスを集積していく上で,バリエーションの情報をいかに扱うかは質的研究で盛んに議論されている.しかし従来からある症例報告にも質的研究の要素は多分に含まれている.その典型例が副作用報告である.一つの副作用報告がメカニズムの解明につながった例は枚挙に暇がない.それに加えて文献の系統的レビューやメタ分析も,「症例研究」の一つと考えようという意見さえある7).似通ったものを系統的に集めて評価するという点では,ケースシリーズ研究もメタ分析も同じというわけである.
また最近では「失敗学」が注目を集めている8).「失敗を入り口にして,『ここにはこんな危険がある』ということを知らせ,どうすればその危険を防げるかについては,各自に考えさせる」そうすれば「もしも予期せぬことが起きたとしても,『どうしてこんなことが起きたのか』を冷静に考え,対処することができる」というのである.
このような学問は症例の系統的集積なしには実現しない.その意味でケースの持つエビデンスを過小評価することは「失敗学」の発展をも大きく妨げるものである.たとえば,本稿執筆直前にタミフル服用による小児の異常行動がマスコミで大問題となった.米国FDAではいち早く警告を発したのに,厚生労働省は警告をすぐには発しなかった.これがケース分析に対する彼我の認識の差である.筆者が想像するに,「総合は東洋医学」の二元論的体質は官僚組織にも深く浸透しているようである.日本でもエビデンスに基づく医療政策が実施されることを強く期待する。
最後に中国の現代医学について.筆者は,ある中国人医師と会話したとき「日本の医学の優先順位は特殊で,我々には理解しがたい.」と言われ,落ち込んだ記憶がある.彼らは英語で医学教育を受けており,教科書は全て英語,ディスカッションも英語とのことである.直接世界的レベルの医学研究に触れているのだ.というわけで,将来「西洋医学を勉強しに中国へ行ってきます.」などという形容矛盾的事態が起こらないことを,筆者は切に願っている.
文献
- 高橋晄正,佐久間昭,平沢正夫 編.保健薬を診断する:効かない薬・危険な薬.三一書房:1968. p.28.
- 堀正二.純系の医学と個の医療.日本内科学会雑誌 2007;96(suppl):37-40.
- 足立恒雄.ブルーバックス 無限のパラドックス.講談社:2000. p.238.
- 高橋晄正.漢方薬は効かない.KKベストセラーズ:1993. p.251, p.288.
- 高橋晄正.漢方薬は危ない.経済界:1992. p.84.
- 柳元和,梅田忠斉.脳循環・代謝改善薬の治験における「改善度」を用いた評価の問題点−信頼性の欠如に関する文献的検討−.臨床薬理.1996;27:313-4.
- Jenicek M. 西 信雄,川村 孝訳.EBM時代の症例報告.医学書院:2002. p.55.
- 畑村洋太郎.だから失敗は起こる.NHK知るを楽しむ この人この世界 2006;2(9):8-12.
ホームページに戻る