0910-1810/11/\100/頁/JCOPYいる.つまり,疫学について知ることは,臨床を深化させることでもある.疫学に関する理解がなければ臨床研究もうまくできない.Iデータ解釈上知っておかなければいけないこと全体の法則性を知るには,全体を調べるのがベストである.たとえば,日本で5年ごとに行われている国勢調査は膨大な費用を使ってこの原理を忠実に実行中である.もちろん全数を調査するに越したことはない.が,現実にはまず無理である.そこで,全体(population)を代表したサンプル(sample)を選んで解析を行うのが普通である.疫学において目標母集団(referencepopulation)とは「40歳以上の日本人男女」など各種属性(この場合は年齢と民族)により定義される集団である.しかし,この条件に合う人すべてを調査することは実際不可能であり,「2005年に久山町に住む40歳以上の全住民」というように地理的・時間的条件で調査可能な集団を限定する.この限定された集団を調査対象集団(targetpopulation)とよぶ.さて,調査対象集団を決定したは良いが,現実には不在であったり,調査に協力的でないなど,必ずしも対象者全員を調査できるとは限らない.そこで,調査に実際参加した集団をstudiedpopulationとよび,これがサンプル(=データ)である.はじめに臨床医にとって疫学は,教科書で病名のつぎの項目に出てくる「疾病の数」という理解で終わってしまっていることがほとんどである.公衆衛生という基礎系分野に属した事柄であり,学生時代からどうも馴染みが薄く,魅力を感じる機会も少ないという問題が根本にある.筆者もその最たるものであった.しかし,疫学に対する理解が深まってくると,「疾病の数」は疫学のごくごく一部であり,本当の疫学とはわれわれが医学部で受けた教育内容から受けるイメージとはまったく違う中身の学問であるということがわかる.疫学研究の目的は5つある1).1.疾病の原因を特定し,リスクファクターを見つけ,生じる問題を減らす.2.疾病の頻度を明らかにし,事の重大さを示す.3.疾病の自然経過と予後を研究する.4.予防・診断・治療方法を評価する.5.疾病対策に必要な根拠を提供する.以上の5項目は,そのままわれわれが通常行っている臨床研究の内容と変わらない2).卒前・卒後の医学教育のなかで,われわれはこの5つの目的を達成していく方法について教育を受けたであろうか.現実には,学会発表の段階で各自が初めてこの問題にぶち当たり多くの疑問を抱えたまま,毎回悪戦苦闘して,報告をつくりあげているというのが実情だろう.一方,疫学という学問においては,その方法論がしっかりと系統的に整理されて(11)11*YoshimuneHiratsuka:国立保健医療科学院経営科学部〔別刷請求先〕平塚義宗:〒351-0197和光市南2丁目3-6国立保健医療科学院経営科学部特集●世界の眼科の疫学研究のすべてあたらしい眼科28(1):11.17,2011疫学研究の重要性と必要な知識ImportanceofEpidemiologicalStudiesinJapan,withSomeTechnicalKnowledgeforUnderstandingEpidemiologicalandClinicalResearches平塚義宗*12あたらしい眼科Vol.28,No.1,2011(12)2.交絡(confounding)バイアスは一般によく知られているが,同等に知っておかなければならない問題に交絡(confounding)がある.交絡因子とは,興味の対象ではないが結果に影響を及ぼしている潜在的な因子である.疫学研究ではある要因(予測因子)と結果の関連を推論することが多い.白内障手術における「術前抗菌薬点眼の頻度と眼内炎発症率の関係」について調査するとしよう.本当は術前点眼と眼内炎発症の2者間だけのダイレクトな関係を知りたい.しかし,実際には,術前点眼以外に涙.炎,術前消毒,術中後.破損,糖尿病合併など,術後眼内炎の発生と関係はありそうなのだが,あまり興味の対象にならない要因が他にも多く存在する.このように予測因子(点眼)と結果(眼内炎)の関係の観察に影響を与え,本当の関係とは異なった観察結果をもたらす第3の因子を交絡因子といい,このような関係を交絡という(図1).交絡因子は,表面的に見ている予測因子(点眼)とその結果(眼内炎)の両方に関連している因子であり,かつその中間(前房内濃度←点眼頻度など)ではない因子と定義される.ランダム割り付けを行う実験研究では各群が無作為に分けられるため,あらゆる交絡因子(現在明らかになっていない未知の交絡因子までも)が理論上均等に配分される.したがって,交絡が問題になることは少ない.一方,臨床研究に多い観察研究では交絡の問題は常に意識しておくべき重要な問題である.交絡因子を除去するには研究デザイン段階とデータ解1.バイアス(bias)全数調査ができない代わりに,サンプルは無作為に選ばれるのが理想的である.無作為に抽出されれば,選ばれたサンプルは偏り(バイアス)のない,全体の特徴をそのまま反映したものである可能性が高いからである.差は偶然(chance)の要素だけとなる.偶然はバイアスがなく,偏見がなく,フェアである3).バイアスとは,真の値(目標母集団の平均など)からどの程度系統的に離れるかを示す.選択バイアス(selectionbias)と情報バイアス(informationbias)の大きく2種類に分けられる.選択バイアスとは,サンプル抽出時の問題で実際に調査に参加した人々が目標母集団を代表しないことをいう.調査対象集団の選定や,応答率(responserate),コホート研究(後述)においては参加者の転居・死亡などによる脱落〔打ち切り(censoring)〕などがこの原因となる.臨床研究や健康問題に関する疫学調査では,回答なし(回答拒否,回答できない)は健康状態と関連していることが少なくない.また,コホート研究の場合,追跡不能者がランダムに脱落するのであれば問題ないが,追跡対象のアウトカムと関連のある要因により脱落している可能性があれば,残った解析サンプルは歪んだものとなる.選択バイアスを減らすには,①目標母集団を代表する地理的条件に忠実な調査対象集団の選定,②研究目的に合った取り込み基準と最小限の除外基準の設定,③単純ランダム・系統的・クラスターサンプリングなどの確率サンプリングの選択,④調査内容の事前告知など地域と連携した参加奨励,などを行う必要がある.一方,質問者の先入観,測定・判定の誤差,参加者の思い違いや記憶違いなどによって起こるバイアスが情報バイアスである.現実的な臨床研究でよく行われる症例対照研究(後述)では,過去の状況を調査しなければならないので得られる情報が不確実なこともあり,情報バイアスが問題となる.また,QOL(qualityoflife)測定などで行われるアンケート調査は,測定上の多くの情報バイアス介在の余地がある.情報バイアスを減ずるには,①測定法の標準化,②測定者の技術統一,③測定法の自動化と反復,④盲検化の実施などが勧められる.…………………………………………..DM………………………………..図1交絡(confounding)本当は術前点眼と眼内炎発症の2者間だけの因果関係を知りたい.しかし,実際には,涙.炎,術前消毒など,眼内炎と関係のありそうな要因が存在する.予測因子(点眼)と結果(眼内炎)の関係上,予測因子(点眼)と関連がある(赤矢印)が表には現れていない要因で,かつ結果(眼内炎)に影響を与える(青矢印)ような因子を交絡因子といい,この関係を交絡という.(13)あたらしい眼科Vol.28,No.1,201113あっても,同時に一気にその影響を補正できることにある.しかし,採用するモデルに対する当てはまりや,結果の解釈がわかりにくいという欠点がある.以上のように,全数調査でもなく,無作為抽出でもない現実の疫学研究や臨床研究は多かれ少なかれバイアス(選択バイアス)に曝されている.そこで,重要なことは,われわれが今扱っているサンプルがどのようなサンプルなのかを十分に認識しておくことである.サンプルの質には以下のような序列がある1.確率サンプル(probabilitysample):対象母集団内のすべての人がある確率で皆同等にサンプルとして選ばれている.2.代表サンプル(representativesample):目的母集団を代表したサンプル.3.便宜サンプル(conveniencesample):入手しやすい都合のよいサンプル.4.ケースリポート:たまたま経験した1例から数例のサンプル.つぎに,結果を解釈するうえで理解しておかなければならない考え方が外的妥当性と内的妥当性である(図2).外的妥当性:サンプルの集計結果がどれだけ一般集団にあてはまるか.内的妥当性:データの収集・解析とその解釈はきちんとできているか.たとえば,とても上手な一人の術者による多数症例の析段階に工夫が必要となる.研究デザイン段階では,ランダム割り付け以外に,対象者のもつ交絡因子の数を最小限にし,その範囲外の人は対象に取り込まないようにする方法(限定)と,年齢や性別など属性を一致させ交絡を最小限にする方法(マッチング)がある.術前消毒方法を統一し,涙.炎や糖尿病患者を除外し,術中に後.破損を絶対に起こさないようにするのが限定であり,眼内炎発生頻度に年齢差がある場合には,症例と対照の年齢が一致するよう対象者を設定するのがマッチングである.しかし,マッチングしたデータは特別な解析方法が必要で,通常の統計学的方法を用いることができない.また,マッチングに用いた因子が結果に及ぼす影響を検討することが困難であったり,一方でマッチングに用いた因子が結果と関係がない(交絡因子ではない)場合に,検出力(真実がAであるときにAと判定する確率)を減少させ真の関連をわかりにくくするなど問題もある.データ解析段階では,データ収集後,対象者を交絡因子でサブグループに分割し解析を行う層化(stratification)と,統計学的な補正で交絡を制御する多変量解析がある.涙.炎や糖尿病合併の有無などでいくつかのサブグループに分け,それぞれ解析を行うのが層化である.欠点は層化の数が多すぎると極端にサンプル数が少ないグループができたり,逆に層化の数が少なく層の幅が広すぎると交絡の影響を十分に減ずることができない点である.多変量解析の最大の長所は多くの交絡因子がPopulation(母集団)選ぶある結論内的妥当性(internalvalidity)(研究デザイン・解析・解釈厳密性)外的妥当性(externalvalidity)(普遍性・一般性)推論サンプルサンプルこのサンプルを解析図2内的妥当性と外的妥当性の関係(文献4より改変)14あたらしい眼科Vol.28,No.1,2011(14)って成り立つ.図3に示すような人種,環境,社会文化,行動様式…など日本と他国では多くのことに相違があることは明白である.これら一つひとつの因子が現段階では明らかになっていない未知の交絡因子である可能性もある.故に,外的妥当性が低い.そこで「日本における疫学研究」が重要になってくるわけである.II疫学研究が測定するものでは,疫学研究は何を明らかにしようとしているのだろうか.疫学的に測定されるものは大きく3つに分けられる.頻度,関連性,インパクトである.1.頻度(measuresofdiseasefrequency)頻度とは言うまでもなく「どれくらい多いのか」である.ある時点でその患者が何人いるかが有病割合(率)(prevalence)である.たとえば,緑内障患者が40歳以上の6%いるというのが有病割合である.有病割合研究は対象の集団をある一時期に縦切りにして患者数を調べるので横断研究(cross-sectionalstudies)とよばれる(図4).横断研究のイメージは,ある瞬間のスナップショットである.そこには時間的な前後関係が含まれない.したがって,原因と結果の時間的関係が明確でないという問題がある.たとえば,あるフィットネスクラブ会員100名の横断研究を行ったら65人が肥満であったという結果があったとする.一般人がこの結果だけを聞手術結果報告があったとする.これはわれわれ“普通”の眼科医の手術結果の傾向を代表したものであるといえるだろうか.たくさんの術者による多施設での報告のほうがより一般解に近いだろう,つまり外的妥当性が高いといえるだろう.EBM(evidence-basedmedicine)の最高峰である無作為化対照試験(RCT)注1の外的妥当性はどうか.RCTの場合,参加者の制約は大きく,また,医療親和性が良好な人に偏るのでこれまた外的妥当性は高いとはいえない.ランダムに割り付けることでstudiedpopulationのなかでは質の高い結果が得られたとしても,その結果を試験対象者集団に一般化できるか(除外基準などの問題),そのうえに,そもそもその試験対象者集団を普通の人たち(hospital-basedstudyの問題)の結果として一般化できるかという2段階の壁がある.一方で,実際現実に起こった症例を取り込んで検討していく症例対照研究(後述)のほうは現実を反映しているという意味では外的妥当性は高いといえる.内的妥当性とはデータから導かれる結論がどれだけ正確であるかを示す.データそのものの質・解析・解釈に問題がないかであり,一言でいえば研究デザインと統計学的解析・解釈がしっかりできているかどうかである.その研究(サンプル)が,調査対象集団(targetpopulation)についてどれだけ正確(科学的に厳密に)に調査できているかを示す.RCTの内的妥当性は高いが,症例対照研究ではバイアス,交絡因子などの問題が無視できない.臨床研究の場合,その目的が目標母集団特性の推定よりも,治療効果の有無の確認や比較にあることが多いので,外的妥当性よりも内的妥当性が重視されやすい.注1ランダムと聞いてそこで思考停止してはいけない.注意が必要なのは,ランダム選択なのか,ランダム割り付けなのかを区別すること.両者は違う.RCTのランダムとは,ランダムな選択ではなくて,未知のものまで含めた交絡因子を均等に配分するためにランダムに分ける(割り付ける)ということ.一般化(外的妥当性)を考えたランダム選択ではない.さて,海外では多くの疫学調査が行われ数々の知見が明らかにされているが,その結果をそのまま,日本の一般解と置き換えてよいだろうか.疫学で「疾患がどう成立するか」を考えるときに基本となるのがhost-agentenvironmentモデルである.一般に疾患は,host(人)とagent(病因)とenvironment(環境)の相互関係によ人(Host)生物:細菌,ウイルス,クラミジア,寄生虫…化学:アルコール,たばこ,毒素…肉体的:外傷,火,放射能…栄養:不足,過剰年齢性別仕事人種習慣結婚歴家族背景宗教遺伝的素因既往歴免疫状態病因(Agent)環境(Environment)住居近隣環境混雑水食事温度湿度高度放射能騒音大気汚染図3疾患の要因(15)あたらしい眼科Vol.28,No.1,201115関係であり,微積分の関係である.注2もう少し詳しい説明は次章の「小野浩一:疫学研究に必要な統計学」の「罹患率(incidence)と累積罹患率(cumulativeincidence)」を参照.注3「5年で8%」の1年分を計算する場合には,単純に8%÷5=1.6%としてはいけない.正確には1.(1.0.08)1/5=1.65%である.2.関連性(measuresofassociation)原因(疫学的には「曝露(exposure)」という)と疾患(疫学的には「結果(outcome)」という)の関連の大きさをみるものである.原因がある群とない群との間の疾病発生頻度(罹患率)の比を相対危険度(relativerisk)という.たとえば,たばこを吸う人がAMDになるリスクは2.4倍というのがあるが,これが相対危険度である.曝露が「喫煙」で結果が「AMD発症」である.たばこを吸わない人に比べて吸う人は2.4倍AMDを発症しやすい.さて,コホート研究は理想だが,現実には容易ではない.そこでよく行われるのが,「疾病発生」→「曝露」と昔にさかのぼって検討する症例対照研究(case-controlstudy)である.疾患が今ここですでに発生してしまっている状態から昔にさかのぼって原因はどこにあったのかと後ろ向きに考えるので後ろ向き研究(retrospectivestudy)という.まれな疾患の場合,この方向で検討する以外に方法はない.コホート研究では,疾病くと,このクラブに行くと65%の人が肥満になるという印象をもってしまうかもしれない.このクラブの効果を示すには,その100名を経時的に追って肥満度が改善することを示す必要がある.それを示すのが罹患率(=スリムな人発生率)である.罹患率(incidence)注2というのは「どれぐらい新しく発生するか」である.罹患率を求めるには,発生状況を調べるために集団を追っていく必要があるので手間がかかる.分母に時間の概念が入るので(だから率という)有病割合よりも格が高い.加齢黄斑変性(age-relatedmaculardegeneration:AMD)の罹患率は5年で8%である.これは,50名の患者を5年間追跡するとその間に4名の新しいAMDが発生するということである.1年当たり1人弱である注3.罹患率を調べるには一般に数千人から数万人という数の集団を数年から数十年間にわたって追跡していく必要がある.これをコホート研究といい,疫学研究の中心となる手法である.強力な研究方法である一方で,膨大な時間・労力・費用がかかる.発生頻度の低い疾患を追い続けても待つだけで終わる可能性もある.観察の方向性が「曝露(フィットネス)」→「疾病発生(スリムな人発生率)」であるので前向き研究(prospectivestudy)といわれる(図5).有病割合と罹患率の関係はバケツにたまった水(有病割合)と蛇口から入ってくる水(罹患率)によく譬えられる.この関係は,イメージとして「貯金」と「給料」,「過去の業績」と「これからの業績」といったストックとフローのPrevalence“……….”……….T:……NOWCross-sec..onalstudy……………………図4Prevalence(有病割合)有病割合とは「ある一時期に存在する数(NOW)」.……….“…………….”Cohortstudy…………….T0T1……….Incidence……….NEW図5Incidence(罹患率)罹患率とは「ある特定の期間に新しく発生する数(NEW)」.赤が発生した数=3名/特定の期間.16あたらしい眼科Vol.28,No.1,2011(16)成したときの罹患数減少のインパクトをみてみる.1,000人の集団で考えてみよう.AMDの有病割合は1%なので1,000人に10人である.喫煙者は2倍のリスクなので1,000人に対して2倍の20人発生するとする.禁煙によりAMDの罹患数が減少するとすればその数は1,000人を予防して(20.10)=10人の発生を予防できる.一方,白内障の有病割合を40%とすると1,000人に400人である.同様に喫煙者は2倍のリスクなので800人発生するとする.禁煙による白内障罹患数の減少は1,000人の予防に対して(800.400)=400人である.つまり禁煙の白内障に対するインパクトはAMDの40倍ということになる.ここでは有病割合が威力を発揮しているのがわかる.個人のリスクが同じ2倍でも,同じ対策によって10人救えるのと400人救えるのとでは大きな違いがある.眼科患者に禁煙を勧めることはAMD予防より実は白内障予防に貢献しているのかもしれない(表1).寄与危険度の逆数をNumberNeededtoTreat(NNT)といい,「どれぐらい効率的なのか」の直感的な理解の助けになる.NNTとは「1人の発生を抑制するのに必要な患者の数」である.この値が小さいほどより効率的な対策ということになる.表1の場合,NNTはAMDが{1÷(10/1,000)}=100人,白内障が{1÷(400/1,000)}=2.5人である.つまり,1人のAMD発生を抑えるのに禁煙させる必要のある人の数は100人,1人の白内障発生を抑えるのに必要な数は2.5人という発生頻度(罹患率)を,原因あり・なしの両群で比較し,その比を相対リスクとした.しかし症例対照研究では,今病気があるが,その原因として昔に何があったのかを検討する.つまりリスク測定の元となる罹患率は得ることができない.よって「リスク」ではなくその代わりとして「関連」をみるしかなく,「関連」で代用した発生比率の推定値をオッズ比という.ただし,有病割合の低い疾患ではオッズ比=リスクといってもほぼ差し支えない注4.注4眼内炎ありなし合計術前抗菌薬ありなしacbda+bc+daとcがともに頻度が低いとき(a≪b,c≪d)(目安<5~10%)a/(a+b)≒a/bc/(c+d)≒c/d相対危険度={a/(a+b)}÷{c/(c+d)}≒(a/b)÷(c/d)=ad/bc=オッズ比3.インパクト(measuresofpotentialimpact)有病割合や罹患率,同時に相対危険度やオッズ比などが明らかになったあとには,その問題が世の中に対してどれだけインパクトをもつのかという総合的な評価が必要なる.また,何らかの対策を検討する場合に,その対策のインパクトはどの程度期待できるのかなどの検討も行われる.そこでは個人のリスク以上に集団のリスクを考えなくてはいけない.個人のリスク・集団のリスク喫煙を例に考えてみる.喫煙者は2倍AMDになりやすいという相対危険度は個人のリスクである.一方で,まったく意識されることはないが,喫煙者は2倍白内障(核白内障が多い)になりやすいという報告もある5).これも相対危険度=個人のリスクである.相対危険度はリスクの違いの「比」なので,2群(喫煙者と非喫煙者)における発生頻度が40%と20%でも,10%と5%でも,1%と0.5%でも,いずれの場合にも2倍である.もし禁煙をしたらAMD患者は現実にどれぐらい減るのかということはまったくわからない.そこで考える必要があるのがリスクの「差」,寄与危険度(attributablerisk)である(表1).集団のリスクを考えるうえで,禁煙を奨励し予防を達表1相対危険度と寄与危険度(例:加齢黄斑変性と白内障に対する禁煙)群AMD白内障喫煙者20/1,000800/1,000非喫煙者10/1,000400/1,000相対危険度(relativerisk)22寄与危険度(attributablerisk)10/1,000400/1,000相対危険度(AMD):(20/1,000)÷(10/1,000)=2寄与危険度(AMD):(20/1,000).(10/1,000)=10/1,000予防時に達成される罹患数減少インパクトは?AMD:(20.10)/1,000=1,000人に10人白内障:(800.400)/1,000=1,000人に400人あたらしい眼科Vol.28,No.1,201117ことである.NNTの注意点としてその値だけをみても,元にあるリスクはわからないという点があげられる.寄与危険度が同じ10%であればNNTは同じだが,死亡率を10%からほとんど0%に下げる治療と65%を55%に下げる治療ではインパクトの中身が違ってくる.同様の考え方で,NumberNeededtoScreen(NNS)というものもある.これは,「1人の有害事象(失明など)を抑制するのにスクリーニングしなければならない人の数」であり,スクリーニングの効率性の指標の一つである.III関連と因果関係疫学研究や臨床研究の結果からわかった関連の解釈は単純ではない.そこでは,関連と因果関係の違いについての理解が求められる.関連(association)とは「単に関係がある」ということであり,それがそのまま「原因である」〔因果関係(causalrelation)がある〕とはならない.関連があることは,因果関係があることの必要条件にすぎない.したがって,関連が認められても因果関係の証明までにはまだつぎのステップが残されている.図6は因果関係を証明するときのガイドラインである.結果の前に原因があることは因果関係を考えるうえでの大原則である.横断研究の最大の弱点はここにある.相対危険度やオッズ比は関連の強さを示す.量反応とは,曝露の量や時間が増加するにつれて,関連の強さが増すことをいう.同様の結果が異なった施設や場所から報告されていれば「結果の再現性」が高いということになり,似たような研究が違う「人・場所・時間」を対象として実施されることの意味はここにある.ほかにも,結果が他の知見とも一貫性があるか,基礎研究で明らかになっていることと整合性があるかなど,研究で認められた関連に対して,9項目がどの程度当てはまっているかを考え,最終的にはアナログな判断を下す.おわりに以上のことを理解したうえで以下の充実した各論を読んでいただければ,世界の眼科の疫学研究のすべてがわかります.文献1)GordisL:Epidemiology.4thEdition.Saunders,Philadelphia,USA,20092)川崎良,山下英俊:わかりやすい眼科疫学.あたらしい眼科26:1-2,20093)HarveyDent:TheDarkKnight.WarnerBrothersEntertainmentInc,20084)FletcherRH,FletcherSW:ClinicalEpidemiology.TheEssentials,4thEdition.LippincottWilliams&Wilkins,Philadelphia,USA,20055)ChristenWG,MansonJE,SeddonJMetal:Aprospectivestudyofcigarettesmokingandriskofcataractinmen.JAMA268:989-993,1992(17)………………………………………………………………………………………………………………………….biologicplausibility……………………………………………………(…………………………)……………..LeonGordis:Epidemiology(4th).Saunders9commandmentsofcausalrelationship図6“因果関係あり”のガイドライン関連(単に関係がある)が,因果関係(原因である)にまで格上げされるか否かの判断は,上記の要件をどの程度満たしているかでアナログに判断する.(文献1より)