人工知能を利用した緑内障画像診断ApplicationofArti.cialIntelligenceforGlaucoma─Imaging三木篤也*はじめに人工知能(arti.cialintelligence:AI)(用語解説参照)は近年大きく進歩し,迷惑メールの振り分けからスマートフォンの音声入力,自動車の自動運転に至るまで,社会のさまざまな分野に急速に浸透してきた.今やニュースにおいても日常生活においても,AIが活用された機器やシステムを目にしない日はない.AIの発展は,ビッグデータやIoT(モノのインターネット)などと並んで第四次産業革命ともよばれ,単なるコンピューター技術の進歩にとどまらず,社会構造の大きな変化を起こそうとしている.医療分野もその例外ではなく,診断,治療,教育,医療施設運営や医療従事者の業務補助など,多岐にわたる分野にAIの応用が試みられている.眼科学の分野では,これまでも検眼鏡から始まって細隙灯顕微鏡,レーザー光線,手術用顕微鏡,そして光干渉断層計(opticalcoherencetomogrphy:OCT)など科学技術の発展をいち早く取り入れて進歩してきた.AIの医療応用においても,眼科学は最先端を走っている.最近のAI発展に中心的な役割を果たした深層学習(deeplearning)(用語解説参照)は,従来の機械学習(machinelearning)と比較して画像の解析能力が格段に向上したため,眼科学にとってとくに重要な画像診断との相性がよく,AIの導入による眼画像診断の発展が大いに期待されている.実際に,AI解析により眼底写真から糖尿病網膜症を自動スクリーニングするシステムが,AI診断機器としては世界で初めて米国の食品医薬品局(FoodandDrugAdministration:FDA)の認可を受けたことは記憶に新しい.AI研究,AI医療の対象としては,有病率が高く,画像診断が重要な役割を果たしている疾患が最適であり,眼科疾患では,糖尿病網膜症以外に緑内障や加齢黄斑変性への応用がとくに期待されている.本稿では最初にAIとその医療応用について簡単に解説し,その後AIを利用した緑内障画像診断について,これまでの進歩や今後の見通しを述べる.IAIとはAIという言葉の定義は漠然としており,シーンにより若干異なる意味で用いられていると思われるが(たとえばAI搭載と称する玩具や家電製品は,本項で述べるような高度なAIを搭載しているわけではなく,単に自動で動くという程度の意味しかないものも多い),現在注目されているAIとは,「人間の頭脳活動をシミュレートしたコンピューターにより,なんらかの意思決定を行うシステム」と考えてよいだろう.AI研究の歴史は意外と古く,1950年代から行われている.1980年代には第二次ブームを迎え,医療応用も含めていくつかの産業領域に実際に応用されたことをご記憶の方もいらっしゃるであろう.今回のAIブームは第三次ブームといえるが,その牽引力となっているのがトロント大学のHirton教授らにより開発された深層学習であり,これまではどちらかというと浮世離れしたマニアの研究といった趣のあったAIが,現実に役立つ技術として急速に*AtsuyaMiki:大阪大学大学院医学系研究科眼科学教室・視覚先端医学寄附講座〔別刷請求先〕三木篤也:〒565-0871吹田市山田丘2-2大阪大学大学院医学系研究科眼科学教室0910-1810/20/\100/頁/JCOPY(47)1223重み付け訓練(学習)出力出力(診断)(診断)入力入力(データ)(データ)図2機械学習による訓練入力層隠れ層訓練により,各入力の重みを機械が自動で調整し,出力の図1ニューラルネットワーク精度を高くするよう最適化する.入力層,隠れ層,出力層からなる.==労力が必要であり,多分野に応用するのは労力的に困難な部分があった.しかし,深層学習の場合は機械が自ら特徴量の抽出まで行うので,画像のような膨大で非定型的なデータの学習にも対応できる.とくに画像の学習には,畳み込みニューラルネットワーク(convolutionalCneuralnetwork:CNN)(用語解説参照)という深層学習のアルゴリズムが有用である.技術的な詳細は省くが,畳み込みニューラルネットワークは,網膜,脳における視覚情報処理をモデルにして作られた機械学習モデルなので,画像の処理に適している.このように,深層学習,とくに畳み込みニューラルネットワークは画像診断などの複雑なタスクの学習に優れているが,深層学習で高い精度を得るには,非常に多くのデータを用いて学習することが大前提になる.OCTのノーマティブデータなどはだいたい何百という単位の正常者のデータに基づいていることが多いが,深層学習の場合,通常は万単位のデータを要する.また,それだけの多量の画像データを処理するには,非常に高い性能のコンピューターシステムが必要である(ただし,これは学習するためのコンピューターの問題で,できあがったシステムを搭載するにはそこまでの高い能力は要しない).つまり,深層学習の基礎には,これまでのCinformationtechnology(IT)技術やビッグデータの発展が不可欠ということになる.機械学習は,大きく教師あり学習(用語解説参照)と教師なし学習(用語解説参照)に分けることができる.教師あり学習は,エキスパートによる診断などの正解を機械に与えて学習させるのに対し,教師なし学習では正解を与えずに,データの中にある何らかの規則を機械自らに発見させる手法である.教師なし学習は,これまで人間の眼では見つけられなかった病気の新たな特徴をとらえることができる可能性があるのでとても魅力的だが,臨床的意義が不明なので意義の検証が必要になること,要求されるデータ量が膨大になること,真の疾患の特徴ではなくアーチファクトをとらえているにすぎない可能性が高いことなど課題が多く,現時点で医療応用に近づいているのはほとんどが教師あり学習である.教師あり学習は教師(エキスパートの診断など)を超えることはないので,既存の診断の精度を上げることではなく,エキスパートの仕事を代行あるいは補助することが主目的になることは知っておかねばならない.ここまでの部分をまとめると,昨今のCAIの発展は,機械学習の一分野であるニューラルネットワークの一種である深層学習が中心的な役割を果たしており,画像診断にはその一種である畳み込みニューラルネットワークが有用である.深層学習の発展には,コンピューターの処理能力の向上やビッグデータの構築が,基盤として不可欠である.CIIAIの医療応用AIの医療応用の可能性は多岐に及ぶが,眼科領域でもっとも期待されているのは深層学習を活用した画像診断である.この分野で先行しているのは,眼底写真のAI解析による糖尿病網膜症の自動スクリーニングである.眼底写真のCAI解析により,referable(専門医の受診が必要)な糖尿病網膜症を検出することができることが一流雑誌に報告され,眼科のみならず全医療業界,AI業界に大きなインパクトを与えた1).さらに,眼底写真のCAI解析による糖尿病網膜症スクリーニングシステム(IDx-DR)は,2018年にCAIによる自動画像診断機器として初めて米国CFDAの承認を受け,眼底写真のAI解析が研究レベルではなく,すでに臨床応用可能なレベルに至っていることを示した.画像のCAI解析によるスクリーニングについては,皮膚写真による皮膚癌の診断,心電図解析による不整脈の診断,病理組織の解析による大腸癌や肺癌の診断などが次々と一流雑誌に掲載され,注目されている.これらの自動診断は,これまでより診断の精度を上げるものではなく,AI医療により医師の仕事を代行することを目的としており,発展途上国などの医師が不足している状況でとくに期待される一方で,AIが医師の仕事を奪うのではないかといった議論もよんでいる.また,AIによる診断システムが誤診した場合に誰が責任を取るのかといった社会的問題もあり,日本では今のところCAI医療機器はあくまで医師の補助をするのみという位置づけ(つまり最終的な責任は医師にかかる)だが,それだと医師不足の解消という意義が薄れてしまうので,スクリーニング機器は医師から独立して動くというのが世界的(49)あたらしい眼科Vol.37,No.10,2020C1225な流れになっていると思われる.これはもはやCAIや画像診断のみで解決される問題ではなく,医療システムや社会的な状況に基づいて,これから解決せねばならない課題だといえる.AIの医療応用は画像診断にとどまらない.手術補助,薬剤アドヒアランス監視,在宅での持続的モニタリングなどの医療部門,電子カルテの入力補助や診療報酬管理,病名管理や医師,医療スタッフの労務管理などの管理的な部門,医師や医療スタッフの教育,創薬や臨床研究補助などの研究部門など,多岐にわたる分野でCAIの医療応用が進んでいる.それらのすべてが医療者にとってプラスの効果をよぶものではなく,むしろマイナスに働くものもあるので,専門家以外の医療者もCAIの医療応用について注視していく必要がある.CIIIAIを利用した緑内障画像診断緑内障は眼科領域では有病率が高い疾患の一つであり,わが国における中途失明原因の首位を占める疾患なので,緑内障へのCAIの応用は大いに期待されている.まず糖尿病網膜症と同様に,眼底写真のCAI解析による緑内障診断の研究が行われ,わが国を含めて多くの成果が報告されている2).しかし,眼底写真のCAI解析による緑内障診断は,糖尿病網膜症のスクリーニングのようにすぐに臨床応用可能なレベルには達していない.眼底写真を見て糖尿病網膜症と緑内障を診断する状況を想定していただければ,専門医に紹介しなければいけないレベルの糖尿病網膜症を眼底写真からスクリーニングすることは,それほど困難ではなく,おそらく経験数年の眼科専攻医でもほぼ可能な課題と思われる.しかし,緑内障を眼底写真から診断するには,専門医でなければ高い精度は望めないことは多くの読者が日常感じられていると思うし,研究でも証明されている.OCTを用いた機械学習による緑内障診断も多くのグループから報告されているが,こちらも臨床応用可能なレベルに達しているといえるものはまだ出ていない.このように,眼底写真やCOCTのみからCAI解析により緑内障を自動診断するのは,現在の技術ではまだまだ厳しい状況だが,もう少し別のアプローチでCAIを応用する研究も盛んに行われている.AIによる緑内障の自動診断がうまくいかないのは,教師あり学習の教師データに当たるエキスパートの診断そのものが主観的で個人間のばらつきが大きいこと,エキスパートが緑内障を診断する際には,眼底写真やCOCTのみから診断しているわけではなく,視野や眼圧,全身的な危険因子などを総合して判断していることが大きな理由である(これは,重症糖尿病網膜症がほぼ写真だけで診断できるのと比較すると明らかであろう).これらの問題は,AIの問題というよりは緑内障診断そのものの問題である.そこで,自動診断ではなく,もう少し別のアプローチでCAIを生かす試みも行われている.たとえば,眼底写真のCAI解析により,OCTで測定したCRNFL厚などのパラメータを予測する3),あるいはCOCTのCAI解析から視野を予測する4)などのアプローチがある.こうしたアプローチは,AIの出力(答え)を,緑内障の診断という精度の低いものではなく,もっと定量的なCOCTパラメータや視野感度を出力にすることで精度を上げることをめざしている.このようなアプローチは,緑内障の自動診断より精度を上げることは理論的に可能だが,それ自体で診断できるというものではないので,社会的インパクトには劣る.また,前眼部画像診断の結果から閉塞隅角を予測する研究も行われている5).こちらも比較的高い精度を達成しているが,眼圧上昇や視神経障害などの臨床症状に直結する結果が得られるわけではなく,隅角閉塞が予測できるに過ぎないので,自動診断とよべるものではない.画像診断以外に,視野検査のCAI解析も盛んに行われており,視野異常の自動検出,これまでのクライテリアやインデックスより早く視野異常を検出するアルゴリズム,視野進行を予測するアルゴリズムなどが研究,報告されている.さらに別のアプローチとして,AIを用いて画像診断の精度を高める試みがある.眼底写真の自動診断においても,画像の質が診断精度に大きく影響することが報告されている2).筆者らのグループは,深層学習アルゴリズムによって,OCTの画質を改善する手法を報告した6).また,OCTによるパラメータ計測は,機器間で互換性がないことが大きな課題の一つだが,人工知能による,OCT機器に依存しない網膜層セグメンテーショ1226あたらしい眼科Vol.37,No.10,2020(50)ンも報告されている.こうした技術は,自動診断と比較して社会的な注目は受けにくいが,現在の画像診断の課題を基礎的な部分から一つひとつ解決していくことにより,緑内障画像診断の質の向上につながっていくものと考えられる.緑内障のCAI解析の現状をまとめると,糖尿病網膜症の眼底写真スクリーニングのように,現時点ですぐに臨床応用可能な自動診断はまだ確立されていない.それは,AIの問題というよりは,緑内障の診断そのものの非定量性,主観性の問題なので,一朝一夕に解決されるものではないと考えられる.一方で,眼底写真,OCT,視野検査,前眼部画像診断などから,OCTパラメータや視野感度,隅角閉塞など,緑内障の診断より定量的もしくは客観的な指標を予測するアルゴリズムは,現時点でかなりの精度に達してきている.また,OCTの画質やセグメンテーション能を高めることで,間接的に緑内障診断力を高めるアプローチも現実的に有用である.こと緑内障に関する限り,社会的インパクトの大きい自動診断に飛びつくよりは,もっと地道な努力を積み重ねることが,AIの力を活用して緑内障の診断力を上げていくことにつながるのではないかと考えられる.CIVAI医療の課題これまでの各項目でも触れてきたが,AIの医療応用は,長所だけではなく多くの潜在的短所を含んでいる.まず,深層学習は特徴量の抽出や重みづけに人間のインプットを必要としないので,多量のデータを処理できる長所がある反面,診断のプロセスがブラックボックス化されてしまうことが短所として指摘される.深層学習により見かけ上高い診断精度を得ていたとしても,疾患の真の特徴ではなくアーチファクトをとらえているに過ぎない可能性があり,これを見破ることができないと大きな誤りにつながる可能性がある.たとえば,緑内障と正常対照の眼底写真を元に,AIで緑内障を自動判定するアルゴリズムを作成する場合に,緑内障患者は病院で,正常対照は健診センターで検査を受けているという状況を仮定しよう.この場合,深層学習アルゴリズムが,視神経乳頭陥凹拡大などの真に緑内障に特異的な変化ではなく,病院と健診センターの眼底カメラの違いを元に緑内障を診断している可能性がある.このような可能性を避けるため,深層学習アルゴリズムが画像のどこに着目して判定を行っているかを可視化する手法がある(ヒートマップ)(用語解説参照).AIの医療応用においては,このような手法を用いて解析をなるべく可視化することが,誤りを避けるために必須になるだろう.また,ほとんどの臨床医がCAIの細かい技術に関する知識をもたないので,AIを元にした研究や医療技術を正確に評価できる人材やシステムが不足していることも問題である.最近,C“NewCEnglandCJournalCofCMedi-cine”および“Lancet”に掲載された新型コロナウイルスに対する薬剤の効果を解析した論文が取り下げられたという問題が一般ニュースでも大きく報道された7).これは,電子カルテから自動取得されたビッグデータの解析に基づく研究だが,解析の元になる自動取得データの信頼度が疑われた結果である.コロナウイルスの社会的インパクトの大きさと速報性の重要さから,一流雑誌といえどもビッグデータの信頼度の検証がおろそかになったという教訓になりそうである.また,AIの研究にはビッグデータが不可欠だが,医療ビッグデータは個人情報であり,セキュリティをどのように管理するのかという問題がある.また,電子カルテなどから得られたビッグデータは,収集した時点では想定されなかったような新しい研究に役立つ可能性があるが,データ収集の時点で,被験者または患者にどこまで用途を示さねばならないのかという問題も生じている.純粋に学術的な研究の場合はともかく,AI研究は営利企業にとって有利な成果をもたらすこともあるので,そのような場合にデータの持ち主は誰なのかという法律的,倫理的,経済的な問題が発生する.これらの問題については,今後社会的にルールが整備されて行かねばならないが,医療者も傍観するだけでなく積極的にルール作りに参加することが求められるだろう.おわりに緑内障をはじめとして,AIは医療に急速に浸透してきており,好むと好まざるとにかかわらず,これからの医療はCAIなしには考えられない.われわれ医療者は,一般社会が飛びつきやすい自動診断などのインパクトの(51)あたらしい眼科Vol.37,No.10,2020C1227■用語解説■人工知能(arti.cialintelligence:AI):人間の頭脳活動をシミュレートすることにより,意思決定を行うコンピューターシステム.深層学習(deeplearning):複数(多くの場合多数)の隠れ層を含むニューラルネットワーク.機械学習(machinelearning):与えられた入力から分類,回帰などの課題を果たすために,訓練(training)により,正解を導き出すプロセスをコンピューター自らが最適化(学習)できるようなシステム.ニューラルネットワーク:人間の神経系をシミュレートする機械学習システム.入力層,隠れ層,出力層に分かれる.畳み込みニューラルネットワーク(convolutionalneu-ralnetwork):人間の視覚系をシミュレートしたニューラルネットワーク.局所受容野(画像の一部に着目する)をもち,隠れ層に畳み込み層とプーリング層をもつことが特徴.画像認識にとくに優れている.教師あり学習(supervisedlearning):機械学習において,訓練データにあらかじめ正解(ラベル)を与え,正解を導くためにアルゴリズムを最適化させるようなシステム.教師なし学習(unsupervisedlearning):機械学習において,あらかじめ正解を与えず,アルゴリズム自身でデータに含まれる規則性を学習するようなシステム.ヒートマップ:深層学習,とくに畳み込みニューラルネットワークにおいて,画像中の各部位が出力に及ぼす影響の大きさを,変化の大きさ(gradient)のヒートマップ(変化が大きいほど暖色になる寒暖表示)にして示すもの.深層学習の可視化法.