更新日:2021/06/14
健康な生活を続けるためには、疾病リスクにできるだけ早く気付き、対策を講じていくことが大事です。NTTは、健康な生活の実現のために、健康診断結果のデータやゲノム情報、大規模なコホート調査で得られたデータなどから機械学習を用いて疾病リスクを予測し、その要因を分析する技術の研究開発に取り組んでいます。本稿では、生活習慣病を対象としたゲノムデータ分析と要介護の要因として注目されているロコモティブシンドローム(ロコモ)を対象としたコホート調査データ分析を紹介します。
千葉 昭宏(ちば あきひろ)†1/麻野間 直樹(あさのま なおき)†1、2
東 正造(あずま しょうぞう)†1/藤野 昭典(ふじの あきのり)†1
青木 俊介(あおき しゅんすけ)†3
NTT物性科学基礎研究所†1
NTT総務部門†2
NTT研究企画部門†3
なるべく病気にかかりたくない、元気な老後を過ごしたいという願いは、多くの人が抱いていると思います。しかしながら、実際には、生活習慣病の1つである糖尿病が強く疑われる人の割合は男性19.7%、女性 10.8%であり(1)、75歳以上で要介護の認定を受けた人の割合は、23.3%で年々その人数は増加している状況です(2)。
生活習慣病や要介護を予防するためには、できるだけ早くそれらのリスクに気付き、対策を考え、実行することが必要です。NTTは、これらのステップそれぞれに対して、ICTを用いて貢献することをめざしています。これまでに、まずリスクに気付くために、診療情報を活用した糖尿病患者の重症化リスク予測(3)や、健康診断結果を活用した生活習慣病の発症リスク予測(4)に取り組んできました。そして、現在、リスクに気付いた人に対して、対策を講じることを支援する技術の研究開発を進めています。
対策を考えるためには、その人固有の性質や過去の病歴、現在の生活習慣などのリスク因子と疾病の関連を知る必要があります。本稿では、その人固有のゲノムデータと生活習慣病との関係性を分析する取り組み、ならびに要介護予防に向けた生活習慣を含むコホート調査*データとロコモとの関係性を分析する取り組みについて紹介します。
まず、ゲノムデータ分析に関する取り組みを紹介します。NTTは、東京大学医科学研究所と2019年7月に「ゲノム予防医学社会連携研究部門」を設置し、ゲノム情報を基にした疾患リスク因子の解明や、疾患予防に向けた望ましい行動や生活習慣を可視化にするための共同研究を開始しました(5)。本共同研究において、遺伝子検査で得られるゲノム情報に加えて、企業従業員の健康診断結果のデータや生活習慣に関する時系列データを、各個人の研究参加の同意に基づき収集、解析を行う(6)データ基盤を整備しています。これにより、ゲノムのような個人が生まれながらに持っている先天的な要因と、健康状態に影響を与える生活環境等の後天的な要因の両面から研究を行うことができるようになります。このような共同研究の枠組みの中において、NTTは健康維持におけるスーパーヒーローの特性分析に取り組むことにしました。
ここでいうスーパーヒーローとは、遺伝子情報上の生活習慣病のリスクが高いが、それを発症せずに健康維持している人のことを指しています。遺伝子検査サービスを提供している NTTライフサイエンスが提唱しているモデルです(図1)。スーパーヒーローをデータから見つけ出すため、まず先行研究ですでに分かっている疾患にかかわる1つ以上のSNP(Single Nucleotide Polymorphism:個人間のDNA塩基配列における1塩基の違い)の情報から、遺伝子的に疾患リスクの高いグループと低いグループを特定します。さらに別の軸として、疾患の発症・未発症の状態でグループを分けます。それらをかけ合わせたグループの間で、データ特性に差分がないかを統計的な手法で分析するというのが大まかなデータ分析の流れです。遺伝子検査結果と健診結果のデータの分析から割り出したスーパーヒーロー特有の身体状況や行動の特性を応用すれば、健康維持の要因の特定や、健康改善のためのアドバイス提供が可能となると考えており、効果的な行動変容や疾病リスク回避につながると目論んでいます。
また、NTTで研究開発した生活習慣病リスク予測技術(4)を応用することにより、遺伝子情報と健診結果の時系列データを用いて、その人の個人の特性に応じた疾患発症のリスク予測や要因分析ができると考えています。生活習慣病リスク予測技術では、打ち切りを考慮したランキング学習により、将来の疾患発症までのリスク(発症確率)の予測を可能とします。このリスク予測のモデルの情報と遺伝子的な疾患リスクの情報を組み合わせることで、さらに詳細な健康維持のための要因分析ができると考えています。
次に要介護予防に関する取り組みを紹介します。要介護予防は、社会医療費の抑制だけでなく、介護する側・される側のQOL(Quality of Life)向上につながるなど、超高齢化社会の日本にとって重要な社会課題です。私たちは、この要介護予防の実現に向けて、これまでに蓄積してきた医療健康データの分析技術、ノウハウを活かして、要介護に至る要因の解明やリスクの定量化に取り組んでいます。データ分析によって要介護予防を実現するために、多くの高齢者のデータと医学的な知見が必要になります。そこでNTTは、2020年4月に東京大学医学部附属病院22世紀医療センターに社会連携講座「ロコモ予防学講座」を設置し、共同研究を開始しました。この共同研究では、コホート調査によって収集された約4400名、約15年間のデータから、要介護に関連する疾患の要因解明や介入方法を検討しています。厚生労働省の調査によると要支援・要介護に至った原因でもっとも割合の多い疾患は認知症です(1)。しかし、骨折・転倒と関節疾患という、運動器や移動機能の低下に関連する疾患をまとめると、その割合は認知症を上回り最大となります。この共同研究においても、まずは運動器や移動機能の低下に着目しています。
運動器や移動機能の低下を表す概念としてロコモがあります。ロコモは、「運動器の障害のために移動機能の低下を来し、進行すると要介護のリスクが高くなる状態」と定義され、要介護予防にとって重要な概念です。ロコモは、ロコモ度と呼ばれる指標でもっとも軽度なロコモ度1からロコモ度3に分類されます(7)。立ち上がりテスト、2ステップテスト、ロコモ25というテストの結果から判定されます(図2)。例えば、高さ40cmの台に座った状態から片足で立ち上がれない場合、ロコモ度1となります。これは、日頃座っている椅子から片足で立ち上がれない場合、移動機能の低下が始まっている状態であることを意味しています。
ロコモは要介護予防にとって重要な概念でありながら、ロコモの認知度は43.8%程度(2020年4月時点)です(8)。特に若い世代は、活動的であり、ロコモのリスクを感じることが少ないことも一因であると考えられます。しかし、若年層のうちから移動機能低下のリスクを把握し、早期の行動変容に取り組むことにより、ロコモのリスクを低下させて、最終的には要介護のリスクを低下させることができると考えられます。そこで、多くの人に簡便にロコモのリスクを把握してもらうために、コホート調査で得られた膨大なデータを分析して、将来のロコモ度を予測するモデルを構築し、研究用アプリに実装しました(図3)。ユーザは、年齢や体重、生活習慣に関するアンケートなど約20の質問にアプリで回答すると、将来3年後にロコモ度1以上になるリスクを予測することができます。
通例のコホート調査では、調査に参加する方から1000を超える分析要素が健康診断やアンケートで収集されています。一般に多くの要素を使って分析したほうが予測精度は高くなります。本研究においても、コホート調査のすべての要素を使えば、予測精度が高くなると考えられます。しかし、アプリの利用者の立場からすれば、なるべく少ない質問に回答するだけでリスク予測結果が分かることが望ましいと考えました。そこで、私たちはアプリの使いやすさを重視し、予測精度を保ちつつ、少ない要素でも予測可能なモデルを構築しました(図4)。
その工夫点として、要素間の相関関係に応じて、必要となる要素を最適化しました。例えば、拡張期血圧と収縮期血圧のように、互いに強く相関する要素が含まれる場合、これらの要素のうち予測対象であるロコモ度との相関が低いほうの要素を削除しました。これにより、ユーザが類似する質問に回答することがなくなり、効率的に予測に必要な情報を入力できるよう改善しました。次に、実際にアプリに入力する要素として、ロコモ度との相関係数の大きな約20個の要素を抽出しました。相関係数を使うことで、抽出された要素の中でどの行動がロコモ度上昇に寄与するのかを把握でき、ロコモ予防のための対策を講じることが可能になります。最後に、深層学習を使ってロコモ度を予測する多層ニューラルネットワークを学習し、予測モデルを構築しました。これによって、少ない要素でも一定の精度での予測が可能となりました。学習済みの予測モデルをアプリに組み込み、PCやスマートフォンで手軽に実行できるため、例えば、健康診断の会場などでもリスク予測を実施可能です。
一連の分析の結果、絞り込まれた要素には運動習慣に関する要素を基本に、痛みに関する質問項目なども含まれます。これまで医学的にあまり重要視されていなかった要素を見出し、本コホート調査データからの分析の価値を確認することができました。今後、アプリの活用による要介護予防のための健康教育の実施や、その効果の検証など、有効性を検証していきたいと考えています。
本稿では、生活習慣病や要介護予防を例に、リスク予測とその要因分析について紹介しました。機械学習や人工知能によって、将来を予想することは、現在の行動を見直すきっかけとなると考えています。そして、その将来を変え得る要因を分析することは、人々の行動変容に役立つと思います。今後、電子カルテデータや、日常生活で計測した血圧などのヘルスケアデータ、ウェアラブルデバイスで計測された生体情報など、さまざまな医療健康に関する情報が収集されるようになると思われます。1つひとつのデータでは、その人の健康の一部しか表現できませんが、それらのデータを連結することで、人を多面的にとらえることが可能になります。その結果、大規模なデータと医学的な知見を融合させて分析することで、体内で起きている複雑な事象をシミュレーションし、デジタル空間に再現できると考えています。今後、リスク予測に関する技術を発展させていき、その人全体のシミュレーションが可能になるバイオデジタルツインの実現に貢献し、体内の未知なる事象の予測や複雑な事象の理解を実現していきたいと思います。
データは、計測し、蓄積した後、分析することによって新たな価値を発揮します。私たちは、これからも医療健康分野のデータ分析を通じて、人々の健康に資する価値を提供できるよう研究開発を続けたいと思います。