第40回医療情報学連合大会受賞報告

投稿者: 中村優太 / 投稿日: 2021年05月18日
大学院生の中村優太先生が、第40回医療情報学連合大会で研究奨励賞を受賞しました。東大放射線科には多くのAI研究者がいますが、中村先生は自然言語処理を主な研究領域としている点で異色の存在です。自動翻訳、自動読み上げなど、ここ数年の進歩が目覚ましい自然言語処理領域ですが、中村先生の「診療記録で事前学習した汎用言語モデルからの個人情報流出リスクの定量的評価」もとても興味深い研究です。

(リード文・編集:前田恵理子)

中村優太先生

中村先生の年次

医師として7年目、入局後3年目、大学院3年目

受賞演題

診療記録で事前学習した汎用言語モデルからの個人情報流出リスクの定量的評価

中村 優太(1,4),花岡 昇平(1,2),野村 行弘(3),林 直人(3),阿部 修(1,2),矢田 竣太郎(4),若宮 翔子(4),荒牧 英治(4)

(1) 東京大学大学院医学系研究科 生体物理医学専攻 (2) 東京大学医学部附属病院 放射線科 (3) 東京大学医学部放射線医学教室 コンピュータ画像診断学/予防医学講座 (4) 奈良先端科学技術大学院大学

日本医療情報学会とは?

日本医療情報学会は医療情報を扱う1983年設立の学会であり、国際医療情報学連盟 (IMIA) に加盟する学会としては日本唯一です。主な学術大会は秋の医療情報学連合大会・春の日本医療情報学会シンポジウムの年2回開催されます。標準規格、医薬品コード、病院情報システム、遠隔診療、IoT、人工知能などの幅広い演題が特色で、医療従事者のみならず工学系の学術機関や企業からの発表者も多く集まります。

研究内容紹介

「ことばのAIに電子カルテを学習させたら,そこから個人情報が漏洩してしまうか?」という研究です.昨年度,奈良先端大への国内留学の機会をいただいた際に取り組み始めたテーマです。自然言語処理はここ数年間で急激に進化しており、退院サマリーからの再入院予測や電子カルテに対する病名認識などが可能となってきています。特に英語や日本語などでは、匿名化済みの大量の電子カルテで学習させた言語モデルが研究者によって一般公開され、高性能な言語モデルを安全に使える仕組みが確立しました。しかしそれで万事安心ではなく、外部に公開しないつもりで個人情報が入ったままの電子カルテで学習させていた言語モデルがもし誤って流出したら、やはり個人情報が悪意ある第三者に引き出されてしまうかもしれません。そこで本研究では、ダミー個人情報を埋め込んだ英語電子カルテを用いて個人情報流出の状況を再現し、実際に個人情報がどの程度推測可能であるかの定量的評価を試みました。ただし、言語モデルから個人情報を引き出す手法は無数に考えられるため、本研究単体でリスクに関する結論を出すのではなく、今後包括的な評価がしやすくなるような枠組みを提案することに重点を置きました。

ひとこと

これまで論文のrejectや国際会議への不採択などの苦難が続いていましたが、先生方のご指導や温かなご支援のもと、1つの成果を残すことができました。心より感謝申し上げます。