Data
G20 Japan Digital
G20 Japan Digital    Data
Language
English /
.,)

山本 龍彦

そのデータは個人のもの?集合のもの?
山本 龍彦
慶應義塾大学法科大学院教授

Article

「データ」には、ふたつの世界があります。
「個人が特定できるデータ」の世界と、「個人が特定できないデータ」の世界です。
そのふたつをきちんと切り分けて考えることが重要です。
「データ・フリー・フロー・ウィズ・トラスト」というコンセプトについて、山本先生はどんな見解をお持ちですか?
私は憲法学者として、プライバシー保護とデータの自由な利活用というふたつの要素を、きちんとしたやり方で両立し、バランスを取らなくてはならないということを常に言ってきた立場です。「データ・フリー・フロー・ウィズ・トラスト」というアイデアも、基本的には両者のバランスをどう考慮するのかという問題意識に基づいたものだという理解でいます。適切なバランスを考えましょうというメッセージは、その通りだと思います。
データをめぐる議論が時に難しいものになってしまいがちなことの理由のひとつは、一概に「データ」と言っても、それが何を指し示しているのかが曖昧なところにあるように思います。
仰る通りですね。データと言ったときに、そこで語られる内容は、実はふたつあります。「これからのAI社会を動かしていくためには、データがもっと必要だ」といったことはよく言われますが、そこで語られる「データ」は、AIに学習をさせるためのものですので、個人に紐づいている必要がないデータです。それは「データアセット」と言い換えていいかと思いますが、そうした「アセットとしてのデータの世界」を、私は「集合界」と呼んでいます。やや専門的な言い方をしますと「特定個人識別性がない世界」です。そこでは、個人を特定できないようにしたデータが、みなの資産・資源として積極的に活用されていくことになります。
なるほど。もうひとつはなんでしょうか?
もうひとつは、個人を特定することができる「個人情報」の世界です。これを私は「個人界」と呼んでいます。データの扱い方を考える上で、まず、このふたつを切り分ける必要があるのではないかと思います。なぜかというと、「個人界」と「集合界」とではデータの扱い方の原則が異なるからです。「個人界」においては、個人が自分のデータの使い方を自己決定できるという「本人関与」が原則ですから、本人の意思が最優先されます。「個人起点」の世界です。一方の「集合界」は、本人の意思確認がなくてもデータを自由にやり取りすることができる世界ですが、この世界においては、個人を特定できないようにあらゆるデータが「加工=ロンダリング」され、個人が再識別されないのが原則です。
山本 龍彦
先生のおっしゃる「集合界」では、具体的に、データはどんなやり方で流通することになるのでしょうか。
日本の例ですが、医療情報についてお話ししますと、2018年に「次世代医療基盤法」という法律が制定されました。これは「集合界」における医療データのやり取りを想定したもので、「匿名加工された医療情報」を対象とした法律です。政府から認定された匿名加工を行う事業者が、病院などから広く患者の医療情報を集め、特定個人識別性を洗い流し、つまり匿名加工=ロンダリングして、研究機関や製薬会社や行政、または企業などに提供する、という流れになります。
データを加工する事業者に、個人情報がどんどん蓄積されていくわけですね。
この法律には、重要なポイントがふたつあるかと思います。病院は、これまでの法制度のもとでは、患者のセンシティブな医療情報を本人の同意なく第三者に提供するのが難しい状況でした。ただ、それでは「データ・フリー・フロー」が実現しませんから、そのデータを外に出せるようにする必要があります。新しい法律は、そのデータを自由に動かせるようにしたというのが、ひとつめのポイントです。
なるほど。
ふたつめは、データの「フリー・フロー」を可能にするのと同時に、もう一方で、データを集めて匿名加工を行う事業者に非常に厳格なデータの安全管理措置を求めたことです。法律を見てみますと、この事業者は、患者本人の同意があっても、匿名加工していない医療情報を第三者に提供することはできないことになっています。この事業者は、半ば公的な役割を担っていると言えますので、事業者としての認定にあたっても、複数の主務大臣が個人情報保護委員会との協議を経てから承認を行うなど、高いハードルが課されています。データの自由な流通に対する「トラスト=信頼性」を、こうしたやり方で担保しようとしているのです。ただ、医療情報についてひとつ大きな問題になっているのは、ゲノムデータの取扱いについてです。ゲノムデータは、それ自体が個人識別性を持っており、匿名化になじみませんから、ゲノムデータの「フリー・フロー」には別の制度が必要になるかもしれません。
「データ・フリー・フロー」や「データ・ポータビリティ」の実現は、人のフィジカルな移動を加速させていきます。
「集合界」と「個人界」とでは、当然データの利活用の方法も変わってくるわけですね。
「集合界」におけるデータは、基本的には匿名のデータですから、個人の利益に還元されることはありません。ですから、医療データについて言えば、主に公衆衛生や医学や薬学の発展を通して、社会に利益が還元されることが想定されています。一方、「個人界」では、自分のデータを使って、自分自身がより健康になったり、より精密な診察や薬の処方を受けられることを目的として利用されていくことになります。ただ、このふたつは完全に切り離してしまうことはできませんし、「集合界」のデータと「個人界」のデータを結合させていくことで、より高度なサービスを行うことも可能になります。医療データは保険制度にも関わるものでもありますので、行政的な観点から見れば、完全に切り分けることも難しいでしょう。
どういうことでしょう。
国民の健康を保つことは、社会保障費をむやみに増大させないためにも重要だと考えれば、たとえば政府が市民の健康状態をモニタリングできることには、大きな意義があります。SF的な発想をすれば、そのデータを使って国民の健康状態をスコアリングし、そのスコアに基づいて保険料を算出するといったことも技術的には可能です。保険料の額をインセンティブとして、できるだけ国民が健康になるように仕向けていくというような仕組みですね。
社会の福祉のために、みんなで自分のデータを提供する、みたいなイメージでしょうか。
はい。もちろん、みなさんが病気にならずに健康でいられるのは素晴らしいことなのですが、一方で、それをあまりに無邪気に許容してしまうと、生活が監視され、政府なり、企業なりが定義する「グッドライフ」に最適化されていってしまうことにもなります。それでも構わないよ、という方もいらっしゃるかもしれませんが、それは「自分の人生は自分でデザインしていく」という「自由」や「個人主権」の考え方と矛盾してしまうことになります。個人の自由を優先するのか、それとも社会全体の利益を優先するのか。難しい問題です。
山本 龍彦
そうした問題は、デジタルIDというものそのものにもありますね。
国民全員に「デジタルID」を与えるというアイデアについても、似たような議論はあります。デジタルIDに反対する人は、やはり監視社会を恐れますし、賛成する人は社会全体の利益を語ります。ただ、日本で、デジタルIDに賛成する人のなかには、別の観点から賛成する人もいます。国民の識別や管理が個人単位になることで、現状の戸籍制度から解放されるかもしれないという意見です。個人IDになることで、戸籍制度とそれが前提としていた家族制度から解放され、個人の移動性がより高度に実現されることになります。
移動の自由ですか。
はい。これは「地方」「医療」あるいは「職場」というテーマとも関わりますが、通信インフラがあって通信機器をあらゆる個人が手にし、かつデータのポータビリティ(データの可搬性)が認められるようになれば、どこにいても同じように仕事ができますし、自分に必要なサービスをどこにいても享受することが可能になります。「移動の自由」は、データ社会を考える上では重要な論点だと思います。近代以前の世界では人が土地に縛られていたのが、近代社会では「居住、移転の自由」が権利とされるようになりました。日本の憲法でもこうした移動の自由が保障されています(22条1項)。「データ・フリー・フロー」や「データ・ポータビリティ」の実現は、人のフィジカルな移動をさらに加速させていく可能性があります。
「企業の利益」と「プライバシー/消費者保護」が、矛盾したり対立するものではなく、相互に補完し合うものであるということは、今後のデータ経済を考える上で重要な視点だと思います。
そうした中で、より安全で信頼に足る、データ活用のためには、具体的にどんな制度や仕組みが必要になってくるのでしょう?
個人が特定されないはずの匿名の「集合データ」から個人を割り出していく行為は「識別行為」と言われ、日本の個人情報保護法では禁止されていますが、罰則はそこまで重いものではありません。今後、この「識別行為」を、どう捉えていくのかは大きな課題となります。また「個人界」のデータについては、個人が自分に関わるすべてのデータを把握し管理することは難しいですから、ひとつひとつの情報の処理にいちいち同意していくという「自己情報コントロール」とは異なるアプローチが必要になるかと思います。
どんなアプローチでしょうか。
信頼できる「誰か」に、個人データを管理・運用をしてもらうというのが、今後のひとつの潮流になるかと思います。信頼できる機関に自分の情報を託し、その機関による自分のデータの管理・運用のしかたを統制するというやり方です。情報の主体と情報の利用者との間に媒介項を置いて、そことの信頼関係を個々人が結ぶというような構造です。「情報銀行」と言われているものも、こうした考えに基づいています。
山本 龍彦
その「機関」は、よほど信頼に足るものではないと困りますね。
はい。その機関が負う責任は大きなものがありますが、政府からも自律している必要があると思います。情報銀行などの機関が、自主的に技術やサービスの向上に取組み、競い合うことも重要だからです。「企業の利益」と「プライバシー/消費者保護」が矛盾したり対立するものではなく、相互に補完し合うものであるということは、今後のデータ経済、データ社会を考える上で重要な論点だと思います。
* 記事の内容は個人の見解であり、G20貿易・デジタル経済大臣会合としての公式見解を示すものではありません。
山本 龍彦
慶應義塾大学法科大学院教授
慶應義塾大学大学院法務研究科(法科大学院)教授。慶應義塾大学グローバルリサーチインスティテュート(KGRI)副所長。総務省「AIネットワーク社会推進会議(AIガバナンス検討会)」構成員、経済産業省・公正取引委員会・総務省「デジタル・プラットフォーマーを巡る取引環境整備に関する検討会」委員、総務省「情報信託機能の認定スキームの在り方に関する検討会」委員を務める。主な著書に、『憲法学のゆくえ』『プライバシーの権利を考える』『おそろしいビッグデータ』『AIと憲法』など。

Interviews

データ活用を巡るこれからの可能性と課題を、専門家たちはどんなふうに考えているのだろうか。

 Data