この技術により、プライバシーに関わるデータを個人の寿命よりも長い期間にわたって安全に利活用することが可能になるという。一例として、保険・医療等の分野において、遺伝子情報などに対するプライバシーを長期にわたり保護した状態でのデータマイニングへの応用が期待されるとしている。
この技術により、データマイニングなどにおいて、データを暗号化したまま様々な演算が行える準同型暗号を組み合わせることにより、プライバシーを保護した状態でのデータ処理が可能となるという。
応用の一例として、病歴や遺伝子情報などの統計処理を通じた、保険・医療等の分野でのデータ利活用が進むと期待されているという。このようなシステムの運用においては、長期間にわたり暗号の安全性を保つ必要があり、定期的に鍵長の変更によるセキュリティレベルの更新を行う必要がある。
鍵長の変更には2通りの実現方法がある。その1つである暗号文を一度復号した後に、再びセキュリティレベルの高い暗号方式で暗号化する方法(既存技術1)では、復号した際のデータ漏えいの危険性があり、システム変更のコストを要していた。
また、暗号文を復号せずに、セキュリティレベルのより高い暗号方式で暗号化する方法(既存技術2)では、データ形式を変換・分割しなければならないため、2度目の暗号化以降のデータ処理が不可能だったという。
そのため、既存技術では、暗号化されたデータを安全に利活用できる期間は、数年から数十年程度が限界となり、たとえば、病歴や遺伝子情報など、その漏えいが起こった場合に、本人だけでなく親戚・子孫にまで影響のあるデータを長期的に扱うことは、現実的に難しいと考えられていた。
今回、NICTは、暗号化されたデータのセキュリティレベルの更新処理と準同型演算処理を同時に実現する暗号方式を世界で初めて開発した。これは、データを暗号化する際に暗号文をデータ領域と付加情報に分割し、付加情報を伸ばす技術を新たに開発したことによって実現したという。
これにより、数十年程度が限界であった安全なデータ利活用の期間を100年以上に伸ばすことが可能になる。加えて、大幅なシステム変更を伴わずに、より強固な暗号システムへの移行が可能となるので、ITコストの節減にもつながるという。
また、暗号化されたデータのクラウドサーバ上での統計処理を想定した実証実験として、100万件のデータに対する線形回帰計算を暗号化したまま行い、30分程度で処理ができることを確認した。
さらに、セキュリティレベルを更新する機能を持たない従来研究と同じデータセットを用いて比較したところ、平均して100倍程度高速になることを確認したとしている。
今後は、日本の人口を想定した一億件規模のデータを用い、保険やバイオインフォマティクスなどの分野で使われる計算を暗号化したまま行うことで、大規模なプライバシー保護データマイニングシステムが構築可能であることを実証し、実社会での応用を広げていくという。
なお、今回の成果については、1月20日(火)~23日(金)に福岡県北九州市小倉で開催される「2015年暗号と情報セキュリティシンポジウム (SCIS2015)」で発表される。