機械学習にビッグデータは要らない!少量データから「AI+人間の判断力」で最大価値を提供
池見(株式会社grooves 代表取締役):
2015年1月放映のNHKスペシャル『NEXT WORLD 私たちの未来』に登場された際、御社の人工知能を用いた訴訟時のドキュメントレビュー(証拠閲覧)支援が紹介されました。人工知能の登場で“弁護士”という仕事がなくなるかもしれないという内容は、前後して話題になったオックスフォード大学の同様のレポートもあいまって、かなりインパクトがありました。
武田(株式会社FRONTEO(旧:UBIC)取締役CTO行動情報科学研究所所長):
確かにこれまで人間にしかできなかった抽象的な判断などを機械が一部担うなど、非常に効率化が進む業務はあると思います。しかし、私たちはAIが人間の仕事をすべて奪ってしまうとは考えていません。むしろ分析結果が得られた後に新しい戦略を考える人やAIを教育する人、AIと協業する人などは増え、新しい仕事や新しい仕事の体系が生まれる可能性の方が大きいでしょう。その意味で、やや逆向きにセンセーショナルに捉えられ過ぎたように感じています。
ただAIの活用そのものは、決して遠い未来の話ではなく、既に現在進行形の話であることは間違いありません。たとえば米国では司法省(United States Department of Justice:DOJ)が率先して、企業が管理している大量のメールや文書ファイルに優先順位を付ける技術「プレディクティブ・ コーディング」の使用を推奨しています。そうした追い風もあって弊社の「eディスカバリ支援ソリューション」は普及しつつあります。
また近年では、AIや機械学習がバズワードのように扱われていましたが、以前のようにVC(ベンチャーキャピタル)が目の色を変えて投資するようなことは少なくなりました。しかし、弊社のように実用的なソリューションとして結実させ、成果を上げている企業は確実に増えてくると思います。
池見:
AIに関しては多くのベンチャーが取り組んでいますが、その中でも特に事業として成果を出し、先んじることができたのは、どんな強みがあったと思われますか。
武田:
まずかなり早い段階で取り組んできたこと、そしてもう1つは実用的だったことだと思います。私たちがエンジンを初めて出したのが2012年の春。その年に今の機械学習ブームの火付け役となったDeep Learningが、画像認識コンペティションで最優秀成績を収めています。もちろん、思いついてすぐに開発できるものではなく、以前から研究を進めていたわけですが、期せずして、同じ分野で異なるソリューションを同タイミングで発表することができた。それによる注目度は高かったと思います。
そして、もう1つ技術的な優位性も上げられます。現在の機械学習はビッグデータを活用するものが多いのですが、そんな膨大なデータを実際に持つ会社は一部のプラットフォーマーなどに限られます。普通の企業がいきなりビッグデータを扱うのは時間やコストがかかり、リスクも大きい。一方、私たちの機械学習では、少ないデータを解析して傾向を見出すアルゴリズムを用いています。つまり、少ないデータから一定の傾向を見出せるので、「機械学習に必ずしもビッグデータは要らない」のです。
機械学習というと、膨大な有象無象のデータの中から人間が気づかないような“宝物”を自動的に発掘するというイメージがありますが、当分の間は“夢物語”です。私たちの目標はもっと現実的で、「AI」と「人間の判断力」を組み合わせて最大限に活用すること。つまり、人間が一定戦略を立てて、それに則った質の良い「教師データ※1」を用意し、それを用いて学習させる方がはるかに「知りたいこと」がわかるはずなのです。皆がGoogleになる必要は無いのです。そこを主戦場とするより、自分たちの強みのあるドメインで勝負する方が企業としては健全だと思います。
※1:教師データ:教師あり学習(きょうしありがくしゅう, 英: Supervised learning)とは、機械学習の手法の一つで、事前に与えられたデータをいわば「例題(=先生からの助言)」とみなして、それをガイドに学習(=データへの何らかのフィッティング)することを言う。教師データとは事前に与えられたデータのこと。(参照:Wikipedia「教師あり学習」)