「音声アシスタントAI」が作り出すメタプラットフォームとは──無思考型サービスが広がっていく世界で

第1回 

 本連載では、GoogleやAmazonなどがこぞって開発しているアシスタントAI技術、その開発プラットフォームが開放されることで生まれるエコシステムに注目する。この新しいエコシステムにおいて、非テック企業が自社サービスをどのように位置づけ、活用し、競争優位性を獲得していくのか。数回に分けて解説していきたいと考えている。今回は「音声AIプラットフォーム」が、どのように私たちのビジネスを変革していくのかをコンパクトに解説していきたい。

[公開日]

[著] 長友 裕輝

[タグ] AI・機械学習 事業開発 顧客体験 音声AIプラットフォーム 無思考型サービス VUI

  • このエントリーをはてなブックマークに追加

『日本におけるスマートスピーカーの普及率が低い』と嘆いていると、“ビジネスの潮目の変化”を見誤る?

 2017年に日本でも発売された「スマートスピーカー」の登場により、一躍有名になった音声アシスタントAI。2018年3月に行われたGoogleの年次カンファレンス「Google I/O 2018」のデモにおいて、電話越しに実際の人間と会話して美容室の予約をとるというSF映画顔負けの進化を見せた。この機能はあくまで正式ローンチ前であり、一般利用が始まるまでにはもう少し時を待つ必要がある。しかし、人間と話し言葉でやり取りし、様々なタスクを実行する「アシスタントAI」という概念は、技術進化や搭載デバイスの普及にともない、次世代のUIスタンダードの一つとなっていくことは想像に難くない。

 音声アシスタントAIのビジネス活用に話の舵を大きく切る前に、軽くこの技術やUIの特徴、市場動向を整理しておきたい。

 まず音声アシスタントAIそのものについてだが、パーソナルアシスタント、音声インターフェイス(VUI=Voice User Interface)、会話型エージェントなど様々な呼び方がある。共通しているのは、「音声で、会話形式で、アシスタントやエージェントのように人間の要求に応える」インターフェイスである、ということだ。

 特徴としては、音声をベースにしていることによる「ハンズフリー性とマルチタスク性」、音声認識精度によるが原理的にキーボードやタッチディスプレイでタイピングするよりも入力速度がずっと速いという「インタラクションのスピード」、自然言語では話しかけているだけなので業務用ソフトや初めて使うアプリのように使い方をユーザーが学習しなくてよい「学習容易性の高さ」などが挙げられる。

 これらの特徴を持った音声アシスタントをGoogle、Amazon、LINEをはじめとしたテック企業が、Google Assistant、Alexa、Clovaといったサービスで消費者に向けたUIとして提供している。同時に、これらの技術をSDK(Software Development Kit:ソフトウェア開発キット)として開放する流れがある。音声認識や自然言語処理の技術を持たない非テック企業が、スマートスピーカーやスマートフォンなどで利用される「音声ファーストのアプリ」や「サードパーティ独自のアシスタントAI」を容易に開発できるようになる。消費者と非テック企業をつなぐこの両面性が、音声アシスタントAIが「プラットフォーム」と呼ばれる理由でもある。

 音声アシスタントAIの普及を占う一つの予測がある。デジタル市場の動向分析を行うアメリカの調査機関Comscoreによると、「2020年までに全検索行為の50%が音声で行われるようになる」と予測している。

 もちろんアメリカと比べ、日本におけるスマートスピーカーの普及率はまだまだ低い。しかし、そもそも音声アシスタントが最も利用されるデバイスはスマートスピーカーではなくスマートフォンであり、音声アシスタントを搭載したIoTデバイスも既に数千を超えているという事実がある。現時点におけるスマートスピーカーという単一のデバイスの普及数だけ見ていたら、ビジネスチャンスを見失うだろう。

 ガートナーも2017年開催の自社シンポジウムの中で音声技術について言及し、以下のように述べている。

音声や画像による検索をサポートするよう自社WEBサイトをリデザインする先進的なブランドは、2021年までにデジタルコマースによる利益を30%引き上げるだろう。

バックナンバー