「A3RT」は、「必要な最新テクノロジーをいつでも手軽に」というコンセプトのもと開発を進めている、機械学習やディープラーニングを用いたソリューションAPI群。AI技術活用の機会を増やし、技術発展に寄与するとともに、より多くのフィードバックを得ることで精度を向上させることを目的とし、3月16日に第1弾として画像解析や文章分類モデル作成など6つのAPIを公開した。
その反響を受け、今回、DCGAN(Deep Convolutional Generative Adversarial Networks)の技術を用いた画像生成API、および、マルチモーダルDeep Learningを用いた画像とテキストの相互検索APIを追加。さらなる機会創出を目的に、ラインナップを増やすこととなったという。
■Image Generate API
DCGANの技術を用いてオリジナルの画像を生成するAPI。あらかじめ4500枚以上の画像を学習させたアルゴリズムから自動生成された画像を合成し、新しい画像を作ることができる。また、作成した画像を評価することで生成に反映させることができる。
このAPIを使ってできることは、(1)オリジナル画像を生成する、(2)生成した画像を複数選択し合成する、(3)合成した画像を評価する、の3点。現在はユーザーがモデルを作成できる機能は提供していない。今後、ユーザーが自由にデータをアップロードして学習させることができる機能を提供予定。
■Image Search API
マルチモーダルDeep Learning技術を用いた画像とテキストの相互検索API。画像とテキストの関係を学習することで、テキストから画像を検索したり画像からテキストを検索したりといった相互検索を行うことができる。
現在、オリジナルの画像データを用いることはできないが、用意しているサンプルデータを用いて技術を体験できる。このAPIを使ってできることは、(1)自然な言葉で画像を見つけること、(2)画像をもとに関連する言葉を見つけること、(3)画像をもとに類似の画像を見つけること、(4)文章から関連する単語を見つけること、の4点。
なお、これまでに公開されているAPIは次のとおり。
- Listing API:リスト生成用API。ユーザーの行動ログを元にアイテム間の相関リストや、各ユーザーへのレコメンドリストなどを生成することができる。
- Image Influence API:画像を偏差値で評価するAPI。画像と対応する偏差値を用意すれば、自分好みの画像の探索に利用できるモデルを作成することが可能。
- Text Classification API:文章を自動的に分類するAPI。文章と文章に対応するラベルを用意すれば、オリジナルの文章分類モデルを作成することが可能。
- Text Suggest API:入力された文章の後続に出現する文章を作成するAPI。テキスト入力に合わせてAPIを叩くと、テキスト入力支援ツールの作成ができる。
- Proofreading API:日本語で書かれた文章に対して、誤字脱字がないかを自動的にチェックするAPI。また、書き換えた方が良さそうな単語の候補も出力する。
- Talk API:さまざまなアプリケーション上でユーザーとの対話を自動化するAPI。入力文から応答文を自動生成。日常会話レベルでの応答が可能。