Android 特集・連載

【今すぐできる!「しゃべってコンシェル」カンタン活用ガイド!!-第1回-】

「しゃべってコンシェル」の開発者に突撃インタビュー!

文●mobileASCII編集部

2012年08月06日 10時00分

  • このエントリーをはてなブックマークに追加

スマホの音声認識を活かした「しゃべってコンシェル」は
情報検索サービスを激変させる!!

「しゃべってコンシェル」の開発者に突撃インタビュー!

スマートフォンに話しかけると、いろいろな情報を調べてくれる、ドコモの音声エージェントサービス「しゃべってコンシェル」。
2012年3月に配信されてから話題の「しゃべってコンシェル」について、さまざまな活用法や使い方を3回に渡って大解剖! 
第1回目は、ドコモの開発者にインタビュー。アプリ開発の経緯やオススメの使い方について聞いてみた。

(聞き手:mobileASCII編集部)

――まずは「しゃべってコンシェル」を開発された経緯について教えてください。

飯塚真也氏(以下:飯塚氏):実は、ドコモでは2000年代のフィーチャーフォンが全盛の時代から、音声に関するサービスは行っていました。たとえば、らくらくホン向けに行っていた、音声入力メールのサービスなどがそうです。当時から、ケータイに話しかければ何でも応えてくれるという「アラジンの魔法のランプ」的な世界を目指して研究していた感じです。

 ケータイに話しかければ何でも応えてくれるという
 「アラジンの魔法のランプ」的な世界を目指してきました。

株式会社NTTドコモ
研究開発センター 
先進技術研究所
コミュニケーションメディア研究グループ


飯塚 真也氏

 

 

――なるほど、「アラジンの魔法のランプ」ですか。

飯塚氏:その後、ちょうどスマートフォンが出始めたころに、Googleさんが提供する音声検索をはじめ、音声認識の性能が飛躍的に向上したこともあり、音声エージェントサービスができないかと考え2011年5月に「しゃべってコンシェル」の前身となる「VOICE IT!」というアプリをトライアルとして公開しました。そのアプリは「しゃべってコンシェル」の原型になるのですけど、ユーザーの方の反応を踏まえてさらにブラッシュアップさせたアプリが、この「しゃべってコンシェル」になります。

――スマートフォンでの音声エージェントということで、こだわって作られたところなどありますか?

飯塚氏:我々はモバイルの会社なので、モバイルで利用した時の使い勝手についていろいろ考慮しました。たとえばパソコンでの検索とスマートフォンでの検索は、画面の大きさも違うし求められているものが違うと考えました。スマートフォンやケータイでの検索は、たとえば外出先でお店を探す場合などで使われるケースが多いので、パソコンの検索結果よりも、より専門的で整理された情報を提示するほうが、お客様にとって役立つかと思ったのです。

内田渉氏(以下:内田氏):たとえばパソコンで「カレーが食べたい」と入力して検索すると、「カレーが食べたい」という文字が書いてあるブログなどがヒットする場合が多いと思うんです。検索する人が欲しがっている情報が「お店」や「レシピ」だったとすると、「カレーが食べたいと書いている人のブログ」がヒットしてしまうとうれしくないと思うので、モバイルの検索に関しては「単なる言葉の羅列」を検索するのではなく、もう一歩踏み込んだその「言葉の意図」を汲み取った最適な結果を提示するのがいいと思って開発しています。

 「それなりの結果」をスピード重視で早いタイミングで
 得られるのがモバイル検索のポイントだと思うんです。

 株式会社NTTドコモ
 研究開発センター
 サービス&ソリューション開発部
 データ統合方式担当


 内田 渉氏
 

 

――言われてみると、確かにパソコンとモバイルでは検索の用途が違うと思いましたが、そこまで意識して開発されたのですね。

内田氏:乗換検索で考えると、パソコンでは主に旅行の計画を立てるときなどじっくりと調べたい場合に使うことが多いと思いますが、モバイルでは外出先で「ここから最適なルートは?」という感じで、スピード重視ですぐに最適な情報が欲しい場合で使われることが多いと思うのです。つまり、「それなりの結果」をスピード重視で早いタイミングで得られるのがモバイル検索のポイントだと思うので、音声エージェントでもそういう利用シーンを想定して開発しております。

――ちなみに、音声エージェントサービスを訴求したいターゲット層は想定されているのでしょうか?

飯塚氏:主なターゲットとして考えているのは、ケータイやスマートフォンの操作が難しいと考えている方ですね。スマートフォンには、いろいろなアプリやインターネットのサービスがありますが、慣れていない方にとってはたくさんありすぎて扱うのが難しいと思っていらっしゃる方が多いのではと思っております。何か調べようとしても階層構造が複雑ですし、リンクをたどっていかないと目的のものにたどりつけないの、つまり「ワンアクションでゴールにたどりつく」というUIになっていないわけです。対して、音声検索では、「カレーが食べたくて、○○駅の近くで」という複数の条件を1つの発案の中に含ませることができるのがいいところなのです。ふつうに操作して探す場合だと「グルメ検索→洋食→カレー」と順にたどっていくところを、「カレーが食べたい」というワンフレーズの言葉ですませることができる。そういう複雑な操作を苦手とされている方に、いかにして、うまくアシストできるかというのが1つの大きな目的となっています。

「しゃべってコンシェル」の開発者に突撃インタビュー!

「飯田橋でカレーが食べたい」と入力すると、エリアガイドからカレーが食べられるお店が表示された。

――そもそも「しゃべってコンシェル」は、どのような仕組みで結果が表示されるようになっているのでしょうか? 質問の内容が多岐にわたると、それに対する最適な回答をマッチングさせるのは簡単ではないように思えるのですが。

飯塚氏:具体的な技術の開示はできないのですが、たとえばユーザーの方の言葉の内容が「目的をもって何かを調べたい」ものなのか、それとも「特に求めてなく雑談としてしゃべりかけているのか」の判定ができるようにしています。

内田氏:6月のバージョンアップで新たに「知識Q&A」というものを追加させて頂きました。たとえば「平安京遷都はいつ?」といった歴史的な情報や、豆知識的なものを求めるユーザーの方も多いだろうと考えて、そのようなノンジャンルの検索に対しても深くズバリと回答できるようにしています。
 

飯塚氏:ただドコモの持っている強みは、やはりiモードからの資産としてコンテンツプロバイダさんが提供されている良質なコンテンツだと思うので、基本的にはそこを活用させていただいています。もちろんdメニューにこだわらずに、いいコンテンツがあればそこにもつなぐようにしています。

「しゃべってコンシェル」の開発者に突撃インタビュー!


――ユーザーによって使い方はさまざまだと思うのですが、やはりある程度は質問を想定されて、それに対する答えを用意している感じなのでしょうか。

飯塚氏:もちろん、そういう場合もありますが、思われているほど「この言葉には、こう反応する」というガチガチな仕様にはなっていなく、ある程度の遊びは持たせています。

内田氏:そこの回答のブレみたいなものが一部のユーザーの方に受けているところもあるのですよね。いろいろな言葉に対しても反応できようにしてあるし、いろいろなパターンの回答が楽しめるようにもしているのです。

――質問によっては珍回答が楽しめるようですが、そこはやはり狙って作られているところですか。

内田氏:雑談の珍回答に関しては、狙って作ったところはありますが、知識Q&Aの珍回答に関しては、いわゆる「天然」です。ある程度、お客さまの意図に沿えるようには作っているのですが、細かいところで対応しきれていないところがありまして。全然ハズレではないのですが、たとえば「あるアイドルグループのメンバー」を検索した時に全然違うキャラクターの名前が回答に出てきたことがありました。それなどは「天然」です。

――回答の鮮度に関してはどうでしょう? 随時、新しい情報を盛り込んでおられるのでしょうか?

内田氏:Twitterの「つぶやき」を検索できる機能も用意させていただいているので、情報の鮮度やリアルタイム性に関しても対応しております。最近のトピックスに関してなども追従していますし、電車の遅延情報や高速道路の混雑状況などに関するつぶやきもフォローできるようになっているのです。今後もユーザーの方のニーズに合わせて、もっと発展させていく予定です。

<< PREV 1 2 NEXT >>

mobileASCII.jp TOPページへ