「目は口ほどにものを言い」ということわざを持ち出すまでもなく、 人と人が応対するときに、目の動きは対話のときにとても大きな意味を持つ。 実際には、目だけでなく、顔全体の表情をつねに気にしながら話をしているものである。 相手の顔が見えない電話では話し方に気をつけるし、 雰囲気が読めずについ聞き返してしまうこともある。 音声合成や音声認識が進んでもコンピュータと自然な会話ができるようになるためには、 「顔」の存在が欠かせない。
表情を持ちはじめたコンピュータ
ハリウッドのSF映画やゲームソフトに代表されるように、 顔の画像を作り上げる技術は非常に進んでいる。 しかし、これはあくまでシナリオに基づいてCGクリエータが作り上げた顔である。 コンピュータの「顔」になるためには、状況に応じて表情を変えられる技術が必要になる。
二次元の画像では眉・目・口などの顔の部品の位置関係やしわを動かして、 さまざまな表情を作ることができるようになってきた。 ロボットのような三次元モデルでは、 さらにユーザとのコミュニケーションを通じて視線を動かしたりすることも大切になる。
顔を見分けることが次のポイント
スムーズな会話をするためには、顔を作ることと同時に、 ユーザの顔を見分ける力も大切である。 顔の認識には、ユーザが誰であるかという個人識別と、 ユーザの感情を見分ける表情認識がある。
個人の識別はすでにカメラを内蔵したノートPCに搭載されており、 セキュリティや 介護分野でも使われ始めている。 パソコンを立ち上げて「やあ」と声をかえると、 「比屋根さんですね。メールが10通届いています。」と、 画面中のキャラクタが答えてくれるのに時間はかからないだろう。
もう一つの表情の認識は、まだまだ難しいようだ。 でも、特に初心者や不特定多数のユーザに応対するコンピュータは、 ユーザが困っていたり怒っていることを察知して欲しい。 コンピュータ相手にうまく通じなかったり、思い通りにならないと、 人間相手以上に腹が立つものだから。
顔が見えると対話が進むが
コンピュータの顔が見えれば対話が進む。これは間違いない。 ワープロ等のヘルプにいるアシスタントキャラクタが音声対話型になり、 顔を見ながら質問できればストレスが少なくなるのは確かだ。 企業の無人受付に置くバーチャル受付嬢や、 パーソナル情報管理をするバーチャル秘書も出てくるだろう。 それはそれで親しみやすくなり、良いものだ。
とはいえ、そこら中のパソコンや機械が顔を持って話し始めたりしたら、それは嫌だ。 一昔前におしゃべり自動販売機が流行ったことがあった。 「いらっしゃいませ」「ありがとうございました」と無機質な声で挨拶されても、 うっとうしいだけで嬉しくもなんともなかった。 コンピュータやロボットが表情豊かな顔を持ち、 自然な声で応対してくれれば解決するという問題だろうか。
顔が見えるというのは、単に表情が分かるというのとは違う。 相手の性格、趣味、職業、生い立ちなど、いろいろな背景を含めて「顔が見える」 と言っているのである。 必要以上に背景を知りたがるのは、日本人に特有な現象とも言われている。 藤崎詩織やテライユキのように実在しないリアルなキャラクタを生み出し、 みんなの共通の知り合いになれば、あまり違和感なく会話ができそうだ。 そしてついには「君それは違うだろ」とニヤリと笑うコンピュータが登場するかもしれない。