音声対話の先にあるユーザインタフェース第4世代

ユーザインタフェースは、人とコンピュータをつなぐもの。
PCのキーボード、マウス、スマホのタッチスクリーンとゆっくり進化してきた。
慣れが大事なので、そう簡単には変えられない。
しかし、次世代のユーザインタフェースの兆しが見えてきた。

Amazon Echoで音声対話が大ブーム

米国では音声対話が大ブームである。
リードするのはAmazonの音声端末Echo
見た目は円筒形のただのスピーカーである。
声で指示して音楽を鳴らしたり、手軽にAmazonに注文できるので、
1年で500万台の大ヒットとなった。

さらに、Echoの対話エンジンAlexaを公開した。ウーバーやピザハットなど
数百の外部サービスを注文できるようになった。
スマホアプリの代わりになりつつある。
あえてディスプレイを廃し、音声ネイティブアプリの開発を加速したことが最大の成功要因だろう。
おそらく他社であったら、画面をつけて中途半端な音声対話となってしまい、
ここまでヒットしなかったのではないか。

また、最近の家電イベント「CES 2017」では、Alexaが席巻した。
LG電子の冷蔵庫
フォードの乗用車など、
大手からスタートアップまで、
あらゆる機器にAmazonの音声対話機能が搭載されていた。

日本ではチャットボットがようやく注目され始めた段階だが、
世界は音声対話の時代に入りつつあるのだ。

次世代ユーザインタフェースは15年おきに普及し始める

次世代ユーザインタフェースは音声対話で決まりだろうか?
いや、そうではない。音声対話だけでは十分な操作も情報提示も難しい。
本命を見る前に、ユーザインタフェースの歴史を振り返ってみよう。

第一世代は、キーボードと文字端末。
元々は大型コンピュータ(汎用機)のプログラミングに使われた。
家庭にキーボードが普及し始めたのは1977年発売のApple IIからである。
日本で広まったのは1979年のNEC PC-8001やワープロ専用機からであろう。

第二世代は、マウスとウィンドウ。
画面上のメニューやボタンを選んで、直感的な指示がユーザ層を大きく広げた。
登場は1984年の初代Macintoshだが、
1995年のWindows 95の発売から一般に普及した。

第三世代は、スマートフォンのタッチパネル。
画面上のアイコンを指で触って指示でき、さらに操作しやすくなった。
フリック入力が発明され、文字もキーボード並みに打ち込める。
Apple NewtonやPalm、BlackBerryなど、ペン入力PDAが1990年代の先駆者となった。
2008年のiPhone3Gの登場で指操作が爆発的に普及した。

そして、2015年に音声対話機器Amazon Echoが登場したのであった。

第4世代は音声対話+拡張現実(AR)+ジェスチャー操作

1980年、1995年、2010年頃と、およそ15年おきに新しいユーザインタフェースが普及し始めた。
そう考えると、第4世代は2025年頃、もう少し先になる。
音声対話はユーザインタフェース第3.5世代ではないか。

次世代普及の10年前から、萌芽的な製品が登場してきている。
ここでは2013年に登場したGoogle Glass (スマートグラス)に注目したい。
グラスを通して現実世界に情報を重ね合わせる拡張現実(AR)である。
音声対話と組み合わせ、フィットネスや料理、旅行、SNSなど、
ハンズフリーの特長を活かしたアプリが発表された。

ユーザインタフェースに大事な機能は二つある。
ひとつは情報を探して詳しく見る「情報取得機能」である。
もう一つはユーザがアプリに情報を与えたり、操作をガイドするという「タスク実行機能」である。
拡張現実は情報取得の新たな方式であり、音声対話は両者をハンズフリーにできる。
しかし、どちらもタスクを実行させる能力は十分ではない。
最後のピースは、グラスを通した空中モーション、すなわちジェスチャー操作だろう。
実際、音声対話+拡張現実+ジェスチャー操作のARスマートグラスの先駆的製品が登場している。
EPSON
Vuzix
Atheer
ODG
といったメーカだ。

ユーザインタフェースの世代

10年後には、スマホ代わりに、スマートグラスをかける時代がやってくる。
スマホとSNSの登場で、友達や恋人との付き合い方が大きく変わった。
まずはLINEでアドレス交換、既読スルーはNG、オンラインの会話が増えて、
深夜のファミレスは流行らなくなった。
スマートグラス時代には、互いに近況を眺めつつ、会話するようになるのだろうか。