ユーザの属性や趣味、嗜好、行動パタンといったいわゆるプロファイル情報を収集しこれを活用することは、今後の情報サービスのパーソナライズにおいては必須である。 amazom.com や Googleなどの既存サービスにおいても、購買履歴や web の閲覧履歴に基づいたパーソナライズサービスはすでに一般的なものとなっている。今後、サービスの差別化を行っていくためには、質、量ともに従来以上のプロファイル情報を多面的に収集することにより、ユーザの特性や状況(時間や場所など)に応じたパーソナライズドサービスを展開することが望まれている。
プロファイル情報収集:質と量の拡大
現状、プロファイル情報の収集においては、特定のサービス上での利用履歴(ログ情報)を収集することが一般的である。たとえば、amazon.com では書籍の購入履歴に基づいたリコメンドサービスが行われているが、それ以外のユーザの行動情報、たとえば、レストランの検索履歴や Web 情報の閲覧履歴をプロファイル情報として利用することはできない。閲覧履歴や購入履歴、さらには位置情報や(サービスによっては)バイタルセンサなど、多種多様な情報を統合化し利用することによりユーザの特性をより正確に把握することができる。むろん個別のサービスで収集したプロファイル情報を統合化するためには、技術的な課題以外にも法的側面やビジネス上の課題が多いが、今後は、サービス連携の形でユーザへのサービスを多様化させるととともに、プロファイル情報自体の統合化が進むと考えられる。
また、プロファイル情報においては単に量を集めるだけでなく、そこから何を推測するか、という点も重要である。リコメンドサービスにおいては、バスケット解析のような頻出パタンや相関ルールのマイニングが広く用いられているが、データを解析するための加工技術(テキスト処理や画像や動画からの特徴抽出などの技術)や大量データの解析技術が今後の大きな技術的課題となるだろう。ユーザ特性推定の精度を向上させることも重要な課題ではあるが、精度の向上とは、大量データに如何に対応できるか、という問題に本質的に帰着する。
しかしながら、技術だけでは自ずと限界もある。そもそもノイズの多いデータが多ければ、推測できることには限りがある。収集した情報を如何に解析するかという点に加え、そもそもどのようにすれば精度の高い情報を収集できるか、という点もあわせて重要になってくる。
プロファイル情報収集:質の向上
従来のプロファイル情報では、ログ情報とも言われるように、ユーザ行動の記録に基づく情報が主であった。たとえば、購入の履歴などは、ユーザが意識することなくサービス側に提供されているのであって、いわば暗黙的な情報収集であるといえる。
これに対して、今後ユーザ特性推定の精度を高めていくためには、暗黙的な情報だけでなく、サービス提供者に直接的に情報を提供する明示的な方法が有用であろう。
明示的な情報提供においては、「こういうものが欲しい」、「こういうものはいらない」、あるいはユーザ自身の状況や感想といった直接的な情報を入力する。ユーザ登録時に趣味等を入力するものもこういった明示的な情報収集の一つであるということができるが、今後はあまり差し障りのない「趣味」や「職業」などの情報だけでなく、さらに機微な情報の提供も考えられる(たとえば可処分所得や病歴など)。このような機微な情報はサービスの質を高める上で重要な情報ではあるが、ユーザにとってはできるだけ入力したくない情報を提供するメリットやインセンティブを如何に与えることができるか、といった点が課題である。機微な情報を提供することによってそれに見合う質の高いサービスを受けられるといったことが最も大きなインセンティブとなるだろう。
また、ユーザからすれば機微な情報が確実に守られるという安心感も重要である。自身へのサービス選択の分析にのみ用いられ、それ以外で用いられることがないという保証、またユーザが必要に応じてプロファイル情報を削除または修正できるということが必須である。もちろん現状のサービスでも履歴そのものを編集することでプロファイル情報を削除することが可能である(たとえば Amazonに恥ずかしい本を勧められるあなたへ)が、情報が連携・統合化されて、さまざまなサービスで利用されたときに、一部分のみを削除できるという保証はない。
ユーザ参加型のパーソナライズ
次世代のパーソナライズドサービスにおいては、ユーザがどのような情報をどのようなサービスに対して提供するのかはユーザの選択に委ねられるべきである。また、同時にどのレベルのパーソナルサービスを受けたいのかを選択できることも必要である。たとえば、「これを買った人はこれも買っています」といったリコメンドサービスであれば問題がないにしても、もし「あなたの趣味は○○ですね。××があなたにお薦めです」「あなたは昨日○○をしていましたね。今日は××をしませんか?」と表示されたらどうだろうか。一般にサービス側にとって価値のある情報は、個人にとっては機微な情報であり、もともとの情報はユーザが承諾して与えるものであるとしても、どのレベルまで個人の特性を推定されるかどうかは制御することができない。
このように、情報提供内容からサービスの享受レベルまで含めて、次世代のパーソナライズドサービスに対して「ユーザ参加型の」というキーワードをつけたいと思う。
今までのように、サービス側が限られたユーザの情報を収集し、そこからユーザの特性を推定するというものから、ユーザの意思により多様な情報が提供され、ユーザの意思に基づくサービス連携が促進されるという環境が必要である。プロファイル情報の統合化やサービスの連携だけであれば、ガリバー企業があらゆるサービスやプロファイル情報を手中にすることでも実現できるだろうが、ユーザ自身の選択の幅が狭まってしまううえ、ビジネスとしての多様性も期待できない。技術的な課題やビジネス面、法律面等での制度的な課題も多いが、企業の枠を超えて重点的に取り組まなければならないテーマであろう。
本文中のリンク・関連リンク:
- 情報大航海プロジェクト:マイニング技術の検証用プロファイルデータ 筆者らが実施したユーザの行動データ収集実験。従来と同様の Web アクセス履歴や位置情報、あるいは生体センサによる情報などの暗黙的なプロファイル情報に加え、何をしていたのか、どのような状況であったのかといった明示的なプロファイル情報、さらに生活記録としての正解情報も同時に収集した点が過去の同様のデータ収集実験との大きな相違である。
- Google ウェブ履歴
- Amazonに恥ずかしい本を勧められるあなたへ