デスクトップサーチが目指すもの

ローカルなデスクトップマシン内の情報を検索するデスクトップサーチの話題が 連日報じられている。 きっかけとなったのは、10月に発表された Google Desktop Search β版 である。 今のところはまだ日本語を含む多言語の対応が十分ではないが、 ネット上の情報だけでなく、自分のパソコンにある文書ファイルやメール、 さらには過去にアクセスしたWEB情報(のキャッシュ) までも含めて横断的な検索を行うツールとして期待が大きい。 これに刺激される形で、Yahoo!、Ask Jeeves、Microsoft もβ版をいずれも今年中にリリースすると 公表している。

今までの全文検索機能との違い

おそらく来年のホットなトピックになるであろうデスクトップサーチであるが、 今までの検索ツールとは何が違うのだろうか。 たとえば今まででも、 Windowsではローカルなファイルを対象にした文字列検索が可能だったし、 UNIX であれば grep 等により、ファイルの文字列検索が可能であった。 ただし、この文字列照合は本質的に計算負荷が大きく、 大容量のファイル群の検索には適していない。 一方、デスクトップサーチでは、あらかじめどの文書にどんな単語が含まれているか、 逆にどの単語はどの文書に含まれているのかをデータベース化しておく。 これはインデキシングとよばれる方法だが、 インターネット検索や文書検索ではごく一般的な技術になっており、 フリーソフトの namazu や JustSystem の ConceptBase などの検索システムでは、 従来からこのような方法を用いてローカルなファイルの検索を可能にしている。

したがって、今後のデスクトップサーチでは、 イメージ等を含めた検索対象ファイルの拡大、 検索やインデキシングのパフォーマンス(特にリアルタイムでのインデキシング)、 検索結果の見せ方(インタフェース) あたりが技術的なキーポイントになるのであろう。

それは確かに便利だが…

ともあれ、デスクトップサーチ自体は非常に便利なものであるに違いないのだが、 ユーザから見れば、 そもそも見つけたいキーワードがわからなくて苦労することも多いし、 デスクトップマシンにそれほどたくさんの情報が格納されているわけでもない、 それよりWEB情報をもう少しパーソナライズしてくれた方が… という人も多いだろう。 デスクトップサーチをめぐる各社の競争激化は、 このような「ちょっと便利なソフト」 のデファクトを目指すこと以上のものがあるように思われる。それはなぜか? デスクトップサーチが目指しているものはもう少しその先がありそうである。

その先にあるもの

おそらく本当に重要なことは、 ローカルマシン上での検索が行える、ということではなくて、 そのインデキシング情報、そのものにある。 デスクトップサーチが用いるインデキシング情報は、 個人が保存している文書や検索したページなどのいわばサマリである。 ユーザがコンピュータを使って行っている仕事の内容、 あるいはパーソナルユースであればユーザの興味そのものが反映されているといってよい。 つまり、情報アクセスに関するユーザモデルを作るのに十分な情報源となりうるのだ。

情報アクセスに関するユーザモデルは当然機微性が高く、 非常に 危険でもあるのだが、同時にきわめて有用なものでもある。 たとえば、この情報を用いてWEB 情報やメールのフィルタリングをしたり、 情報提供者から見れば、効率的なマーケティングにも応用可能である。 ユーザの興味を反映して自律的に情報を収集してきたり、 秘書機能を持った自律的エージェントなどへの開発にも応用できそうである。 今までの研究では、 このようなパーソナライズ情報をいかにして収集するかというところがひとつのボトルネックとなっていたのだが、デスクトップサーチのインデクス情報は、 これを解決する可能性があるのだ。 ショッピングサイトやコンテンツ配信サイト、 書籍販売サイトなどインターネット上でのあらゆるサービスプロバイダが、 今後ユーザの趣味や興味にあわせたサービスを展開していくためには、 ユーザモデルを把握するための基盤がどうしても必要である。

デスクトップサーチの覇権を狙う競争は、 単なる一アプリケーションのデファクトを目指す争いではなく、 情報のパーソナライズといった次世代アプリケーションの一大潮流をリードするための争いなのである。