語れる監視カメラ

英国では飛行機の客室内に設置しようとし、日本でもメトロの駅や埼京線全線にも導入されるようになった監視カメラ。英国では500万台設置され(1,000台で1件しか問題解決につながらないと風当たりは強い)、都内にも8万台程度あるとされるが、犯罪の記録というよりも抑止効果が主な働きとして期待されている。今は黙々と監視および記録することが求められるカメラだが、雄弁になる技術は着々と進歩している。

監視カメラの進歩

監視カメラについては、CCDなどの撮像技術の向上と、IPネットワーク化が近年の主要な進歩とされる。システムとしては、冒頭のイギリスの飛行機への導入例のように、解析技術が進歩している。この事例では、カメラとマイクと爆発物検出器と解析システムを利用とあるが、空港や駅で使われている異常行動検出技術を飛行機内に持ち込むことになる。駅構内などにおける異常行動検出の事例は国内にもあり、不審人物やけんかなどを発見する。電車の遅れが無くなる分には、毎日電車通勤する身にとってありがたい。

一般にカメラのシステムとしては、「石頭なコンピュータの眼を鍛える」べく、力わざのパターンマッチングで画像認識力を高めているが、この方向で監視カメラも鍛えられていくようである。特に最近の注目したい動きは、監視カメラに「語ること」を求める動きである。

注目動向 – ストーリーテラーとしてのカメラ

最近の注目動向として、下記の2つのプロジェクトを挙げたい。

  1. I2T – イメージからテキストを
  2. The Mind’s Eye – ストーリーを語れるカメラ

I2Tは監視カメラからライブテキスト情報を生成する研究である。決してアスキーアート生成ではない。イメージから状況を文章化するものだ。 交通モニタリングやトラッキング用途を想定しているが、「何時と何時の間に車1が車2の後にここを通った」というような情報を生成する。画像検索やビデオ検索の際に、現状では画像やビデオ周辺のテキスト情報を基に検索をするところ、ビデオ画像そのものから生成されたテキスト情報で検索できるようになる。

The Mind’s Eyeは、軍事目的の研究である。現在のカメラはさまざまな条件下でも名詞に相当するものの認識はできるようになったので、次に、何をやっているのかという動詞に相当する部分を認識するというものだ。前線での偵察目的であり、画像を解析する人個人の感情や能力に左右されないスマートさを求められている。表向きは軍事用途ではあるが、民生用途で使えないたぐいの技術ではない。監視カメラの場合、背景が固定であり、解析は戦場よりも容易なはずである。

これらの技術が商用化した時に、監視カメラはかなり雄弁になる。

語るカメラのもたらすもの

カメラがストーリーを語れるようになるメリットとして、ひとつには人から興味のある部分を検索しやすくなることがあるだろう。例えば、Sensor Mapのように、広範囲のセンシング情報を地理情報とともに管理したい場合、検索やアラート設定がテキストベースで分かりやすく指定できたり、過去をさかのぼりやすくなったりする。また、防犯用途で記録され死蔵される、あるいは短期間で消去されるためのデータがテキストアーカイブ化されて、商圏における人の流れの解析など、他の公共用途にも使われる可能性もある。

なお、監視カメラには、公的なものばかりでなく、ペットや事務所などを監視する個人管理の無線ウェブカムも含まれる。現在の状況を良く表すパフォーマンスアートに”Life: a user’s manual“がある。男性が街をぶらぶらとスーツケースを引っ張って歩くのだが、その間2.4GHz帯の無線カメラの映像を傍受して、トランクケース上に映していくというものである。こうしたアートができること自体今だからこそと作者は言っているが、監視カメラは今でも ある意味十分に雄弁ということだ。テキストベースになって検索されやすくなった時には気持ち悪さが増す。

いずれにしても、監視カメラは数が単調増加しているだけではない。監視カメラが雄弁になると有効活用とその監視について議論を進めなければならない。