個人的な話で恐縮だが、年末にデジタルカメラを買いに量販店の店頭に行く機会があった。もはや画素数競争は1000万画素で頭打ちになりつつあるようだ。単純に画素数を増やしても大容量のメモリが必要になり、扱いにくいのが実情だろう。 そのような状況の中で、新たな差別化機能として、手振れ補正機能と顔認識によるオートフォーカス機能が当たり前になりつつある。このように、顔認識技術が一般的になり、安価な機器にも搭載され始めている。
顔認識技術のコモディティ化
2005年にニコン社のデジタルカメラに搭載されて以降、コンパクト型のデジタルカメラの多くには、顔領域を抽出し、絞りとピントを自動的に調整する機能が搭載されるようになっている。 技術的には、抽出(face detection)と呼ばれる技術であり、通常、処理する範囲を制限して高速化するために使われる。 また、顔認識技術と呼ばれる技術には、バイオメトリックスのような顔画像から特定の個人を識別(recognition)する技術もある。通常、識別処理をするの前処理として、抽出技術が使われている。
これらの製品に使われている技術は各社独自のものもあるが、アメリカの空港で使われていることが知られているFaceITや沖電気やオムロンといった外部が開発している技術を使用しているケースも多い。また、Intel社を中心にオープンソースソフトウェアとして開発を進めているOpenCVライブラリもある。このようにライセンス料や性能はともかく、誰でも使える環境が用意されつつある。
性能比較も始まる
デジタルカメラに搭載されている顔認識技術を様々な場面で試しているサイトや雑誌記事を見かける。 顔を印刷した写真や人形でも反応したり、横向きの顔にはあまり反応しなかったりということが多い。 当然ながら、認識技術といっても完全なものはなく、顔でないものを誤って認識したり、正しいものを見逃したりケースがある。 誤検出の割合と見逃し割合の両方を少なくすることが基本的な性能を向上させることになるが、一般にはそれぞれはトレードオフの関係にあるので、アプリケーションによってそのバランスが異なる。そのため、少し試す程度では、認識性能は簡単には分からない。
そこで、主に認証技術向けではあるが、顔認識技術を比較できるようにアメリカの政府機関であるNIST(米国標準技術局)がスポンサになり、共通のデータや性能測定方法を用意して、製品間の性能比較を実施している。FaceITで知られるIdentix社(現L-1 Identity Solutions社)、東芝などの企業やカーネギーメロン大学など各国からエントリーしており、製品の性能を比較した結果が見られる。また、経年変化した人や双子を見分けるような、より難しい技術の性能比較はFRGC(Face Recognition Grand Challenge)として実施している。
今後の方向性は
このように技術的な性能は実用レベルに達しており、既にデジタルカメラや携帯電話に搭載されているのはご存知の通りである。 しかしながら、せっかくの機能も利用者から評価されないと、コストが増えただけになってしまうし、コモディティ化が進んでいる顔認識技術は性能以外には差がなくなってしまう可能性もある。 そこで、ソニーのスマイルショットやオムロンのリアルタイム笑顔度測定といった技術開発や 任天堂DS用ゲームに使われるなど新たな分野にも広がっている。 DVD/HDDレコーダに搭載されれば、自分で撮影した大量の映像から子供の映る映像のみを高速に抽出したりできるように日も近いはずだ。
本文中のリンク・関連リンク:
- 世界初の顔認識搭載デジタルカメラ(ニコン社)
- 外部に提供されている顔認識技術
- FaceIT(L-1 Identity Solutions社,Identix社(旧))
- Face Sensing Engine(沖電気)
- OKAO Vision(オムロン)
- OpenCV(インテル)
- 笑顔認識
- スマイルショット(ソニー)
- リアルタイム笑顔度測定(オムロン)
- DS用ゲーム「大人のDS 顔トレーニング」(任天堂)
- 人物認識の3つのステージ(本コラム 2002/07/09)
- Face Recognition Vendor Test(米国NIST)