今、誰もが持っているデジタルカメラ。そこには多くの画像処理技術が使われている。 今回は身の回りに多く存在する画像処理技術とその今後について考えたい。
デジカメに利用されている画像処理技術
デジカメに使われている画像処理技術として、すぐにピンとくるものは顔認識技術であろう。 初めて搭載されたのは2005年であったが、今ではすっかりおなじみの技術である。 当初は単純に顔を識別するだけであったが、今では笑顔になった際にシャッターを押す技術や、登録した個人を識別してくれる技術、肌のくすみや顔のしわを修正してくれる技術まである。 すべて顔認識技術の応用であり、単純な顔の認識から、パーツの特定、動きの認識、属性の特定、個人の特定と認識の精度が上がるにつれて、様々なことが実用化されている。
手ぶれ補正技術についても画像処理技術が使われている。 手ぶれ補正には大きく分けて光学式とデジタル式、およびその二つを組み合わせたハイブリッド式がある。 最も一般的なのは、手ぶれをセンサによって感知し、レンズや撮像素子を移動させて補正を行う光学式の技術であるが、デジタル式では撮影後の画像に対して画像処理を行いブレを補正する。 また、撮った写真をつなぎ合わせてパノラマ写真を作ってくれる技術も一般的に搭載され始めており、利用している人も多いだろう。 これも画像処理である。
これらの技術は今もなお研究が進められており、特に手ぶれ補正の技術であったり、画像からの再構成の技術は活発に研究が行われている。
最先端画像処理技術の今
画像処理の最先端研究が集まるSIGGRAPHでは計算写真工学(Computational Photography)というセッションがある。 ここでは毎年興味深い研究が発表されている。SIGGRAPH2007 では、MERLとノースウエスタン大学から、一眼レフカメラの絞りに特殊なパターンのマスクをはさみ、撮影後の演算処理でピントの位置を変える方式が発表された。 また、SIGGRAPH2009においては、ウィスコンシン大学とアドビシステムズより、ブレが生じているビデオを後からソフトウェア的に修正してくれるという研究も発表された。 この研究では、特徴点の抽出を行ない、それを元に3次元的なカメラの動きを推定し、補正を行っている。 将来的には、撮ったあとの映像や画像に対して手ぶれ補正が行われたり、ピントの位置を後から変えるという編集が実現するかもしれない。
また、画像からの再構成という点では、パノラマ画像の生成のような、複数の画像から新しい画像を生み出す研究はますます活発になっている。 特に、最近では、インターネット上にアップされている膨大な画像を使うというのが一つのトレンドである。 例えば、観光地にいって写真を撮るときに、通行人や車といった障害、もしくは写りが悪くなる工事現場などが範囲内にあってきれいな写真が撮れなかったということはないだろうか。 そういうときのために、画像の修正したい部分をインターネット上にアップされた大量の画像を使って、それらしいものを集めて補間してしまう研究が行われている。 また、様々なユーザが撮影しインターネット上にアップした大量の画像に基づいて、ローマの街全体を3次元復元してしまうプロジェクトもある。2Dから3Dを構築するという点では、インターネット上にアップされている画像を使うわけではないが、部屋内を一通り撮影した写真から、自動で建物の3Dモデルを計算・構築し、テクスチャまで貼りつけてくれるという研究まである。
個人の力は通用する
これらの最先端の画像処理研究で、存在感をみせているのはやはりマイクロソフトやアドビシステムズといったIT業界の巨人たちである。 製品やサービスに関わる重要な技術であり、継続的に多くの研究者と予算を投じており、一日の長がある。 しかしながら、これらの技術はカメラとPCさえあれば誰でも開発、研究できるものであり、顔認識や物体認識、追跡といった基本的な処理のサンプルを含めたOpenCVのようなライブラリもフリーで公開されている。 実際に、今デジタル手ぶれ補正技術としてauやソフトバンクの一部の携帯に搭載されている「PhotoSolid」は、画像処理技術を専門に研究を行ってきた東京大学出身の技術者が立ち上げたベンチャー企業モルフォにより開発されたものである。
また、近年では、カメラの付いたスマートフォンの普及により、スマートフォンアプリとして、そのような先端技術を手軽に試すことができるようになっている。 さらに、試すだけでなく、開発者にとっては、自分が開発したアプリを簡単に市場に投入できるようになり、「PhotoSolid」が開発された際よりも市場化への敷居は格段に低くなっている。
画像処理技術の進歩は著しい。 今後、デジタルカメラが高機能化するだけでなく、デジタルアーカイブやライフログ等、多くの応用先が考えられる。 そして、これらの技術は個人でも開発可能なものばかりである。 一大学生であっても、一会社員であっても、自ら開発したスマートフォンアプリを市場に送り出すことのできる世の中である。 画像処理技術に身の回りで触れることが多くなった今、個人の力を中心に、画像処理技術が盛り上がることを期待したい。 そして、マイクロソフトやGoogleのようなIT業界の巨人をあっといわせるような技術がどこぞの知らない個人から出てくる、そんな世の中に期待する。
本文中のリンク・関連リンク:
- ソニーの顔画像認識技術
- SIGGRAPH2007
- SIGGRAPH2009
- 一眼レフカメラの絞りに特殊なパターンのマスクをはさみ、撮影後の演算処理でピントの位置を変える方式を提案した MERLとノースウエスタン大学による研究
- ブレが生じているビデオを後からソフトウェア的に修正するウィスコンシン大学とアドビシステムズによる研究
- 画像の修正したい部分をインターネット上にアップされた大量の画像を使って、それらしいものを集めて補間してしまう研究CMUによる研究
- ワシントン大学等による、インターネット上にアップロードした大量の画像に基づいて、ローマの街全体を3次元復元してしまうプロジェクト 「Building Rome in a Day」
- 部屋内を一通り撮影した写真を使って、自動で建物の3Dモデルを構築し、テクスチャまで貼りつけてくれるというワシントン大学とマイクロソフトによる研究
- 東京大学出身の技術者が立ち上げた株式会社モルフォが開発した、画像処理による手ぶれ補正技術「PhotoSolid」