ハッピーホリデー!
秋葉原オフィスの @ceeflyer です。
秋葉原(UDX)もすっかり浮かれ模様ですね…
さて、ラボっぽいことを書こうと思い、今チャレンジしている画像処理のことについて書こうと思います。
とはいえ、画像処理(Computer vision)と一口に言っても、目的によって、下のようにいくつかの種類に分けることができるようです。例えば[1]の章立てでいうと、
- 画像変換(拡大・縮小など)
- 特徴検出(輪郭など)
- 画像結合(ストリートビューがいい例)
- モーション検知
- 3次元画像復元
- …
- 画像認識
- 物体検知
- 顔認識
- 物体認識
- カテゴリ認識
- コンテキスト(背景)・シーン認識
今回試してみるのが、代表的とも言える顔認識。
顔認識で有名な手法として Viola-Jones法[2]があげられます。
Viola-Jones法についての説明はGoogleにかけてみれば色々と出てくるとは思いますが、ここでは[3]のペーパーに載っていた方法で実装してみました。
ざっくり図に示すと、↓のような流れで特徴量を作って…
判別器を作る。
実装して…
人の顔では月並みなので、の顔を学習させてみましょう。
こちらは顔ではない方のデータ。
実際に動かすと…
お!
お…?
(以上、パシャっとmyペットより)うーむ、単純に適用させるのは難しいようです。だいたい100枚あって数枚が顔に領域がかかるくらい。でもこのエントリはここで終わりです。すみません。まだまだ教えこまないといけないですね。
Viola-Jones法とは直接関連しないのですが、最近ではディープラーニングと呼ばれる、人間の脳神経をモデルにした画像判別法が流行のようです。
(参考: [4] (C) IEEE)
そちらのほうもぼちぼち進めている感じです。
…さて、ここまでのエントリにツッコミを入れたい方、はたまたマルチメディアを扱うR&D業務をしてみたい方、弊社で働いてみませんか?
ぜひお待ちしています。
では、よいお年を!
[参考文献]
[1] Szeliski, Richard. Computer vision: algorithms and applications. Springer Science & Business Media, 2010.
[2] Viola, Paul, and Michael Jones. "Rapid object detection using a boosted cascade of simple features." Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. Vol. 1. IEEE, 2001.