Lab. 情報メディア学科 小沢研究室

道路画像、スポーツ映像、書誌表面画像、楽器音の採譜の研究 情報メディア学科「小沢研究室」

第62回「NHK放送文化賞」受賞。
映像でスポーツ選手の動きを解析するなど、メディア情報処理の分野を開拓。

小沢先生(実は日常生活の中に溢れています。)

小沢先生からの問題

私が研究しているメディア情報処理・パターン認識という分野に関連する技術は、次のうちいくつに当てはまるでしょうか?
  • デジタルカメラの顔認識機能
  • 印刷物の文字読み取り
  • チェスや将棋などのゲーム
  • カーナビに搭載されている音声認識機能
  • 自動車のバックモニター
  • 1個
  • 3個
  • 5個

答えは、(3)5個が正解です。
メディア情報処理、またはパターン認識は、人間が鼓膜・網膜からパターンとして取り入れた情報を大脳が理解すると同じように、マイクやテレビカメラなどから入力したパターン情報をコンピュータに理解させるために行われます。
小沢研究室では「メディア情報処理・パターン認識」と呼ばれる分野を研究しています。

道路画像、スポーツ映像、書誌表面画像、楽器音の採譜の研究

画像や音声をコンピュータが読み取り、あたかも人間がするように判断することを目指しています。研究テーマは大きくわけられます。

画像中の移動物体を認識

道路に設置されたカメラの画像から通過する自動車の台数、事故や渋滞などの走行状況の検出、自動車に搭載されたカメラからの画像から周囲の状況を認識します。また、テニスの放送映像からは選手の動きを追跡して戦略を分析することなどが行われています。

文字認識

市販されているOCR(文字認識装置)※1は良くできていますが、草書体、古文書などは苦手です。古文書をデジタルカメラで撮影し、画像処理によりテキスト化することで、文学や歴史、防災などさまざまな研究を支援しています。

楽器の音や歌声

即興演奏や楽譜に表せない伝統音楽を対象にして、自動的に楽譜をつくることや競技かるたで詠みあげる声を入力して、なるべく早い段階でどの歌かを判断することなどを目標にしています。

このように人間なら簡単にできることをコンピュータやロボットに代わりにさせることを研究しています。研究室の学生は自分の興味のある対象を選んで楽しく研究しています。

※1OCR(文字認識装置)
手書きや印字された文字を読みとってデータ化する装置のこと。

有料道路の料金所にある監視カメラの映像をコンピュータで入力して、画像処理により料金所付近での車両の挙動を求めています。異常な走行をする車両には警告を与えます。

ギター、尺八などの楽器音から自動的に楽譜の作成を行うため、楽器音をコンピュータで解析し、その音の音階を抽出しています。

研究テーマの例

スポーツシーンの解析

スポーツシーンとしてはサッカー、テニス、体操競技の鉄棒を対象としています。
下の図は「サッカーにおけるオフサイドの判定」の例です。サッカーの映像を入力して、画像処理で得られた選手をそれぞれの色のボックスで表示しています。攻撃側が青色、守備側が黄色、ゴールキーパーは白色、審判は空色です。そのほかボールは白色ボックス、オフサイドラインを黄色の線で表示されています。これらの位置情報が得られればオフサイドのルールをプログラミングすることにより判定が可能です。
この研究が評価され第62回NHK放送文化賞を受賞しました。

次に「鉄棒競技における姿勢の判定」の例です。体の中心軸が空色の線で腰の位置がピンクの線で示されています。大車輪の場合には腰が曲がると減点です。
ルールブックにしたがってプログラミングすることにより自動採点が可能です。

「鉄棒競技における姿勢の判定」

ITSにおける画像処理

車両に搭載されているカメラからの画像を処理して自車両周辺の状況を判断します。また、道路の脇に設置されたカメラの画像処理によって車両の移動軌跡を求めることも研究しています。

(1)「後方の危険車両の検出」

(1)の図は後方の危険車両の検出を行っている例です。画像処理で検出した車両の前面に枠をつけています。
これから後続車両との相対距離、相対速度を算出して衝突の危険のある車両の枠は赤色になっています。

(2)「通過車両の検出」

(2)の図は高速道路の料金所に設置したカメラの下を通過する車両の検出を行っている例です。映像から画像処理で検出した車両に枠をつけています。
これら車両の軌跡を算出することで、車両の統計や危険な走行をする車両の発見が可能になります。

研究の進め方

どの研究テーマでも、まずはパターン情報の処理、次にテーマによって様々な判断の処理を行います。

研究室に入ると、まず、さまざまなテーマが共通に利用できる基礎的な情報処理の方法とそのプログラムについて勉強します。同時に興味が持てるテーマを探します。先輩の研究を参考にすることもできますし、自分で考え出せばもっと楽しいです。

テーマが決まると判断処理です。人間の判断の処理は大脳で行われ、子供のころからの経験に基づいているので明確でないことが多いのです。コンピュータの判断処理は目的に応じて判断の基準を明確にしてから、C++のプログラムに反映させます。

作ったプログラムを実行して、結果を考察するのが研究の最後の段階です。

小沢研究室では、大学院生と学部生が協力しながら楽しくがんばっています。ぜひ様子を見に来てください。

深宇宙探査機「UNITEC-1」の開発を振返って

深宇宙探査機「UNITEC-1」の開発を振返って