顔が鮮明でカメラに近ければ、風景の中でそれらの位置を特定することは容易だ。しかし、個々の顔が小さな、グループ写真の場合はどうだろう?これが、私が思うに、ロボットにはより難しいのだ。
カーネギーメロン大学のロボット工学の准教授Deva Ramananと、ロボット工学のPh.D.学生であるPeiyun Huは、映像のコンテキストを評価することでこの課題に挑んでいる。単に2つの眼と口だけを見る代わりに、システムは体、腕、脚、その他の、顔が近くにあることを示唆する部位も探す。
「それは誰かの手に持たれた爪楊枝を特定するようなものです」とRamanan。「もしだれかが爪楊枝を使っているのだろうというヒントがあるなら、爪楊枝の位置特定は比較的容易です。その目的のために、指の方向や、手の動きや位置が主要な手掛かりとなります」。
システムを使うと「エラーが半分に減り」、発見された顔の81%が本当の顔だった(「従来の手法では29から64%の発見率だった」)。例えばこの手法を使うと、携帯電話があなたと猫の顔を取り違えることはない。このシステムはまた、群衆の中の小さな顔を見つけ、よりよい人数の数え上げを行うことができる。
リリースから:
彼とHuが開発した手法は、人間の視覚が構成される方法に似たやり方でコンテキストをエンコードする「中心窩記述子」(foveal descriptors)を用いている
スポンサーリンク
群衆写真中の小さな顔の位置を特定する新技術
最近の投稿
- 【人気特集】日本パレットレンタルで社長解任の「クーデター」勃発・SBS鎌田社長が目論む1兆円企業への勝算 – 見逃し厳禁!編集部イチ推し 人気特集
- Instagram Threads adds ‘Use Media’ feature for resharing photos and videos
- 船橋市長肝いり「災害拠点病院移転建て替え計画」に問題続出!入札中止でも強行か? – 医薬経済ONLINE発
- 売り手有利&早期化が進む就活戦線――“新卒採用の課題”は何か? – HRオンライン
- 【データから見る】Instagram広告
- 大阪メトロ「万博の玄関口」夢洲駅の実力は? 大勢の来場者を想定、広大な"近未来"地下空間 | 駅・再開発 | 東洋経済オンライン
- 「え、不倫から生まれた名作!?」与謝野晶子が批判の嵐を超えた理由 – ビジネスエリートのための 教養としての文豪
- 頭はいいけど「仕事ができない人」が「業務を丸投げ」されたときにやりがちなNG行動 – ベンチャーの作法
- Perplexity acquires Carbon to connect AI search to your work files
- ロシア、シリアからリビアに高性能兵器を移動 – The Wall Street Journal発
コメント