Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
米ワシントン大学の研究チームが開発した「People as Scene Probes」は、一方向から撮影した映像の奥行きや光の当たり方を分析する深層学習ベースの技術だ。この技術を使うことで、影や「オクルージョン」(遮蔽物によって光の反射がさえぎられる度合い、環境遮蔽とも) を考慮したリアルな画像合成が可能になる。
映像内の物体から奥行き、オクルージョン、照明/影の情報を抽出し、新しく挿入する画像に適応することで自然な合成画像を生成するネットワークの概要図。下段の図では、手前の人物や奥の赤い車に対して適切な影が加えられている
今回の手法では、物体とシーンとの隠蔽関係をピクセルレベルで記録し、物体の位置に応じてどの画素がオクルージョンしているかを判断する。
次に、シーン内の物体がどのような影を保持しているかを分析し、ライティングマップを作成する。これにより、新しい物体を挿入した際に、その位置の環境に応じた明るさと太陽に対して正しい方向にある影を生成する。
影は、太陽の位置や天候、物体とシーンとの関係などで相互作用する複雑なタスクなため、GAN(敵対的生成ネットワーク)を用いて詳細に再構築できるように学習する。
最後に、奥行きに対して物体のサイズを調整する。シーン内の人物の身長と位置関係を分析することで相対的な高さを推定し、異なる位置でも適した高さの画像に変換できる。
このように、オクルージョン、影、奥行きの情報を新しい物体画像を挿入する際に適応することで、違和感の少ない合成画像に仕上げることができる。出力した合成画像を既存の類似手法と比較した結果、定性的に良好な成果も得られたとしている。
この技術を用いた合成画像を生成する編集ツールも開発している。
リアルタイムに編集される様子
関連記事
関連リンク
からの記事と詳細 ( 物体を追加しても影や回り込みをリアルに合成する技術 ワシントン大学が開発 - ITmedia )
https://ift.tt/2VJXLnZ
0 Comments:
Post a Comment