PAPER

2017.05.01 Up

Posted by Nao Tokui

シーンの大域的かつ局所的な整合性を考慮した画像補完 – “Globally and Locally Consistent Image Completion”

シーンの大域的かつ局所的な整合性を考慮した画像補完 – “Globally and Locally Consistent Image Completion”

一部が欠損した画像をもとどおりに補完する「画像補完」 Inpainting のタスクは、Deep Learningの分野ですでにいくつも先行研究がありますが、今回発表された論文は精度が格段に向上していることが見てとれます. 下のビデオとあわせて、webサイトのデモビデオをご覧ください.

補完された画像全体を入力として、全体的に整合勢のある構造になっているかを評価する帯域識別ネットワークと、補完領域のみの詳細な自然さを評価する局所識別ネットワークの二つの識別ネットワークを用意したのがポイントだそうです。

補完ネットワークは識別ネットワークが見分けられないように,識別ネットワークは補完ネットワークの出力画像を見抜くように,それぞれのネットワークを交互に学習していくことで補完ネットワークに自然な画像補完を学習させている

ということでGAN的な実装になっていると思われます.

机の上の花瓶をブラシで消すと… 見事に背景が補完されていますね! その自然さに驚かされます.

本研究では,畳み込みニューラルネットワークを用いて,シーンの大域的かつ局所的な整合性を考慮した画像補完を行う手法を提案する.提案する補完ネットワークは全層が畳み込み層で構成され,任意のサイズの画像における自由な形状の「穴」を補完できる.この補完ネットワークに,シーンの整合性を考慮した画像補完を学習させるため,本物の画像と補完された画像を識別するための大域識別ネットワークと局所識別ネットワークを構築する.大域識別ネットワークは画像全体が自然な画像になっているかを評価し,局所識別ネットワークは補完領域周辺のより詳細な整合性によって画像を評価する.この2つの識別ネットワーク両方を「だます」ように補完ネットワークを学習させることで,シーン全体で整合性が取れており,かつ局所的にも自然な補完画像を出力することができる.提案手法により,様々なシーンにおいて自然な画像補完が可能となり,さらに従来のパッチベースの手法ではできなかった,入力画像に写っていないテクスチャや物体を新たに生成することもできる.これにより,人間の顔の一部を補完するような,複雑な画像補完を実現した.

TAG