DATASET

2017.03.27 Up

Posted by piqcy

人気があるから綺麗とは限らない!? – An Image is Worth More than a Thousand Favorites: Surfacing the Hidden Beauty of Flickr Pictures

人気があるから綺麗とは限らない!? – An Image is Worth More than a Thousand Favorites: Surfacing the Hidden Beauty of Flickr Pictures

人気がある写真は綺麗なはず。つまり、人気がない写真はそれほど綺麗でない・・・かというと、そうでもないようです。

この研究では、Flickrに投稿された写真に対して、一般の人に5段階の「綺麗かどうか」のスコアをつけてもらっています(もちろん、人気の度合いは知らせずに)。

そのデータを用いて色やコントラストなどの特徴から「綺麗さ」を予測するモデルを作り、「人気がない(favoriteが5つ以下の)」写真から最も綺麗な写真を選抜したところ、人気があるものに比べそのスコアは平均で1.5%しか変わらなかったそうです。

この研究で利用されたデータは、著者らのホームページからダウンロードすることができます。
「評判に左右されない」画像を使いたい時に役立つと思います。

arXiv(2015.05.13公開)

The dynamics of attention in social media tend to obey power laws. Attention concentrates on a relatively small number of popular items and neglecting the vast majority of content produced by the crowd. Although popularity can be an indication of the perceived value of an item within its community, previous research has hinted to the fact that popularity is distinct from intrinsic quality. As a result, content with low visibility but high quality lurks in the tail of the popularity distribution. This phenomenon can be particularly evident in the case of photo-sharing communities, where valuable photographers who are not highly engaged in online social interactions contribute with high-quality pictures that remain unseen. We propose to use a computer vision method to surface beautiful pictures from the immense pool of near-zero-popularity items, and we test it on a large dataset of creative-commons photos on Flickr. By gathering a large crowdsourced ground truth of aesthetics scores for Flickr images, we show that our method retrieves photos whose median perceived beauty score is equal to the most popular ones, and whose average is lower by only 1.5%.