e621データに見る人気ポケモン仲良し♥ 関係の可視化
はじめに
先日のエントリで、ケモノ系イラスト投稿サイト e621 データを利用して、ポケモンの(性的な意味で)人気ランキングを集計しました。
今回は同じデータを用いて「ポケモンがイラストに描かれるときの組み合わせ頻度」を解析してみます。
例えば、ルカリオはミミロップとよく一緒に描かれる気がしますし、ブイズはブイズ同士で、御三家は御三家同士で複数匹が一緒に描かれてる気がします。
その疑問を、e621のタグデータを使うことで、ポケモンたちの仲良し関係を明らかにしたいと思います。
本項では、導入としてイーブイズの関係を解析したのち、投稿枚数が上位のポケモンの関係を可視化しました。
手法
Python Pandas で処理したデータに対し、KH Corder を利用することで階層的クラスター分析および共起ネットワーク分析を実施しました。
クラスター化法にはWard法を、類似度指数にはJaccard係数を利用しました。
また、イラストのタグに 'doujinshi' や 'comic' が付いているものや、差分が存在するデータは、組み合わせの重複カウントを避けるために除外しました。
結果
ブイズの関係性
手始めに、投稿枚数TOP20のうちに9匹すべてがランクインした、大人気ポケモン イーブイズの関係性を調べました。
まず、ブイズ9匹間のうち、2匹のカップルとして描かれているイラスト 3514枚を抽出し、組み合わせをカウントしてヒートマップで見てみます。
エフィ/ブラ、グレ/リフィの組み合わせはあるあるですね。
よく見ると、シャワーズのカップリングが他ブイズと比べてやや少ないですね。
シャワーズ同士が多いのか、もしくは単体で描かれやすいのか......。
この『2匹のカップルイラスト』という縛りでは、複数匹で描かれるイラストが外れてしまう・投稿数の多いポケモンに大きなバイアスがかかる問題があります。
この問題の解消のために、ブイズのみが登場する全イラストを対象に、一枚のイラストに同時に現れる(共起する)頻度を解析する、共起ネットワーク分析を行いました。
クラスタ的に近いものが同じ色で分けられて、カウント数が多いほど円(ノード)が大きくなります。
線の太さは仲良し度の強さを示します。
このようにすると、シャワーズはブースター・サンダースたちと一緒に描かれていることが見て取れます。
また、イーブイとニンフィアはブイズ全員に対してほどよく仲が良く、要するに浮気性なのでしょう。
人気ポケモンの関係性
上のブイズと同様の手法で、投稿枚数TOP100のポケモンに対して共起ネットワーク分析を実施しました。描画数は150で、81匹が載っています。
やはり似たタイプのポケモンは同じクラスタに集まる傾向があります。
ガブリアス-フライゴンや、リザードン-カイリューなど、どこかで見た組み合わせも目立ちますね。
ジャローダ-ミロカロス-ハクリューなんかも、胴体が長いやつ繋がりでしょうか。
映画やポケモンダンジョンを思い出させる組み合わせも見られます。
最後に、クラスタごとの関係性をより明確にするため、投稿枚数TOP100のポケモンで階層型クラスタリングを行いました。
近い位置に配置されたポケモン同士が、仲良し度合いの高い組み合わせであることを示します。左側の棒グラフは投稿枚数です。
イーブイズの圧倒的な団結力を感じますね。
おおまかにはネットワークと同様で、進化系やタイプで固まっています。
細かく見ていくと、なかなか考察しがいのある結果ではないでしょうか。
所感
アニメや映画、ゲームは基本一緒なので、カップリングイメージは日本と海外でもそう変わらない感じがしますね。
気が向いたらpixivのポケモンイラストをクローリングして、具体的に比較してみたいです。
おまけ
ポケモンのイラストと一緒に記載されている(共起する)タグを、上と同様に共起ネットワーク分析によって可視化しました。
解析対象は、投稿枚数No.1:ルカリオです。
ルカリオ(lucario)
なるほどなぁ。
*1:厳密には、e621には多数の日本国内の作品が投稿されていますが、海外Furryサイトという視座で扱っています。