strangelet

Nullius addictus judicare in verba magistri

「私」は「心」を歌う -ラブライブ!の歌詞をテキストマイニングしてみた-

ちょっと前にジャニーズ系の歌詞をテキストマイニングするのがはてなで流行りましたが、同じことをラブライブ!でやってみました。

集計条件

  1. 楽曲一覧は「ラブライブ!の楽曲一覧(ニコニコ大百科)」を参照
  2. 歌詞は「歌詞タイム」を参照
  3. 分析ソフトは「KH Coder」を使用
  4. ユニット、ソロ、デュオ、トリオ曲などもすべて計上するが、A-RISEの曲は除外
  5. 表記ゆれは可能な限り補正(例えば「心」「ココロ」などはもっとも多く使われていた表記に修正)

集計結果

上述した条件で分析し、出現回数が多い順番に150語抽出した結果がこちら。

抽出語 出現回数 抽出語 出現回数 抽出語 出現回数
237 嬉しい 41 28
197 今日 41 28
154 41 27
hi 133 優しい 41 ah 26
みんな 123 happy 40 come 26
go 120 こっち 40 伝える 26
yeah 118 ダメ 40 in 25
love 107 感じる 39 ぷわぷわ 25
107 行く 39 25
105 baby 38 探す 25
101 on 37 cheer 24
101 worry 37 ひとつ 24
あなた 97 場所 37 ぴょん 24
you 87 想い 37 わーお 24
熱い 86 待つ 37 教える 24
好き 83 don’t 36 one 23
見る 79 どこ 36 sunny 23
oh 75 live 35 叶える 23
hey 72 強い 35 思い出 23
言う 70 35 捕まえる 23
明日 69 自分 35 本気 23
それ 67 進む 35 迷う 23
踊る 67 35 i’m 22
笑顔 65 泣く 34 lonely 22
知る 65 始まる 34 隠す 22
抱きしめる 60 say 33 遠い 22
la 57 yes 33 22
気持ち 54 33 願い 22
大好き 54 奇跡 33 見せる 22
忘れる 53 負ける 33 瞬間 22
let’s 51 予感 33 追いかける 22
楽しい 51 来る 33 不思議 22
笑う 51 32 know 21
day 50 走る 32 we 21
ここ 50 do 31 キラ 21
dance 49 消える 31 愛しい 21
見つめる 48 31 甘い 21
no 47 素敵 31 気分 21
一緒 46 終わる 30 21
元気 46 少し 30 思う 21
my 45 30 holiday 20
いつ 45 勇気 30 now 20
are 44 言葉 29 summer 20
幸せ 44 世界 29 wow 20
信じる 44 切ない 29 だいじょうぶ 20
heart 43 いつか 28 stage 19
変わる 43 歌う 28 最高 19
未来 43 決める 28 出会い 19
super 41 呼ぶ 28 飛ぶ 19
会う 41 28 miracle 18

これはこれで面白いデータではありますが、ちょっと問題があります。もっともわかりやすい例は出現回数25回の「ぷわぷわ」という単語。この語はゲーマーズアニメ第1期BD全巻購入特典CDに収録されている「ぷわぷわーお!」でしか使われていないのですが、曲中でめっちゃ連呼されているので出現回数でカウントすると上位150頻出単語としてランクインしてしまいました。同じように曲中でコールに使われている「hi」「yeah」などもかなり上位にカウントされる語として表中に表れてしまっています。

なので単純に出現回数で分析してしまうとこういった連呼されている語に結果が引っ張られてしまうので、カウントの仕方を「その単語が出てきた曲数でカウントする」という方法に修正しました。これであれば曲中で何度連呼されてもその単語は「1」とカウントされることになります。ここで知りたいのは「頻出した語」ではなく「多くの楽曲で用いられた語」なので、これで問題ない…はず。そしてこの条件で分析した結果がこちら。

抽出語 出現曲数 抽出語 出現曲数 抽出語 出現曲数
62 泣く 20 13
60 消える 20 捕まえる 13
59 進む 20 13
58 大好き 20 本気 13
53 来る 20 迷う 13
熱い 48 いい 19 欲しい 13
知る 43 奇跡 19 go 12
みんな 41 19 hi 12
気持ち 39 切ない 19 my 12
明日 39 19 こっち 12
言う 38 19 確かめる 12
36 伝える 18 叶える 12
見る 35 負ける 18 見える 12
抱きしめる 34 勇気 18 12
それ 32 いつか 17 出会い 12
ここ 30 ダメ 17 欲しい 12
楽しい 30 17 heart 11
感じる 30 会う 17 oh 11
笑顔 30 願い 17 yeah 11
信じる 28 17 愛しい 11
変わる 28 始まる 17 願う 11
love 27 17 希望 11
27 ひとつ 16 見せる 11
場所 27 世界 16 語る 11
忘れる 26 走る 16 向く 11
未来 26 追いかける 16 最高 11
you 25 甘い 15 瞬間 11
いつ 25 苦しい 15 届く 11
好き 25 15 飛ぶ 11
想い 25 決める 15 毎日 11
優しい 25 呼ぶ 15 are 10
24 思い出 15 say 10
一緒 24 思う 15 10
強い 24 15 10
少し 24 探す 15 10
待つ 24 遠い 14 季節 10
踊る 24 輝く 14 言える 10
どこ 23 激しい 14 考える 10
行く 23 終わる 14 出会う 10
今日 23 新しい 14 照らす 10
笑う 23 不思議 14 情熱 10
23 予感 14 絶対 10
あなた 22 揺れる 14 大きい 10
元気 22 14 10
幸せ 22 違う 13 dance 9
自分 22 歌う 13 let’s 9
素敵 22 気分 13 no 9
見つめる 21 教える 13 we 9
言葉 21 鼓動 13 運命 9
嬉しい 20 13 喜び 9

もっとも出現曲数が多かった順に「私」「心」「夢」「今」「君」「熱い」「知る」「みんな」「気持ち」「明日」など、上から下まで実に「ラブライブ!」らしい単語が並んでいるように思えます。が、ジャニーズ系の歌詞を分析した結果を参照してみると、抽出語の多寡はありますがどうやら同じような語が使われているようです。

basswhale.hatenablog.jp

もしかすると歌詞に使われる単語のバリエーションというのはそれほど多くなく、語の組み合わせ方によって楽曲のイメージ(ジャニーズっぽい、ラブライブ!っぽい)が形成されているのかもしれません。そしてもう一点気になったのは、

「えっ?『私』が一番?『僕』じゃなくて?」

という事。しかし何度調べ直してみてもやはり「私」が入っている楽曲は62曲あるのに対して、「僕」「僕たち」「僕ら」をすべて足してもこちらは19曲しかありませんでした。「ラブライブ!」の歌詞の人称代名詞といえば「僕」というイメージが強かったのでこれはちょっと意外な結果でした。これについては「僕」が冠せられている楽曲のタイトル(「僕らのLIVE 君とのLIFE」「僕らは今のなかで」「それは僕たちの奇跡」「僕たちはひとつの光」)のイメージが強すぎて、そちらに歌詞の印象が引きずられてしまっているようです。

もっとも「ラブライブ!」らしい曲は?

多くの楽曲で用いられる語が分かりましたので、この単語を使って逆に「もっとも『ラブライブ!』らしい曲」を調べてみました。考え方は実に単純で、「これらよく使われている単語が歌詞中にもっとも多く含まれている楽曲がもっとも『ラブライブ!』らしい曲なんじゃね?」と思った訳です。単語の頻出度によって重み付けをするべきなのかもしれませんが、計算が面倒だったので「頻出語が使われていたら歌詞中で何度出現しても『1』とカウントし、その数が多かった(使われている頻出語のバリエーションが多かった)楽曲をもっとも『ラブライブ!』らしい曲」としました。で、その結果。

9位(44語)

  • Angelic Angel

7位(45語)

  • 僕らは今のなかで

6位(46語)

  • 夏色えがおで1,2,Jump!

4位(48語)

  • Music S.T.A.R.T!!

  • Super LOVE=Super LIVE!

3位(49語)

  • 僕らのLIVE 君とのLIFE

2位(52語)

  • ススメ→トゥモロウ

1位(56語)

という訳で「Wonderful Rush」が「もっとも『ラブライブ!』らしい曲」という事になりました。

この楽曲について「リスアニ! Vol.14.1」にレビュー及び作詞された畑亜貴先生のコメントが掲載されているのですが、そこにはこんな感じで書かれています。

  • レビュー

「アニメ前夜を描く、最初の頂点」
現在のところμ'sのPVつきシングルでは最新にして、TVアニメ放送に向けてその勢いにさらなるブーストをかけたような、強力にアッパーな一枚。ストロングなバンド・サウンドが印象的な①(Wonderful Rush)では、冒頭のパワフルなシンガロングに始まり、押せ押せなサビでのユニゾンが心地良い……と思いきや2コーラス目からはラップに始まりその勢いはさらに加速していく。まさに、TVアニメ前夜というリリース当時の、『ラブライブ!』という作品の勢いを象徴しているよう。そして各パートが複雑化していくなかで晴れやかに歌いこなす彼女たちにも成長が伺える。μ'sの進化の最初のピークを目撃したようだ。

「みんなのものになる前の、わたしたちだけのμ's感」
この曲はもう、TVアニメに向けて疾走しなきゃ!みたいなイメージです。あとはTVアニメ化するちょっと手前の、“みんなのものになる前の、私たちだけのμ's感”というか。ちょっと、このときしか味わえないものというか、みんなに知られていくんだけど、その一歩手前っていいときじゃないですか?前夜みたいな。「あー、あのときはまだ知らなかったんだよなぁ」とかいう、初々しさとかね。自分で言語化できなくても、そういうのって聴く人も感じ取ったりとかするんじゃないかな?って。“もうあの感じは二度と来ない”っていう(笑)。成長の過程の女子たちの歌で、そのときにしか絶対できなかったっていうところが、いちばん自分はキュンとくるので。なので、まだ聴いていないファンの方には辿っていただければ、「ここか!」「そうなのか!」っていうのが感じられるかなと(笑)。

TVアニメになる前の「ラブライブ!」のありったけを詰め込んだ楽曲なのであれば、この結果にも納得できますね(笑)。

「サキガケ⇒ジェネレーション!」のエロシーンをテキストマイニングしてみた

解析ツールとして「KH Coder」を使用してます。また、ここでの「エロシーンのテキスト」とは、シーンモードにて鑑賞できる範囲を指します。

頻出語

まずは頻出する語の上位150を抽出してみました。

エロシーンだけあって性器表現が大量に抽出されてきます。その中でも栄えある頻出度ナンバーワンの語は「ま●こ」でした。以降は「言う」「ち●ぽ」「おっぱい」「腰」「ち●ちん」などと続いていきます。そしてそれらは「気持ちいい」「気持ちよい」「熱い」「好き」といった形容詞と共にテキストには記載されているようです。

ただ、実のところこれら以上に頻出した語があります。それは「おっ」「はぁ」「あぁ」といった「喘ぎ声に使われている」感動詞。これらについては形態素解析ツールが正確に分割してくれないので省いています。なのでここらへんを含めた分析については今後の課題ではあります。

共起ネットワーク

次に同じ段落にてよく一緒に出現する(共起する)語同士を結んだネットワーク図を作成しました。

f:id:efemeral:20140719225519p:plain

ここでは「膣内」「射精」と書いて「ナカダシ」と読むような定番の組み合わせを大量に見ることが出来ます。例えば「淫ら」な「水音」、「子宮」に「注ぐ」、「敏感」な「反応」、「腰」を「動かす」、「奥」を「突く」、「蠢く」-「膣壁」などなど。他には「膣口」-「広げる」-「左右」で「くぱぁ」を意味しているような繋がりや、「痛い」-「大丈夫」で「処女喪失シーン」が連想できたりします。後は図を元に「あるある、こういう語の組合せが(笑)」といった感じで探してみてください。

対応分析

これまではエロシーンのテキスト全体でみてきましたが、次に各ヒロイン毎にエッチシーンの特徴をみるために対応分析を行いました。

f:id:efemeral:20140720140852p:plain

このグラフの見方ですが、まず、原点(0,0)付近には特徴がない語が集まります。そして各ヒロインの方向にある語、そして原点から離れているものほど、そのヒロインに対して特徴的な語ということが示されています。そしてこの図からは次のような解釈が出来ます。

まずは杏音と桜花。この2人は図にプロットされた場所が非常に近いので、ほぼ似たような性癖を持っていると考えられます。桜花にとっては衝撃的な事実かもしれませんが。

f:id:efemeral:20140720140549j:plain

そしてこの2人のエッチシーンの特徴として、

  • 「激しい」「痛い」など強めなプレイの描写があるが「気持ちいい」と「感じて」いる
  • 「乳房」「挟む」など胸を利用した描写が多くみられる

などがあげられます。

次になつめですが、彼女におけるエッチシーンでの特徴語は「声」です。他の4ヒロインではエッチシーンで「声」に関する描写があまりありませんので、ほぼ彼女のエッチシーンに固有の表現になっているようです。まぁ、つまり「耳の穴をかっぽじって夏野こおりボイスを堪能しろ!」ということですね。

f:id:efemeral:20140720141321j:plain


そして友梨亜の場合。彼女には「セックス」「ペニス」など外来語の性器表現が多く用いられています。さすが「両親ともゲルマン系フランス人」。

f:id:efemeral:20140720143533j:plain

一見彼女の出自に合わせてエッチシーンが描写されているようにも思われますが、さて?また、彼女の場合「乳房」や「おっぱい」などの語から最も遠い位置に配置されているのも特徴的です。

最後に璃々子の場合。彼女のエッチシーンに特徴的なのは「愛す」「注ぐ」「受け止める」という語になります。これらの語はやはり他の4ヒロインではあまりみらないので、彼女のエッチシーンを特徴付ける語となっているようです。ただ、最も多く注いでいるのは「愛」ではなく「精液」のようですが。

これは「注ぐ」という語がどの語と組み合わさって出現しているのかを示した表で、「注ぐ」は多い順に「精液」「愛」「子宮」「全部」「膣内」などと共に記述されているのが分かります。

コンセプト集計

次に語単独の出現数ではなく、コンセプトでその特徴を調べてみました。例えば「ち●ちん」や「ち●ぽ」は「男性器」という1つのコンセプトとしてその数をカウントします。そしてそのコンセプトを数えるためのコーディングルールを以下のように設定しました。

男性器
ち●ちん or ち●ぽ or チ●ポ or ペニス or 鈴口 or カリ or 亀頭 or サキバシリ or 尿道 or 尿道口 or 精液 or せーし or 射精 or 勃起 or 先っぽ or 裏スジ

女性器
ま●こ or 膣内 or 愛液 or 膣口 or 子宮 or 子宮口 or 膣壁 or 膣奥 or 膣 or クリトリス or 割れ目 or 処女膜 or ヒダ or アソコ or 秘洞 or 秘肉 or 膣肉 or 秘裂 or 肉襞 or 陰唇 or 粘膜 or 水音 or 粘液 or 襞 or 女性器 or 純潔


おっぱい or 胸 or 乳房 or 乳首 or 谷間 or パイズリ or 乳肉 or 巨乳 or 下乳


口 or 唇 or 舐める or 吸う or 舌 or キス or 舌先 or 唾液 or 口内 or 吐息 or 吸引 or 掃除 or フェラ or 喉奥 or 喉 or 頬 or 飲む


おしり or アナル or 尻肉 or 尻

お漏らし
おしっこ or おもらし or 尿 or お漏らし

そしてそれを集計したのがこちら。

f:id:efemeral:20140720003727p:plain

四角のサイズが出現率を、色は残差を示しています。残差とは「男性器」を例にすると、杏音が「青」で桜花が「赤」になっていますがこれは、全ヒロインの平均的な「男性器」というコンセプトの出現率に比べて杏音が「少なく」、桜花が「多い」という意味になります。そしてこちらでもヒロイン毎の性的な傾向がみてとれます。

まずは杏音の場合。全ヒロイン中「尻」に関する描写が最も多いが、逆に「神々しい乳房」を持っているのにも関わらず「胸」に関する描写が若干少な目でした。

次に桜花の場合。突出しているのは「胸」。全ヒロイン中最大サイズは伊達ではなかったようです。また、「女性器」「男性器」の出現数も多いので彼女は「むっつり」スケベのようです。

なつめの場合は全体的に性器表現がおとなしめ。彼女のエッチシーンはこういった直接的に性器を示す単語をあまり用いないで描写されているようです。

そして友梨亜の場合。「胸」の描写が全ヒロイン中最も少ないのはやはり「胸囲の格差社会」のせいでしょうか。まぁ、ないものは使えないので仕方ないといえば仕方ないのですけど。逆に突出しているのが「女性器」の出現率。主人公とヒロインが連呼していますし、地の文でも多く書かれているようです。

最後に璃々子の場合。出現率が高いのは「男性器」と「胸」。特に「男性器」は全ヒロイン中最も高い出現率になっています。「お兄ちゃんのモノを弄ぶ妹」というイメージが湧いてきますが、実際にそうなのかまではちょっと追いきれていません。

クラスター分析

最後に各エッチシーンをクラスター分析して類似度を調べてみました。

f:id:efemeral:20140720003725p:plain

これによると性行為をしていないシーン(自慰など)はグループ化されないのですが、それら以外はおよそ「なつめ」「璃々子」「杏音・桜花・友梨亜」の3つに分かれるようです。

まず「なつめ」のエッチシーンはほとんどが類似していて1つのグループになっていますが、1つだけ「璃々子」のエッチシーンが入ってしまうようです。次に「璃々子」ですが、「なつめ」ほど強くグループ化されませんでした。「なつめ」グループや「杏音・桜花・友梨亜」グループにいくつかのエッチシーンが分散されてしまっています。そして「杏音・桜花・友梨亜」グループ。「杏音」「桜花」「友梨亜」はヒロイン毎に上手く別れず、この3人のエッチシーンは複雑に入り組んだグループになってしまいました。

補記

今回は「サキガケ⇒ジェネレーション!」を分析してみましたが、他にも「プリズム◇リコレクション!」と「カミカゼ☆エクスプローラー!」についても分析はしていて、これら3作品をまとめての分析もしています。それらについてはまたいずれ。