strangelet

Nullius addictus judicare in verba magistri

「サキガケ⇒ジェネレーション!」のエロシーンをテキストマイニングしてみた

解析ツールとして「KH Coder」を使用してます。また、ここでの「エロシーンのテキスト」とは、シーンモードにて鑑賞できる範囲を指します。

頻出語

まずは頻出する語の上位150を抽出してみました。

エロシーンだけあって性器表現が大量に抽出されてきます。その中でも栄えある頻出度ナンバーワンの語は「ま●こ」でした。以降は「言う」「ち●ぽ」「おっぱい」「腰」「ち●ちん」などと続いていきます。そしてそれらは「気持ちいい」「気持ちよい」「熱い」「好き」といった形容詞と共にテキストには記載されているようです。

ただ、実のところこれら以上に頻出した語があります。それは「おっ」「はぁ」「あぁ」といった「喘ぎ声に使われている」感動詞。これらについては形態素解析ツールが正確に分割してくれないので省いています。なのでここらへんを含めた分析については今後の課題ではあります。

共起ネットワーク

次に同じ段落にてよく一緒に出現する(共起する)語同士を結んだネットワーク図を作成しました。

f:id:efemeral:20140719225519p:plain

ここでは「膣内」「射精」と書いて「ナカダシ」と読むような定番の組み合わせを大量に見ることが出来ます。例えば「淫ら」な「水音」、「子宮」に「注ぐ」、「敏感」な「反応」、「腰」を「動かす」、「奥」を「突く」、「蠢く」-「膣壁」などなど。他には「膣口」-「広げる」-「左右」で「くぱぁ」を意味しているような繋がりや、「痛い」-「大丈夫」で「処女喪失シーン」が連想できたりします。後は図を元に「あるある、こういう語の組合せが(笑)」といった感じで探してみてください。

対応分析

これまではエロシーンのテキスト全体でみてきましたが、次に各ヒロイン毎にエッチシーンの特徴をみるために対応分析を行いました。

f:id:efemeral:20140720140852p:plain

このグラフの見方ですが、まず、原点(0,0)付近には特徴がない語が集まります。そして各ヒロインの方向にある語、そして原点から離れているものほど、そのヒロインに対して特徴的な語ということが示されています。そしてこの図からは次のような解釈が出来ます。

まずは杏音と桜花。この2人は図にプロットされた場所が非常に近いので、ほぼ似たような性癖を持っていると考えられます。桜花にとっては衝撃的な事実かもしれませんが。

f:id:efemeral:20140720140549j:plain

そしてこの2人のエッチシーンの特徴として、

  • 「激しい」「痛い」など強めなプレイの描写があるが「気持ちいい」と「感じて」いる
  • 「乳房」「挟む」など胸を利用した描写が多くみられる

などがあげられます。

次になつめですが、彼女におけるエッチシーンでの特徴語は「声」です。他の4ヒロインではエッチシーンで「声」に関する描写があまりありませんので、ほぼ彼女のエッチシーンに固有の表現になっているようです。まぁ、つまり「耳の穴をかっぽじって夏野こおりボイスを堪能しろ!」ということですね。

f:id:efemeral:20140720141321j:plain


そして友梨亜の場合。彼女には「セックス」「ペニス」など外来語の性器表現が多く用いられています。さすが「両親ともゲルマン系フランス人」。

f:id:efemeral:20140720143533j:plain

一見彼女の出自に合わせてエッチシーンが描写されているようにも思われますが、さて?また、彼女の場合「乳房」や「おっぱい」などの語から最も遠い位置に配置されているのも特徴的です。

最後に璃々子の場合。彼女のエッチシーンに特徴的なのは「愛す」「注ぐ」「受け止める」という語になります。これらの語はやはり他の4ヒロインではあまりみらないので、彼女のエッチシーンを特徴付ける語となっているようです。ただ、最も多く注いでいるのは「愛」ではなく「精液」のようですが。

これは「注ぐ」という語がどの語と組み合わさって出現しているのかを示した表で、「注ぐ」は多い順に「精液」「愛」「子宮」「全部」「膣内」などと共に記述されているのが分かります。

コンセプト集計

次に語単独の出現数ではなく、コンセプトでその特徴を調べてみました。例えば「ち●ちん」や「ち●ぽ」は「男性器」という1つのコンセプトとしてその数をカウントします。そしてそのコンセプトを数えるためのコーディングルールを以下のように設定しました。

男性器
ち●ちん or ち●ぽ or チ●ポ or ペニス or 鈴口 or カリ or 亀頭 or サキバシリ or 尿道 or 尿道口 or 精液 or せーし or 射精 or 勃起 or 先っぽ or 裏スジ

女性器
ま●こ or 膣内 or 愛液 or 膣口 or 子宮 or 子宮口 or 膣壁 or 膣奥 or 膣 or クリトリス or 割れ目 or 処女膜 or ヒダ or アソコ or 秘洞 or 秘肉 or 膣肉 or 秘裂 or 肉襞 or 陰唇 or 粘膜 or 水音 or 粘液 or 襞 or 女性器 or 純潔


おっぱい or 胸 or 乳房 or 乳首 or 谷間 or パイズリ or 乳肉 or 巨乳 or 下乳


口 or 唇 or 舐める or 吸う or 舌 or キス or 舌先 or 唾液 or 口内 or 吐息 or 吸引 or 掃除 or フェラ or 喉奥 or 喉 or 頬 or 飲む


おしり or アナル or 尻肉 or 尻

お漏らし
おしっこ or おもらし or 尿 or お漏らし

そしてそれを集計したのがこちら。

f:id:efemeral:20140720003727p:plain

四角のサイズが出現率を、色は残差を示しています。残差とは「男性器」を例にすると、杏音が「青」で桜花が「赤」になっていますがこれは、全ヒロインの平均的な「男性器」というコンセプトの出現率に比べて杏音が「少なく」、桜花が「多い」という意味になります。そしてこちらでもヒロイン毎の性的な傾向がみてとれます。

まずは杏音の場合。全ヒロイン中「尻」に関する描写が最も多いが、逆に「神々しい乳房」を持っているのにも関わらず「胸」に関する描写が若干少な目でした。

次に桜花の場合。突出しているのは「胸」。全ヒロイン中最大サイズは伊達ではなかったようです。また、「女性器」「男性器」の出現数も多いので彼女は「むっつり」スケベのようです。

なつめの場合は全体的に性器表現がおとなしめ。彼女のエッチシーンはこういった直接的に性器を示す単語をあまり用いないで描写されているようです。

そして友梨亜の場合。「胸」の描写が全ヒロイン中最も少ないのはやはり「胸囲の格差社会」のせいでしょうか。まぁ、ないものは使えないので仕方ないといえば仕方ないのですけど。逆に突出しているのが「女性器」の出現率。主人公とヒロインが連呼していますし、地の文でも多く書かれているようです。

最後に璃々子の場合。出現率が高いのは「男性器」と「胸」。特に「男性器」は全ヒロイン中最も高い出現率になっています。「お兄ちゃんのモノを弄ぶ妹」というイメージが湧いてきますが、実際にそうなのかまではちょっと追いきれていません。

クラスター分析

最後に各エッチシーンをクラスター分析して類似度を調べてみました。

f:id:efemeral:20140720003725p:plain

これによると性行為をしていないシーン(自慰など)はグループ化されないのですが、それら以外はおよそ「なつめ」「璃々子」「杏音・桜花・友梨亜」の3つに分かれるようです。

まず「なつめ」のエッチシーンはほとんどが類似していて1つのグループになっていますが、1つだけ「璃々子」のエッチシーンが入ってしまうようです。次に「璃々子」ですが、「なつめ」ほど強くグループ化されませんでした。「なつめ」グループや「杏音・桜花・友梨亜」グループにいくつかのエッチシーンが分散されてしまっています。そして「杏音・桜花・友梨亜」グループ。「杏音」「桜花」「友梨亜」はヒロイン毎に上手く別れず、この3人のエッチシーンは複雑に入り組んだグループになってしまいました。

補記

今回は「サキガケ⇒ジェネレーション!」を分析してみましたが、他にも「プリズム◇リコレクション!」と「カミカゼ☆エクスプローラー!」についても分析はしていて、これら3作品をまとめての分析もしています。それらについてはまたいずれ。