新緑ノスタルジア

生きていくのがVERY楽しい

スマイレージ・アンジュルムの歌詞抽出・分析、、、してみた。

※タイトルは道重さゆみさんリスペクトです

またかよと言う声が聞こえてくる気がしますが味を占めたのでまたやります。

この作業、慣れてしまえば1時間もかからずできてしまうので結構楽して面白いデータが得られるんですよね……文明の利器……。

今回はスマイレージアンジュルムの歌詞を分析、そのデータを比較してそれぞれの類似点や違いを明らかにしていこうと思います。

※集計に関する注意事項

  • 歌詞は「歌ネット」に掲載されている情報に基づき、スマイレージ49曲、アンジュルム44曲分を入力*1
  • ハロ内外問わずカバー曲は除外
  • アンジュルムのみ)ソロ曲、ユニット曲も計上
  • 「○○ がんばらなくてもいいんだよ!!」「○○ がんばらなくてもええねんで!!」、「夢見た 15年」「わたしの夢見た 15年」はそれぞれ両方計上
  • 動詞はすべて原型として考える
  • 集計、分析結果のミスはすべて筆者の責任とする

今回も歌詞のテキストデータ化にはこちら↓の記事を参考に「Lyrics Master」を、

prehyou2015.hatenablog.com

語句の抽出、分析用に「KH Coder」を使用した。

それでは早速見ていきましょう。今回はスマ・アンジュ同時にデータを見ていきます。

頻出語句150

まずは頻出語句から。どちらも左の列から順に1~50位、51~100位、101~150位。

f:id:lelelettuce:20200812163120p:plain

f:id:lelelettuce:20200812163139p:plain

それぞれ青色は「概ね予想通り」だと思った単語、赤は「気になる」単語、アンジュにしか登場しない*2黄色は印象的なワンフレーズを繰り返す曲が多いな……?と気づいたのでそれを表している。「恋はアッチャアッチャ」だけで48回も「Accha」と言っているのは驚き。

……それで、データで比べてみると方向性の違いがものすごくわかりやすくなる。

まずスマで上位20位以内に入っていた「笑顔」がアンジュだと51~60位圏と一気に割合が低くなる。「涙」についてはスマでもアンジュでも圏内入りしているが、アンジュだと「泣く」「泣ける」が新たに見られるようになり泣くこと、涙についての表現の幅の広がりが見られる。この二点はスマイレージアンジュルムそれぞれのグループ名の由来とも大きくかかわるため、それがデータでも現れたことはとても面白い結果と言える。

一方、「私」と「君」の違いはどうだろうか。スマでは大きく差をつけて「私」の方が多いが、アンジュではほぼ同数である。このことから「私」の心情の揺れ動きを主に歌ってきたスマイレージ、そこから「君」ともより多く対話するようになったアンジュルムという比較もできるだろう。

また、スマイレージになくてアンジュルムにあるのが「熱い」である。たしかに「大器晩成」以降の流れを汲んだ熱くなれる楽曲が「アンジュルムらしい」と言われるようになっていったので納得。この路線変更をより印象付けるために、「次々続々」あたりまでパワーのある同じフレーズを繰り返した曲が多かったのだろうか、とも思った。

そして、どちらでも上位に入っているのが「愛」「好き」。一見同じように見えてもスマイレージの「愛」「好き」はそのほとんどが恋愛感情について歌ったもので*3アンジュルムになるとそれ以外の愛情全般(桃奈が言うところのBIG LOVEである)についても広く歌われるようになる。

私としてはなんとなく当初の予想通りだな~と感じたんですが皆さんはどう感じましたか?

共起ネットワーク図

f:id:lelelettuce:20200812172553p:plain

f:id:lelelettuce:20200812172626p:plain

抽出したデータをもとに作った共起ネットワーク図も用意して見ました。この図からは

  1. どの単語が近い関係にあるのか(単語同士の距離)
  2. 単語どうしの繋がり(単語を結ぶ線、太くて濃いほど強い繋がり)
  3. 単語の登場頻度(円が大きいほど頻出)

を読み取ることができます。比較的強く結びつきグループ化した単語同士は同じ色で表されています。

どちらも「愛」がかなり存在感強めですけど(アンジュルムは愛進愛退の影響がかなり強そう)繋がる単語が全然違うのが面白い。時代は「来る」ものなスマと「変える」ものなアンジュ。あとスマだと「夢」と「恋」が繋がってるのが可愛いですね。

この辺を見ていくとかなりそれぞれの方向性の違いがわかりやすくなったのではないでしょうか。

おまけ・形容詞で見るスマ・アンジュ

KH coderを使うと品詞別の抽出語句も見られるのですが、データを眺めていると形容詞に特徴が表れていると思ったので「形容詞(漢字入り)」から上位20個、「形容詞B(オールひらがな)」から上位10個ずつ抜き出してみました。

f:id:lelelettuce:20200812182659p:plain

f:id:lelelettuce:20200812182712p:plain

これがスマイレージで、

f:id:lelelettuce:20200812182805p:plain

f:id:lelelettuce:20200812182817p:plain

これがアンジュルム

(「ない」と「いい」のことを考えてもうちょっと下まで出せばよかった)

やっぱり「楽しい」が上位に来るスマイレージ、「熱い」が上位に来るアンジュルムで端的に個性の違いがわかる。

結びにかえて

やっぱりデータにするとそれまで何となく感じていた雰囲気の違いが数字や図といった目に見える形になってわかるので面白いですね。あと何年かしたら和田リーダー体制のアンジュルム―竹内リーダー体制のアンジュルム、と比較もできそうなのでそこも楽しみ。反省点としてはハロ内の他のグループとも比較できたらと思いました。*4

*1:そのため一部の舞台挿入歌などは対象外

*2:あえてスマに入れなかったのは後述

*3:「女」「女の子」「恋愛」が多いのも頷ける結果

*4:特にスマイレージはカバー元のグループの傾向と比較しても良かった