• 28
  • Oct, 11

Word clouds van songteksten voor de jaren 60, 70, 80, 90 en 2000

Word clouds van songteksten van de jaren 60, 70, 80, 90 en 2000Zongen artiesten in de jaren 60 over hele andere dingen dan waar hedendaagse artiesten over zingen?

Om dit te onderzoeken heb ik bijna alle songteksten van de liedjes uit de Billboard Top 100 lijsten van 1960 – 2009 verzameld (~4200 liedjes) en per decennium verwerkt tot een word cloud.

En dat leidde tot deze word clouds:

Jaren 1960-1969

Word cloud songteksten van de jaren 60

Jaren 1970-1979

Word cloud songteksten van de jaren 70

Jaren 1980-1989

Word cloud songteksten van de jaren 70

Jaren 1990-1999

Word cloud songteksten van de jaren 70

Jaren 2000-2009

Word cloud songteksten van de jaren 70
Voor deze afbeeldingen heb ik gebruik gemaak van Wordle

Beperkingen van dit onderzoek

Dit onderzoek heeft een aantal beperkingen. Zo heb ik me alleen op de Amerikaanse Billboard Top 100 jaarlijsten gericht. Het zou ook leuk zijn om dit voor Groot Brittannië en Nederland in beeld te brengen (maar het is moeilijker om aan die songteksten te komen). Bovendien betreft dit hitparade muziek. Vermoedelijk zal het er heel anders uitzien wanneer er bijvoorbeeld onderscheid wordt gemaakt naar genre.

Verder heb ik bij het maken van deze clouds standaardwoorden als I, you, they, the etc. weggelaten. Het lijkt wellicht interessant om word clouds te creëren waarin deze woorden wel voorkomen, zodat we misschien kunnen zien of we bijvoorbeeld vaker over onszelf zingen dan in de jaren 60. Maar dat laat nauwelijks verschillen zien:

Word cloud - verschil tussen 60s en 2000s bij het niet verwijderen van standaardwoorden

De standaardwoorden laten geen verschil zien tussen deze twee perioden en omdat ze zo vaak voorkomen, krijgen de iets minder frequente woorden geen ruimte om verschillen te laten zien. De standaard woorden kunnen dus beter weggelaten worden.

Beperkingen van word clouds

Daarnaast zijn word clouds verre van perfect, o.a. door:

  • Woorden worden willekeurig in wisselende kleuren in de cloud geplaatst
  • Langere woorden krijgen verhoudingsgewijs meer aandacht
  • Variaties (got/gotta/Got/Gotta etc.) worden niet samengevoegd
  • Woordparen (zoals New York) worden uit elkaar gehaald

Verder zijn de bronbestanden niet perfect, waardoor een woord als ‘Chorus’ helaas ook in deze clouds opduikt. Het normaliseren en filteren van deze bestanden lijkt me hierbij wenselijk (maar kostte me teveel tijd).

Desondanks deze beperkingen laten de word clouds toch leuke dingen zien.

All You Need Is Love 😉

De mooie boodschap van deze clouds is dat Love door de jaren heen het meest frequente woord in deze liedjes is. Daaruit concludeer ik dat de populaire liedjes nog steeds voornamelijk over hetzelfde gaan als in de jaren 60: De liefde!

Toch daalt de frequentie van dit woord langzaam en in 2000-2009 is het niet meer het belangrijkste woord. Like en Know nemen de koppositie over. Ook verliezen ‘zoete’ woorden als Baby en Heart populariteit.

Verder zie ik een groei in alternatieve spellingen. Woorden als luv, ya, gotta zie ik alleen maar in de cloud van 2000-2009. Dit past bij de tijdgeest omdat dat volgens mij ook in andere media waar te nemen is.

Oh ja, ik zie in de cloud van 2000-2009 ook het woord shit opduiken. Dat sluit volgens mij aan bij de geleidelijke acceptatie van controversiële woorden in liedteksten.

Totaal 1960-2009

Tot slot nog deze word cloud waarin alle bovenstaande zijn samengevoegd.Word cloud songteksten van de jaren 70Ik vraag me af of er een verband bestaat tussen het maken van liedjes waarin deze hoogfrequente woorden voorkomen en de hitpotentie ervan. 😛

Enfin, zie jij nog opvallende dingen in deze clouds?

Lezers van dit bericht lazen ook:
-Word cloud quizzen van hits uit de jaren 1980-1989
-Word cloud quizzen van hits uit de jaren 1970-1979
-Word cloud quizzen van hits uit de jaren 2000-2009

5 reacties

  1. Het blijft ook een probleem, dat homonymen voor hetzelfde woord worden aangezien: like is daar een goed voorbeeld van (I like you – with a girl like you). Maar toch wel leuk.

  2. Goede aanvulling, dat is idd ook een beperking van word clouds.

  3. Wat een leuke blog! 😀

  4. ik heb het idee dat in 60 en 70 tot 1990 met name de liefdes liedjes voornamelijk wat ik kan/wil doen voor jou zijn en de laatste jaren veelmeer wat jij kan doen voor mij zijn. Heb jij die indruk ook of ligt het aan mij?

  5. Interessante bevinding!
    Ik heb hier nooit bij stilgestaan, maar om hier een beetje inzicht in te krijgen, is het wellicht handig mijn Billboard Hot 100 lyrics analyse tool te gebruiken.

    Hierin kun je zoeken op 1 of 2 woord termen in bijna alle engelstalige liedteksten van liedjes die ooit de US Billboard Hot 100 (1956-2016) hebben bereikt.

    Misschien komt je vraag overeen met een vergelijking tussen de termen ‘for you’ en ‘for me’, zie:
    https://www.petermeindertsma.com/lyrics/?searchterm=for+you%2C+for+me

    Hierbij lijkt deze verhouding redelijk constant/gelijk, met uitzondering van een ‘for you’ piek/overschot in de 80s en 90s.

Reageer op dit bericht!