Tekstanalyse in de praktijk: Twittersentiment op het WK 2018

Het wereldkampioenschap voetbal in Rusland biedt geweldige mogelijkheden om creatief te zijn met data en analyse. Sowieso is dit niet meer weg te denken uit het moderne voetbal. In de top zijn al jonge laptoptrainers actief die met behulp van statistische analyses en heel veel data de ultieme voetbalmachine proberen op te tuigen.

Alle droge statistiek ten spijt: voetbal drijft nog altijd voor een groot deel op emotie.  Zeker tijdens het WK voetbal houden hele volkeren hun adem in als hun nationale trots strijdt voor eeuwige roem. Ook ik rijd graag mee in de emotionele achtbaan van zo’n wedstrijd.

Het leek mij daarom leuk om eens die achtbaanemoties te meten. Nu Oranje schittert door afwezigheid heb ik ervoor gekozen om de halve finale tussen Kroatië en Engeland emotioneel te analyseren. Centraal staat het Engelse perspectief. Mijn Kroatisch is niet wat het geweest is…

Hoe doe je zoiets?

Twitter is een geweldige manier om te achterhalen wat grote groepen mensen bezig houdt. Iedere tweet bevat namelijk positieve en negatieve woorden. Zijn er meer positieve woorden dan negatieve woorden? Dan is het onder de streep een positieve tweet. Het omgekeerde is natuurlijk ook waar.

Deze simpele methode kent een belangrijk nadeel: ladingen draaien om door context, ironie, sarcasme of ontkenningswoorden (bijv ‘niet goed’). Daardoor zullen we voor deze woorden niet het juiste sentiment herkennen.

Dit nadeel wordt relatief kleiner door vooral heel veel tweets te verzamelen. Voor de hele wedstrijd zijn er in totaal ruim 268.000 tweets gedownload. Verzamel je genoeg tweets over de hele wedstrijd? Dan zou het mogelijk moeten zijn om een redelijk betrouwbare sentiment-curve te plotten.

Hoe ging het? De feiten

Het bleek een meeslepende wedstrijd te worden. De Engelsen kwamen al na vijf minuten op 1-0, maar de Kroaten tekenden in 68ste minuut de gelijkmaker aan en dwongen daarmee verlenging af. Daarin dompelden zij de Engelsen in rouw door nóg een keer te scoren: 2-1 eindstand en weg Engelse droom van nieuw WK-succes sinds 1966.

Hoe ging het? De emoties op twitter

De onderstaande figuur liegt er niet om. Je kunt het feitelijk spelverloop vanuit Engels perspectief bijzonder makkelijk volgen. Ik heb de meest opvallende observaties op een rij gezet.

Aanloop (19:00 – 20:00)

Vooraf was het voor de Engelse fans al een uitgemaakte zaak: #Footballiscominghome domineerde voorafgaand aan deze wedstrijd al dagenlang op twitter. Dit positieve sentiment zie je heel duidelijk terug tussen 19:00 uur en 20:00 uur:

“Got my red England shirt on not been washed smells of beer but who cares it’s coming home #ENGCRO”

Volksliederen en aftrap (19:55 – 20:00)

De volksliederen vlak voor de aftrap  zorgen voor een klein piekje. Dit zie je ook in veel tweets terugkomen:

“I half expected the English fans to start singing “FOOTBALLS COMING HOME” during the national anthem and I’m lowkey…#ENGCRO “

0-1 (20:08 – 20:45)

De schitterende vrije trap van Kieran Trippier zorgt voor extase onder de Engelstalige twitteraars. Dat zie je ook terug in een scherpe piek vlak na de aftrap:

“Yes TRIPPIER! You beauty! #BuryLad #ENGCRO #ThreeLions #ITSCOMINGHOME

1-1 en einde reguliere speeltijd (21:27-22:00)

Ivan Perisic kopt in de 68ste minuut de 1-1 tegen de touwen en dat levert een duidelijk emotioneel dieptepunt in de hele wedstrijd op. De Engelse Twitteraars zijn er niet bepaald blij mee:

“Shit! Croatia equalise. That was coming, to be fair… #ENGCRO #WorldCup2018 England 1 – Croatia 1.”
“That’s bad. That’s very bad. #ENGCRO”

2-1 en einde wedstrijd (22:24 – 22:34)

In de verlenging scoort Mario Mandzukic de bevrijdende 2-1 voor de Kroaten. Opvallend is dat de teleurstelling onder Twitterend Engeland lang niet zo heftig als bij de 1-1:

“So, it’s not coming home then?! \U0001f62e #ENGCRO”
“WOW! England finally breaks! 2-1 Croatia! #WorldCup #ENGCRO”    

Nasleep (22:34 e.v)

Kort na het laatste fluitsignaal bevatten de tweets een zeer positief sentiment. Een korte blik op alles wat voorbij komt laat zien het hele land vooral trots is op wat de Three Lions bereikt hebben. Ook tonen veel Engelsen zich sportieve verliezers en feliciteren Kroatië met de zege. En dat zorgt voor de positiviteitspiek van de avond:

“As much as I wanted an English victory, has to be said the best team won…congratulations #Croatia good luck on Sunday. #WorldCup #ENGCRO”
“Proud of the #eng team, we outlasted some of the best international teams and have been a joy to watch.…  #ENGCRO”

Brede toepassing

De technieken achter de bovenstaande analyse zijn op vele vormen van ongestructureerde tekst mogelijk. Denk hierbij aan (vaak) openbare informatie zoals internetfora, klantreviews of individuele bijdragen op een website en gesloten informatie zoals e-mails of andere correspondentie.

Wil je deze techniek ook toepassen binnen jouw organisatie? Neem dan contact met mij op.

Technische details

Achter deze analyse zit een technisch stappenplan en programmeercode in R. Stuur mij een berichtje als je hier meer van wil weten. Ik ga graag met je in gesprek.

Roeland van der Molen

Roeland van der Molen is managing consultant bij Leissner & Van der Molen. Als jurist en dataspecialist heeft hij zich de afgelopen tien jaar ontwikkeld tot een allround number cruncher. Hij helpt klanten om meer grip te krijgen op hun fraudecijfers en van daaruit een effectieve strategie op te bouwen. ”Innoveren doe je vanuit de basis”.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *