Wat vond Nederland van de speech van Rutte? Welke coronahulp initiatieven zijn er in mijn omgeving? En waar ontstaat een nieuwe uitbraak van het coronavirus? Deze vragen en meer kunnen beantwoord worden met behulp van social media analyses. In deze blog leg ik uit hoe social media data ingezet kan worden, en kijk ik naar de rol van social media in de huidige crisis.
Wanneer mensen aan social media denken, wordt vaak ook gedacht aan de hoeveelheid aan ongegronde meningen en de polariserende inhoud. Op social media mag alles gezegd worden en heeft iedereen een mening over alles. Is uit deze data dan nog wel iets nuttigs uit te halen, en hoe representatief is dit dan voor de gehele populatie?
Social media data
In Nederland geeft 96 procent van de mensen aan actief te zijn op social media platformen1, welke dagelijks zo’n 98 minuten gebruikt worden. Hieruit ontstaat een enorme hoeveelheid data, van de inhoud van de berichten tot het tijdstip waarop het geplaatst is. Hoewel we de inhoud van de berichten niet per se als waarheid kunnen bestempelen, is het wel mogelijk dat we social media data gebruiken als peiling van mening en stemming.
Een van de meest bekende manieren waarop social media data gebruikt wordt is voor marketing. Op de verschillende social media platformen zoals Facebook en Twitter, wordt door marketing professionals gekeken naar huidige trends, de interesses van het potentiële klantbestand en nieuwe inzichten van concurrenten. Men kan bijvoorbeeld kijken welke soorten berichten het best ontvangen en het meest gedeeld worden, waardoor het bereik van eigen berichten vergroot kan worden. Ook kan geanalyseerd worden op welk moment van de dag jouw klanten meestal online zijn, en hier kan op ingespeeld worden door op die tijden berichten te plaatsen. Daarnaast is het voor een bedrijf belangrijk om te kijken naar de hoeveelheid negatieve versus positieve berichten die over het bedrijf gepost worden.
Social media data analyseren
Er zijn verschillende technieken om social media data te analyseren. Je kan alleen naar de inhoud van de berichten kijken, maar je kunt ook dieper kijken naar de betekenis van de gebruikte woorden en de link met andere woorden.
Een eerste stap is het kijken naar welke woorden het meest gebruikt worden (frequentie). Nadat de woorden opgeschoond zijn, en veelvoorkomende stopwoorden2 verwijderd zijn kun je met een tabel of een woordenwolk weergeven welke woorden bij een bepaald onderwerp vaak genoemd worden. Hieruit kan een bedrijf bijvoorbeeld zien welke producten het populairst zijn, of welke klacht vaak genoemd wordt.
Deze frequentie-analyse kan dan uitgebreid worden door de woorden te interpreteren, zoals door te kijken naar hoe positief of negatief de berichten zijn. Dit kan door een sentiment analyse. Met deze analyse bepaal je hoe positief of negatief een stuk tekst is. Dit wordt gedaan door elk woord te classificeren op een schaal van -1 (negatief) tot 1 (positief). Voor een zin worden al deze scores bij elkaar opgeteld en hieruit komt een score die aangeeft hoe positief of negatief de gehele zin is. Dit kan nog uitgebreid worden door woorden toe te kennen aan gemoedstoestanden, zoals het woord ruzie bij boos geplaatst kan worden.
Een probleem dat kan ontstaan bij deze analyses is dat elk woord letterlijk wordt geïnterpreteerd. Hierdoor wordt voorbij gegaan aan de context van een zin, en aan stijlfiguren als sarcasme en cynisme. Het woord bedankt wordt bij een standaard sentiment analyse geclassificeerd als positief, terwijl het in de zin: “Nou bedankt hoor, nu ben ik te laat” helemaal niet zo positief bedoeld is. Om deze zin correct te interpreteren is er taalbegrip en context nodig. Hiervoor is Natural Language Processing (NLP) bedoeld, de vaardigheid van een computerprogramma om menselijke taal te begrijpen (Meer info over NLP lees je in onze toekomstige blogs).
Twitter dashboard
Er zijn dus verschillende manieren om social media data op een nuttige en leuke manier te analyseren. Maar wordt dit op grote schaal daadwerkelijk gedaan, bijvoorbeeld bij rampen? Kunnen wij conclusies trekken uit de meningen die mensen op twitter zetten tijdens de huidige corona-crisis? In deel twee van de Nut van social media data blog ga ik verder in op het gebruik van social media data bij rampen, en specifiek op het gebruik tijdens de corona-crisis. Om alvast een beeld te krijgen van de verschillende manieren om twitter data te gebruiken en te visualiseren heb ik een twitter dashboard gemaakt over #corona op twitter. Neem vooral een kijkje en speel met de verschillende mogelijkheden van twitter data. Ontdek zelf welke informatie verscholen ligt achter twitter data.
Klik hier voor het Corona Dashboard
Bronnen
- Voor een lijst met veelvoorkomende Nederlandse stopwoorden zie: https://eikhart.com/nl/blog/moderne-stopwoorden-lijst