‘Tijdens een overstroming of een aardbeving zou je sociale media in de gaten kunnen houden om te zien wat er gebeurt. Waar is hulp nodig? Wat is er precies aan de hand?’ Op die manier hoopt Suzan Verberne van het informatica-instituut LIACS meer uit sociale media te gaan halen. ‘Kunnen we een analyse van de berichten inzetten om de maatschappij beter te maken? Dat is de centrale vraag van ons project.’
Dat project heet Social Media Analytics, een Europees RISE-netwerkproject, en er werken universiteiten uit de hele wereld aan mee. ‘We hadden een subsidie gekregen die bedoeld was om ons bij elkaar op werkbezoek te laten gaan, maar dat zit er voorlopig even niet in’, verzucht Verberne van achter de webcam.
Zo’n analyse begint met het maken van een dataset. Bijvoorbeeld: alles dat de afgelopen week op Twitter is gezet. ‘Vervolgens moet je gaan filteren. Lang niet alle tweets hebben de hashtag die over jouw vraag gaat; er kunnen veel meer relevante termen zijn. Denk aan #coronavirus, #covid19, #corona, #covid-19. De situatie is nu een beetje omgekeerd: op Twitter gaat nu bijna alles over corona, en hashtags als #thuiswerken of #wc-papier zijn eigenlijk ook gerelateerd.’
Verplicht vaccineren
De taak van de Leidenaren is om op die set van gefilterde posts een tekst- en een netwerkanalyse los te laten. Een netwerkanalyse bepaalt wie er contact heeft met degene die post, wie de berichten verspreidt, en wie ze ziet. Verbernes specialiteit is tekstanalyse: zijn de berichten positief of negatief, bijvoorbeeld. ‘Je zou de aanpak ook kunnen gebruiken om bijvoorbeeld te peilen hoe er gedacht wordt over politieke kwesties zoals de vraag of mazelenvaccins verplicht moeten worden.’
In normale tijden worden er elke seconde zo’n zesduizend tweets gepost, en in tijden van crisis schiet dat verder omhoog. Daar valt niet meer tegenop te lezen, dus dat laat je een computer voor je doen. ‘Je neemt dan een stukje data, van bijvoorbeeld vijfhonderd berichtjes. Die ga je met de hand selecteren: dit is een ooggetuigenverslag, dit is een reactie op een nieuwsbericht, enzovoort. Daarmee train je een zogeheten classifier, een computerprogramma dat aan de hand van jouw les de rest van de berichten indeelt.’
Verberne en haar collega’s hebben dat al vaker gedaan, bijvoorbeeld in een onderzoek naar gebruikers van gezondheidsfora. ‘Zo konden we bepalen welke ziekte-ervaringen ze benoemden, en zeldzame bijwerkingen van hun medicatie opsporen. Dat gaat vrij aardig.’
Bierviltjesstatistiek
Idealiter wil je ook iets kunnen zeggen over de kwaliteit en relevantie van de posts. Een eerder onderzoek van Verberne naar berichten op het Viva Forum wees uit dat kenmerken als gemiddelde woordlengte of leestekengebruik kunnen helpen om de informatieve posts eruit te vissen. Maar het blijft ingewikkeld: ‘Wat zijn nou betrouwbare bronnen? Ik merk aan mezelf dat ik iets sneller serieus neem als er met statistiek wordt gestrooid. Maar in deze tijden is bierviltjesstatistiek juist een slecht idee. Je zou ook kunnen kijken naar de mate van vertrouwen in het RIVM, en de kwaliteit van de informatie in de posts: is er een relatie tussen die twee?’
Ze benadrukt dat met die analyses het verhaal nog niet af is: er werken ook mediasociologen en nieuwsonderzoekers mee. ‘Bij dit soort data science is het belangrijk dat er ook mensen zijn die het hele veld overzien. Kunnen we berichten met misinformatie herkennen? Interessant, want er is natuurlijk een schemergebied tussen opzettelijk leugens verspreiden, of per ongeluk iets posten dat achteraf onjuist blijkt.’
Nu is Twitter niet bepaald het populairste sociale netwerk. Van de honderd Nederlanders zitten er 99 niet op Twitter. Voor de data-onderzoekers is het echter wel het meest geschikte medium, omdat vrijwel alle posts openbaar zijn. ‘Instagram? Dat minen we eigenlijk helemaal niet, en Facebook slechts beperkt.’
Behalve Twitter kijken de onderzoekers ook naar internetfora, en de commentaarsecties op Reddit en YouTube. Uiteindelijk moet de internationale analyse-aanpak niet alleen interessant zijn voor data-onderzoekers, maar ook voor journalisten, beleidsmakers en communicatiemedewerkers. Als je die wilt bereiken met je aardbevingsnieuws of je mening over politiek, weet je nu waar je moet zijn.