Nieuws

Fraudeurs opsporen met getallen


Leuke vraag voor in de kroeg: welk getal – van 1 tot en met 9 – staat het vaakst aan het begin van een cijferreeks? De meeste mensen zullen intuïtief zeggen dat alle cijfers evenveel voorkomen. Toch is dat niet zo, het meest tref je in je leven het getal 1. Dat getal komt zelfs 6,5 keer zo vaak voor als 9. Een derde van alle getallen die je hoort of ziet in je leven, begint met een 1.

Dat vreemde gegeven heet de Wet van Benford, naar de ontdekker, natuurkundige Frank Benford (1883-1948). Zijn theorie is in de afgelopen eeuw ontelbare malen getest, en steeds opnieuw blijkt hij te kloppen. Bevolkingsaantallen, halfwaardetijden van radioactief materiaal, aandelenkoersen, sportstatistieken, zelfs de getallen in het tijdschrift Reader’s Digest voldoen aan de Wet van Benford.

Aan de Amerikaanse University of Maryland hebben onderzoekers getest of ze met deze wet in de hand ook fraude op sociale netwerken kunnen opsporen. Ze bekeken 18.000 Facebook-, 78.000 Twitter-, 20.000 Google Plus-, 40.000 Pinterest- en 45.000 LiveJournal-accounts. Wat blijkt? Ook daar komt in posts en statistieken het getal 1 het vaakst voor.

Sterker nog, vooral op Twitter moet je posts waarin veel begincijfers anders dan 1 voorkomen, wantrouwen. Het bleken vaak spam-berichten of posts afkomstig van Russische bots, machines die willekeurige stukjes tekst op Twitter zetten, afgewisseld met pro-Moskou propaganda. Zo hebben deze netwerken een nieuwe manier gevonden om fraudeurs te weren. Laat een computer uitrekenen wat voor cijfers vaak worden gebruikt op een account en je ziet waar geen echt mens achter zit.

Het onderzoek staat op arXiv.org.