Ce classement qui place la Suède comme 4e pays le plus criminel d’Europe n’est pas fiable


Ce classement qui place la Suède comme 4e pays le plus criminel d’Europe n’est pas fiable

Publié le mardi 20 décembre 2022 à 17:27

gali bonin.png

Auteur(s)

Gali Bonin

Un classement largement partagé sur Twitter affirme que la Suède était le 4e pays le plus dangereux d’Europe en 2021, derrière le Bélarus, la France et l’Ukraine. Mais le site d’où est tiré le sondage est critiqué par le chercheur spécialisé en statistique Corentin Odic. Selon lui, le site Numbeo.com ne respecte pas les normes méthodologiques statistiques et produit des études biaisées.

Au lendemain des élections législatives suédoises, le 12 septembre 2022, un utilisateur nommé @GeronimusIII  partage dans un tweet deux captures d’écran, une carte et un tableau, qui montrent un classement de « l’indice de criminalité » en Europe pour 2021. Avec 47,20%, la Suède y figure en quatrième position des pays européens aux indice de criminalité les plus élevés.

1671553733244-846.png

« Mais qu'est ce qui peut expliquer qu'en 10 ans la #Suede est passée d'être l'un des pays les plus sûr (sic) de l'Europe, à l'un des plus haut (sic) taux de criminalité ? », questionne le tweet, qui a collecté près de  200 j’aime et 660 retweets. Dans les réponses, plusieurs internautes affirment que l’immigration est la cause de cette hausse.

Data URI imageCommentaire 1

Data URI imageCommentaire 2

Data URI imageCommentaire 3

Ce tweet survient au moment où l’extrême droite vient de devenir la deuxième force politique en Suède. Le parti les Démocrates de Suède a fait campagne en critiquant vivement la politique migratoire du pays. Le tweet est visiblement utilisé comme un argument anti-migratoire, mettant en corrélation la montée de la criminalité et l’immigration.

Un site à la méthodologie critiquée

Les captures d’écran partagé par @GeronimusIII sont tirés du site internet Numbeo.com. Le problème de ce site est qu’il se base sur la participation volontaire d’internautes anonymes pour déterminer ses indices, et ce sans qu’aucune vérification ne soit faite. « Ils ne contrôlent pas les données qu’ils ont, ce sont les données qui viennent à eux », résume Corentin Odic, candidat au doctorat et chercheur au Centre de recherche en économie et statistique (CREST) affilié à L'École nationale de la statistique et de l'administration économique de Paris (ENSAE). « On peut se servir du site pour dire "Sur l'ensemble des gens répondant au sondage, l'insécurité est estimée à...". Par contre, le site n'est pas qualifié pour dire "Sur l'ensemble des habitants de Brest, l'insécurité est estimée à..." ».

Ainsi, des personnes qui n’ont jamais mis les pieds dans une ville peuvent donner leur opinion sur les prix, la qualité de vie ou encore l’accès aux soins de santé. Prenons l’exemple de Nantes. En allant sur la fiche de la ville, le site propose de répondre à un formulaire en posant la question « Vivez-vous à Nantes ? ». Aucune autre vérification n’est faite pour justifier la légitimité témoignage et l’internaute peut remplir le formulaire d’une dizaine de questions.

Data URI image

D’ailleurs, si on reste  30 secondes sur une page, le site envoie un message pour inciter à répondre au sondage, alors que Numbeo n’a aucune idée de l’origine ou de la légitimité des visiteurs de son site.

Data URI image

Selon Corentin Odic, le problème méthodologique du site est double. D’abord, ce n’est pas Numbeo qui sonde les répondants, mais les visiteurs du site qui prennent l’initiative de répondre. « Si quelqu’un choisit de répondre, c’est qu’il y a un lien entre le fait de répondre au sondage et la réponse », explique Corentin Odic. En statistique, c’est ce qu’on appelle le biais de sélection, et on veut l’éviter à tout prix. Mais ici, « c’est inhérent à la méthodologie du site, on est obligé d’avoir un biais de sélection », résume le statisticien. Dans le cadre d’un sondage professionnel, ce sont les firmes de sondage qui sélectionnent au hasard les gens et qui les sollicitent, le tout afin d’avoir les réponses les moins biaisées possibles.

Ensuite, Numbeo ne vérifie pas que ceux qui répondent au sondage soient représentatifs de l’ensemble de la population concernée. « Dans la méthodologie de sondage, si on veut généraliser nos résultats à l’ensemble d’une population, il faut que l’échantillon ait à peu près les mêmes distributions sur certaines variables que l’ensemble de la population étudiée », explique le chercheur. « On va questionner l’âge, le genre, la catégorie socioprofessionnelle, etc. ». De cette manière, on s’assure que le bassin de personnes interrogées corresponde à la réalité. Ce n’est pas le cas sur Numbeo, qui ne pose aucune question aux répondants sur ces autres variables.

Le fait que Numbeo ne respecte pas ces deux critères invalide ses résultats. « Ce qui est extrêmement important à comprendre, c’est qu’on peut faire autant de traitement statistique des données, si, initialement, il y a un problème de génération des données, elles sont impossible à traiter », conclut Corentin Odic. « On se retrouve dans un environnement biaisé qui est impossible à débiaiser. »

Des résultats facilement manipulables

Malgré ces lacunes dans la collecte de données, Numbeo indique dans sa méthodologie utiliser des filtres qui permettent de rejeter ce qu’il nomme des « interférences de données ». Les deux filtres de base éliminent les données aberrantes, soit celles qui sont trop distantes des autres données récoltées, et rejettent un quart des entrées les plus basses et les plus élevées. Ils prennent alors les données restantes, en font la moyenne et l’affiche sur leur site. Mais malgré ce traitement minimal des données, il est encore possible de les manipuler.

Pour démontrer la malléabilité des résultats du site, un internaute s’est mis en tête de faire de Brest la ville la plus dangereuse du monde et y est parvenu. Pour ce faire, il a employé des méthodes informatiques qui ne sont pas à la portée de tous, mais a tout de même réussi à contourner aisément le système de traitement de données du site. Depuis que cette internaute a partagé sa réussite sur Twitter, le taux de criminalité pour la ville de Brest est redescendu.

Il n’est pas le seul à avoir tenté l’expérience. En 2017, un jeune suédois a fait grimper au sommet du classement la petite ville universitaire de Lund, dans le sud-ouest de la Suède. Son objectif était de dénoncer le fait que plusieurs médias utilisaient Numbeo comme source fiable pour parler de criminalité. En France, les études sur la criminalité ont notamment été reprises par BFM TV, par Le Figaro, par SudInfo ou encore Ouest France.

Ce fact-check a été également publié par Ecole de journalisme de Sciences Po.

Ce contenu a été réalisé dans le cadre d'un enseignement de l'Ecole de journalisme de Sciences Po.