Twittoscope : comment ça marche ?

le 09 février 2011 à 06h00 , mis à jour le 09 février 2011 à 07h17

Voici la méthodologie du premier baromètre de l'opinion sur Twitter lancé par TF1 News et Metro avec TNS Sofres et Semiocast.

LogoTwittos1024 © TF1 News

La méthodologie :

Plus d'infos

Le recueil des messages : il se fait à partir de mots-clés (sur la base d'une liste d'environ 140 personnalités politiques majeures en France) en tenant compte du nom, du prénom, des surnoms et des abréviations (par exemple « DSK », « Sarko » ou « MAM »)... Cette liste est évolutive et pourra être complétée selon l'actualité.

Le filtrage : il sert à éliminer de manière automatique tous les messages citant des homonymes. Cette technique permet de garantir par exemple que les messages parlant de Royal évoquent bien la présidente du Conseil Regional de Poitou-Charentes et non l'adjectif ou une marque commerciale. De même, les messages parlant de Marine Le Pen sont distingués de ceux citant son père, etc... 
 
 - > Le TOP 20 est calculé, pour chaque personnalité, en comptabilisant mois par mois tous les messages qui l'évoquent. Il permet d'établir le classement des 20 personnalités politiques les plus citées.


- > Le MOOD : il mesure les sentiments associés aux personnalités politiques dans les messages. Pour l'analyse, 4 catégories de « sentiments » ont été distinguées :

  • - Les Positifs : c'est-à-dire les messages formulant une opinion positive que ce soit pour saluer une action, une attitude, un avis, soit par adhésion pure et simple à l'individu ou à ses idées.
  • - Les Échanges d'info : ce sont les messages évoquant une personnalité sans pour autant formuler une opinion positive, une critique ou un rejet. Cela peut être la reprise d'une intervention, d'un événement, d'un titre de presse ou de blog, sans commentaire personnel associé.
  • - Les Critiques : ils désignent les messages formulant une critique soit directement soit de façon ironique (cette catégorie propre au sujet politique a été spécialement identifiée pour le Twittoscope).
  • - Les Rejets : ce sont les messages formulant un rejet clair et franc de la personnalité (voire une insulte).


Le codage des tweets selon ces 4 catégories est effectué manuellement avant d'être automatisé. Des tests sont réalisés régulièrement pour valider cette codification

le 09 février 2011 à 06:00
Envoyer cette page à un ami
Les champs marqués par une étoile * sont obligatoires.
Les derniers articles Politique
  

Commentaires

Afficher : Les plus récents | Les plus appréciés

      logAudience