• en
  • fr
Intelligence économique et veille : pour que l'information se transforme en action

Bug Facebook et cartographie

Hier c’était un peu la panique sur les médias sociaux : Facebook aurait publié sur le mur de certains de ses utilisateurs des messages issus de leur messagerie privée.

Le démenti officiel de Facebook est arrivé assez rapidement hier dans la soirée. Il s’agirait juste d’utilisateurs qui auraient oubliés ce que l’on avait publié sur leur mur.

Ministres, CNIL et autres se mêlent à ce joyeux bordel et ce matin il est encore dur de savoir qui dit vrai ou qui dit faux. D’autres trouveront certainement la réponse à cette question qui demeurent tout de même fondamentale tant l’atteinte à la vie privée pourrait être grave si ce bug était avéré.

En tout cas l’action Facebook a continué à dévisser et tout cela le jour où un ancêtre des réseaux sociaux, MySpace, diffusait une vidéo de sa nouvelle interface. Une coïncidence sans aucun doute mais qui arrange bien les affaires de certains, Google+ en tête qui n’a pas manqué d’y aller de sa petite pique en précisant que chez eux, la vie privée était vraiment privée.  Le respect de Google pour la vie privée est quand même bien connu, pourquoi en douter ?

En tout cas ce n’est pas l’objet de ce billet de démêler le vrai du faux et de rajouter au bruit ambiant.

Je souhaitais plutôt vous livrer un petit travail réalisé hier? Ayant eu vent de la nouvelle, j’ai rapidement lancé une collecte en temps réel des retweets de tweets contenant le hashtag #bugfacebook afin de réaliser une cartographie permettant d’identifier rapidement les tweetos ayant eu le plus d’impact lors de cet événement. La collecte contient 4641tweets  publiés approximativement entre 19 h et 2 h du matin.

Télécharger (PDF, 536KB)

La cartographie réalisée sur le moment permet en l’espace de quelques minutes de voir apparaître les points chauds du buzz.

Ainsi en bas à gauche de la cartographie l’on voit clairement ressortir les 4 comptes générant le plus d’activité et partageant des retweeteurs :

  • Flootoutcourt avec ce magnifique tweet retweeté 173 fois : “Parler de ce #bugFacebook sur Twitter c’est un peu comme parler littérature avec Franck Ribéry.. “
  • Tilahh avec le tweet qui score à plus de 100 RT également : “Un peu chiant ce #BugFacebook. J’espère juste que mes messages privées avec @Shakira ne seront pas divulgués. “
  • Damienfaitlcon qui a publié plusieurs tweets sur le sujet dont au moins 3 scorent au dessus de 100.  (1) “Hey tu l’as enterré où le bébé ?” #bugFacebook“, (2) “”Salut Momo ! Alors t’as enfin décidé quelle école juive de Toulouse tu allais attaquer ?” #bugFacebook“, (3) “”Un bug sur Facebook publie vos messages privés datant de 2007 à 2009 sur votre mur” Apar aprendr ke jécrivé com sa ya pa gran choz a savoir “.

D’autres comptes exposés mais moins reliés les uns aux autres ressortent clairement de la masse des tweets tels  que AnonymousAG qui publie “Les 1ères conséquences du #BugFacebook : un mec se fait jeter par sa femme à cause de ses échanges avec sa maîtresse pic.twitter.com/neYEeTyh” et aussi nain_portekoi qui a publié des tweets à moindre impact mais en plus grand nombre sur le sujet.

Que-peut on tirer de ce petit travail réalisé sur le vif ?

Tout d’abord la cartographie permet instantanément de visualiser l’impact des messages publiés par certains utilisateurs à travers le nombre de retweets.

Ensuite, le mapping des retweets permet d’identifier les communautés (utilisateurs partageant et interagissant avec les mêmes comptes “influents”. Si l’on prend l’exemple de Flootoutcourt, Tilahh et Damienfaitlcon l’on voit bien les followers qu’ils partagent et qui sont intéressés par les tweets de ces tweetos exposés.

Les chiffres laissent peu de doute : le nombre d’abonnés reste une métrique essentielle à “l’influence” ! Flootoutcourt cumule plus de 23000 followwers, Tilahh 40 000, Damienfaitlcon 36000. Si vous dites une connerie à 50 000 personnes vous avez plus de chances que cette dernière atteinte x utilisateurs. Surtout sur des sujets tels que celui-ci.

Accessoirement, cet exemple brille aussi par la quasi absence des médias traditionnels. Aucun compte officiel de journaux / site web ne saute aux yeux. Le_parisien et 20  Minutes apparaissent bien mais restent bien moins visibles que des comptes individuels suivis en masse.

AnonymousAG se démarque du lot. Massivement retweeté il ne comporte que 690 abonnés.

Nain_Portekoi de son côté comporte moins d’abonnés avec des retweets en plus petit nombre sur le sujet mais il compense en rédigeant un nombre de tweets plus important.

Il y aurait beaucoup d’autres lectures et commentaires à rajouter à cette cartographie, et le léger travail de lecture et d’analyse réalisé ne se veut pas exhaustif.

On peut toutefois simplement rajouter que ce travail de cartographie pourrait servir pour mener une action de communication ciblée auprès de quelques uns ayant fait par le passé les preuves de leur visibilité sur le sujet. Resterait à éviter la comm éléphant à base de communiqués de presse et de s’inspirer des recettes qui font le succès des tweets identifiés : un soupçon d’actualité, beaucoup d’ironie, de l’humour noir.

Update de 10 h 30 le même jour. En bonus de ce billet une cartographie sur les mêmes contenus mais filtré sur la composante géante. Cela permet de limiter aux coeur du réseau et aux clusters ayant les interactions les plus fortes. Sur cet exemple la composante géante retient approximativement 3/4 des comptes Twitter ce qui montre de fortes interactions mais attention cela est aussi du au fait que nous ne prenons en collecte que les retweets, or généré un RT signifie déjà un minimum de réseau et de visibilité

Télécharger (PDF, 438KB)

Rejoindre la conversation

3 commentaires

  1. Bravo pour cette carto Frédéric!
    Je reste sur ma faim sur deux dimensions, sans doute difficiles ou impossible à mettre en évidence:
    1/ le facteur Temps: où est le tweet initial, ou les quelques tweets initiaux? On a la chance d’avoir des données d’horodatage sur Twitter
    2/ Retweets: peut-on distinguer les retweets par les followers des autres? (on aurait un retweet endogène et un autre exogène)?

    A bientôt
    Guy Debaux

  2. Bonjour Guy,

    Merci pour ton retour positif.

    Tout d’abord pour expliquer la démarche de ce billet et de ce petit travail j’ai voulu, à partir du moment où il semblait évident que l’on se trouvait face à un buzz” commencer la collecte des tweets à l’instant t, pendant un certain moment (celui où sur le hashtag choisi j’avais une activité qui diminuait fortement). Je ne m’étais pas fixé pour objectif de faire une collecte et analyse exhaustive de l’événement mais je voulais juste montrer qu’en quelques heures et même en temps réel il était possible de cartographier les publications et les “auteurs” sur un sujet à chaud.

    Pour être exhaustive ce “business case” aurait dû collecter les tweets avec l’antériorité ce qui est tout à fait possible mais nécessite de passer par un autre collecteur que celui que j’utilise actuellement et qui ne me permet pas aujourd’hui d’avoir une connexion continue entre les données collectées et l’interface cartographie. Il aurait peut être aussi été nécessaire d’acheter les tweets (ce que je ne fais pas sur ce genre d’exercices…) auprès d’un fournisseur ayant accès au firehose de Twitter.

    Dernier point pour l’exhaustivité il aurait fallu cibler plus large sur les mots clés de collecte. Par exemple ici il est évidement que je me suis concentré sur la France alors qu’il aurait été intéressant de voir aussi sur les US avec des hashtags ou mots clés comme facebookbug, ou facebbok + fail (liste non exhaustive).

    Cela aurait été d’autant plus intéressant que cette petite histoire a eu un impact sur le cours de bourse et que l’on imagine clairement qu’il aurait été intéressant de mapper les interactions dans la sphère plus financière / médias business.

    Concernant le “premier” tweet la solution proposée permet tout à fait de remonter en fonction du temps sur ton corpus de collecte. Mais comme dit préalablement je n’ai commencé que plusieurs heures après la collecte sans chercher à remonter à l’origine. Cela aurait été intéressant de filtrer effectivement sur l’apparition des premiers messages relatifs à 20 minutes et voir s’il y en a eu avant. Si Facebook ou la Cnil sont prêt à financer le travail je peux tout à fait m’en charger 🙂

    En tout cas merci encore pour ton retour. Et j’espère qu’en dehors des quelques manques dont tu fais part j’espère quand meêm que le travail réalisé était pédagogique et instructif.

    Au plaisir de te revoir. Qui sait peut être à Rabat ?

  3. La carto est super, pouvez-vous m’indiquer à partir de quel outil vous l’avez réalisée?
    Je vous remercie d’avance,

    Sophie

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *