Actulligence.comOutils du veilleur / Logiciel de veille » http://www.actulligence.com Intelligence économique, veille stratégique, veille concurrentielle et veille image Tue, 07 Feb 2012 12:21:28 +0000 en hourly 1 http://wordpress.org/?v=3.2.1 Twitter et les flux RSS : faciliter la veille sur Twitter http://www.actulligence.com/2011/10/17/twitter-veille-rss/ http://www.actulligence.com/2011/10/17/twitter-veille-rss/#comments Mon, 17 Oct 2011 09:13:16 +0000 Frédéric Martinet http://www.actulligence.com/?p=1798 Il y a déjà plusieurs semaines, Twitter a modifié les pages de ses résultats de recherche et a supprimé les liens pointant vers le RSS des résultats de recherche. Probablement afin de limiter les appels à son infrastructure par les logiciels qui n’utilisent pas ses API et qui donc peuvent impacter le bon fonctionnement de son infrastructure.

Quoiqu’il en soit, les URLs de ces RSS ne se sont pas totalement volatilisés dans le néant. Les URLs sont toujours fonctionnelles mais il vous faudra en connaître la structure qu’il vous suffira alors d’ajouter à votre lecteur RSS, ou à votre logiciel de veille.

Imaginions que vous fassiez une recherche sur le mot « MOT_CLE » vos RSS se présenteront alors ainsi :

http://search.twitter.com/search.atom?q=MOT_CLE

Il vous est également possible d’intégrer un filre par langue sur les résultats :

http://search.twitter.com/search.atom?lang=fr&q=MOT _CLE (pour l’anglais utiliser en à la place de fr.)

Pour rechercher sur deux mots clés ce n’est quère plus compliqué :

http://search.twitter.com/search.atom?q=MOT_CLE1+MOT _CLE2

En connaissant un peu la conversion des caractères et les opérateurs avancés, lon peut également reconstruires ses URLs de RSS assez facilement et par exemple pour une requête telle que : « intelligence économique » OR « veille stratégique » on obtiendra l’URL RSS suivante :

http://search.twitter.com/search.atom?lang=fr&q=%22intelligence%20%C3%A9conomique%22%7C%22veille%20strat%C3%A9gique%22

Plus simplement, pour reconstituer très simplements une URL RSS :

Faites une recherche sur le moteur de recherche Twitter disponible à l’adresse : http://twitter.com/#!/search-home

Copiez tout ce qui se trouve juste après le « search/ » (ce qui conne par exemple pour la requête précédente la chaîne copiée suivante : %22intelligence%20%C3%A9conomique%22%7C%22veille%20strat%C3%A9gique%22

Et rajoutez juste devant ce que vous venez de copier : http://search.twitter.com/search.atom?q= , cequi donne au final l’URL présenté précédemment : http://search.twitter.com/search.atom?lang=fr&q=%22intelligence%20%C3%A9conomique%22%7C%22veille%20strat%C3%A9gique%22

Voilà, c’était le petit truc et astuce bien utile du jour. Simple et efficace.

Dans le même style à l’époque j’avais publié le mêm truc et astuce sur Flickr avec ces deux billets : Tag Flickr et RSS et Aller plus loin avec les API de Flickr

]]>
http://www.actulligence.com/2011/10/17/twitter-veille-rss/feed/ 1
Intelligence économique et veille stratégique : une approche juridique de l’utilisation de logiciels http://www.actulligence.com/2011/03/29/intelligence-economique-veille-strategique-cadre-juridique/ http://www.actulligence.com/2011/03/29/intelligence-economique-veille-strategique-cadre-juridique/#comments Tue, 29 Mar 2011 20:05:57 +0000 Frédéric Martinet http://www.actulligence.com/?p=1759 Le 11 janvier 2011, dans le cadre d’un procès opposant un particulier à la société CDiscount, le Tribunal de grande instance de Bordeaux a acquitté le dit particulier Cédric M. qui comparaissait pour entrave au bon fonctionnement d’un n système automatisé d’un traitement de données, en l’état le site d’une des filiales de CDiscount : www.lecomptoirsante.com.

Fait particulier, Cédric M. reconnaissait avoir effectivement mené une veille concurrentielle sur le site www.comptoirsante.com avec un logiciel automatisé, qui aurait éventuellement pu générer un dysfonctionnement temporaire du site, assimilable à un déni de service.

Ce fait divers juridique m’a semblé le moment approprié pour essayer de rédiger une synthèse de quelques aspects juridiques liés à la veille et des précautions devant éventuellement prises lorsque l’on souhaite mener une veille qu’elle soit concurrentielle ou liée à l’image de son entreprise à la fois sur le périmètre à l’extérieur de l’entreprise mais également à l’intérieur de l’entreprise. On y trouvera donc également des éléments liés au contrat de travail.

J’insiste sur le fait que je n’ai que des notions très basiques de droit, et que ce que je vous livre c’est principalement mon interprétation de certains aspects règlementaires et juridiques pouvant avoir un impact sur la conduite de la veille. Une synthèse et des conclusions personnelles qui finalement conditionnent en grande partie ma façon de conseiller mes clients et de travailler également pour eux.

1)    Les problématiques juridiques liées à la veille : présentation

La veille sur internet est un processus qui fait face à de multiples problématiques juridiques que nous développerons :

  • La notion d’atteinte à un système de traitement automatisé
  • Le respect des conditions générales d’utilisation
  • L’utilisation des moyens informatiques pendant son temps de travail
  • La notion de respect de la vie privée

Nous développerons ces différents points sachant que l’approche juridique est une approche souvent complexe et particulièrement dans ce cas où elle fait appel à des notions de respect de la vie privée dans l’absolu, à des relations contractuelles (contrat de travail), à des accords tacites (CGU) et à une jurisprudence mouvante et non encore convergente, le tout dans un environnement international aux frontières floues (Internet.)

2)    La notion d’atteinte à un système de traitement automatisé

En dehors de la notion de furtivité de la veille, que devrait se poser toute entreprise qui met en place une démarche active de surveillance de son environnement sur Internet, l’entreprise réalisant une veille sur Internet devra prendre soin de ne jamais porter atteinte au bon fonctionnement d’un site web qu’elle surveille.

En effet, lors des processus automatisés de veille sur Internet, l’on peut être amené à déployer des logiciels qui iront régulièrement visiter des sites Web.
Ces automates se comportent comme un internaute qui visite un site Web. Ils ouvrent des pages Web provoquant une sollicitation du serveur hébergeant le site Web proposé.

Dans l’hypothèse où les logiciels de veille seraient mal paramétrés, ils pourraient sur-solliciter le site web (en exécutant des processus de crawl simultanés et à trop haute fréquence) et provoquer ainsi un dysfonctionnement. Du site visité.

Si l’on prend l’exemple d’un logiciel comme Website Watcher sur lequel j’ai récemment eu l’occasion de publier un support de formation, ce dernier permet de gérer plusieurs aspects permettant de limiter l’impact négatif sur le site web surveillé :

  • Il est possible de diminuer le nombre de crawleurs simultanés dans les options générales du programme [ options générales du programme | vérification | connexion ]  (nombre maximum de connexions simultanées par serveur HTTP).
  • Il est possible d’augmenter le délai entre le téléchargement successifs de deux pages d’un même serveur ce qui a le double avantage de limiter l’impact négatif mais également d’augmenter la furtivité, le logiciel adoptant ainsi un comportement plus proche de celui d’un internaute.
  • Il est possible de ne pas télécharger les images du site web surveillé. Les images sont souvent les éléments les plus lourds d’une page web et impactent donc plus lourdement l’infrastructure.

Dans ce cas présent, l’entreprise réalisant la veille tombe alors sous le coup du code pénal selon l’article 323-2 (et accessoirement 323-5) :

Ces articles sont ceux sur lesquels s’est appuyé CDiscount pour assigner Cédric M.

On comprendra par ailleurs aisément que la furtivité est un point qui permet de prêter un peu moins le flanc à son concurrent. En effet, si un concurrent détecte votre crawler à cause d’un manque de furtivité il sera peut-être plus tenté d’engager des poursuites judiciaires y compris si le dysfonctionnement provoqué sur son site Web est mineur.

La furtivité de la veille est d’ailleurs évoquée dans ce même jugement puisque le prévenu admet avoir utilisé des IP anonymisées, mais que le site www.lecomptoirsante.com s’étant défendu contre ce qu’il considérait comme une attaque a bloqué le logiciel de veille ce qui a amené le veilleur à se connecter d’un poste ne disposant pas du même système d’anonymisation.

En conclusion du jugement CDiscount / Cédric M., il est par ailleurs précisé que CDiscount n’a pas pu produire de preuve tangible du dysfonctionnement provoqué par l’action de veille. Il ne faudrait donc pas penser qu’il s’agit là d’une jurisprudence dédouanant le veilleur de connaître ses logiciels et de limiter l’impact de ces derniers sur les systèmes qu’il observe.

3)    Le respect des Conditions Générales d’Utilisation

[NDLR : il s'agit du passage sur lequel je suis probablement le moins certain de mon interprétation et je reste ouvert à toutes remarques ou compléments d'information à ce sujet]

Les conditions Générales d’Utilisation sont un accord passé entre l’éditeur d’un site et celui qui l’utilise.

Les CGU, le plus souvent, ont pour principale conséquence lorsque l’on ne les respecte pas, de se faire bannir du site (pour ceux dont l’accès nécessite un compte).

En effet, pour que l’infraction à cet accord  soit opposable juridiquement, il faudrait qu’il s’agisse d’un contrat, qui, en droit français demande un certain formalisme (signature physique ou électronique) afin de d’assurer que les parties co-contractantes sont pleinement informées.

Prenons pour exemple les CGU de Facebook qui précisent 2 points plus particulièrement applicables aux activités de veille dans le paragraphe alloué à la sécurité :

« 2.    Vous n’obtiendrez pas d’informations concernant des utilisateurs ou les contenus qu’ils publient, et n’accéderez pas à Facebook à l’aide de méthodes automatisées (telles que robots, araignées, etc.) sans notre permission.
11.   Vous n’agirez pas d’une manière qui pourrait désactiver ou autrement empêcher le bon fonctionnement du Service Facebook (comme une attaque entraînant un refus de service).
»

On y retrouve précisément le point évoqué précédemment qui par ailleurs trouve un écho en droit français dans le code pénal. La seule différence est que le droit français statue sur le résultat. Les CGU vont plus loin en interdisant la méthode de collecte automatisée quel que puisse être l’impact ou le non impact sur le bon fonctionnement de Facebook.

Toutefois il semblerait qu’à partir du moment où ce crawl est respectueux et ne perturbe pas le fonctionnement de Facebook, la clause des CGU ne soit pas condamnable au regard du droit français.

Il faut toutefois faire attention à ne pas être identifié car en cas de non-respect de ces CGU, Facebook pourrait par exemple supprimer tous les comptes Facebook, Fan Page ou Groupes rattachés.

Par ailleurs, il faut noter que nous avons pris Facebook pour exemple mais que quasiment tous les sites demandant une identification et permettant la publication de contenu ont des CGU de ce type qui s’appliquent.

Attention également, dans certains pays, et selon comment l’utilisateur valide avoir accepté les CGU, elles peuvent être considérés comme contractuellement opposables.

4)    Le respect des obligations liées au contrat de travail

L’utilisation des moyens informatiques sur son lieu de travail est soumise à plusieurs cadres juridiques :

  • Le droit lié au contrat de travail et à la relation employeur salarié

Contractuellement l’employé doit l’intégralité de son temps de travail à son employeur. Il ne peut être autorisé qu’en cas de nécessité et de façon réduite et minime à avoir une activité personnelle pendant son temps de travail. La durée tolérable « minime et réduite » est à l’appréciation du juge sachant que les dernières jurisprudences réduisent ce temps à une portion très congrue. Les dernières jurisprudences ont pu être plus restrictives que les précédentes qui considéraient qu’un temps de « surf » personnel pouvait être acceptable « au regard des missions et de la charge de travail. » Quoiqu’il en soit, l’interprétation de ce que doit être un temps résiduel revient au juge, cette notion n’ayant pas été clairement définie en termes de durée.

  • Le respect de la vie privée

L’employeur ne peut mettre en place des systèmes de surveillance de l’activité de ses salariés sur Internet (et ailleurs) sans l’en avoir préalablement informé.

  • La charte d’utilisation des moyens informatiques, qui définit l’utilisation des moyens informatiques sur le lieu de travail et dont l’infraction peut être sanctionnée par l’employeur.
  • Le traitement des données personnelles (CNIL), qui interdit la collecte d’informations personnelles non déclarée auprès de la CNIL lorsque les informations collectées vont au-delà des nécessités de l’entreprise (par exemple des fichiers contenant des appréciations personnelles et subjectives.)

En conclusion, il pourrait être possible à l’employeur de mettre en place des systèmes de veille « internes » pour détecter les publications de contenus sur les réseaux sociaux et plus généralement sur Internet par ses salariés mais  la plus grande attention devrait être portée à la démarche, à sa formalisation et à son information auprès des intéressés. Tact et modération sembleraient donc être de rigueur !

5)    La notion de respect de la vie privée

Il s’agit d’une notion très complexe à définir en droit français car elle est n’est pas définie de façon positive. Autrement dit le droit français définit les infractions à la vie privée sans jamais définir le contour exacte la vie privée.
On peut toutefois dire sans se tromper, qu’en dehors de son temps de travail, l’employé est libre de ses activités.

Cela ne veut pas pour autant dire que le salarié est libéré de son devoir de réserve, de confidentialité, de loyauté et de fidélité à l’égard de son employeur.

Le salarié n’a donc pas le droit :

  • De dire du mal de son employeur, ni de le dénigrer ;
  • De dévoiler des « informations confidentielles », la notion d’information confidentielle gagnant à être formalisé par l’employeur pour être pleinement opposable à l’employé qui l’enfreindrait limitant ainsi l’interprétation faite par le juge.

L’employeur n’a toutefois pas lieu de présumer que le salarié va enfreindre ses obligations et toute procédure de surveillance d’un employé pendant son temps libre relèverait de l’espionnage et pourrait constituer une atteinte conséquente à la vie privée.

Pour rapporter ces éléments à un dispositif automatisé de veille sur Internet :

  • A partir du moment où l’employeur surveille l’apparition d’un nom de marque ou de produits ou de noms de sites de production sur Internet aucun reproche ne semblerait pouvoir lui être fait si par ce moyen il détecte des publications faites à titre personnel par l’un de ses employés.
  • Si l’employeur mettait en surveillance le nom de toute ou partie de ses employés sans aucune mention faite au nom de l’entreprise, d’une de ses marques alors l’employé incriminé pourrait considérer qu’il s’agit d’une atteinte à sa vie privée.

La jurisprudence sur ce dernier point, et sur les réseaux numériques est toutefois extrêmement faible voire inexistante mais l’interprétation que je vous propose semble être une règle de prudence évidente à adopter en l’absence de jurisprudence.

Conclusion

Inutile de commenter en disant qu’il ne s’agit pas ici d’une liste exhaustive du cadre juridique pouvant s’appliquer au processus de veille. Je pense que traiter de tous les tenants et aboutissants juridiques liés aux activités de veille pourrait d’ailleurs faire l’objet d’une thèse conséquente et intéressante.

Je n’ai par exemple ici pas abordé les aspects liés au Droit d’auteur sur lesquels je me suis déjà exprimé précédemment et qui sont clairement un cadre juridique à prendre en considération dans tout processus de veille stratégique. Je n’ai pas non plus détaillé outre mesure la constitution de fichiers de données personnelles issues de la veille problématique à laquelle on peut particulièrement être confronté lors de veille image ou de démarche d’e-réputation lorsque l’on cherche à identifier des « influenceurs ».

J’ai bien évidemment passé sur la très polémique LOPPSI 2 et sur les nombreuses questions juridiques qu’elle soulève. J’ai volontairement ignoré la loi en préparation sur le secret des affaires qui n’existe pas encore et qui n’existera je l’espère jamais.

J’espère toutefois que ce billet posera quelques jalons intéressants, quelques bases de réflexion à destination des responsables intelligence économique et veille stratégique. C’est sa principale et seule ambition.

]]>
http://www.actulligence.com/2011/03/29/intelligence-economique-veille-strategique-cadre-juridique/feed/ 1
Démonstration de web scraping http://www.actulligence.com/2011/02/27/web-scraping-web-harvesting/ http://www.actulligence.com/2011/02/27/web-scraping-web-harvesting/#comments Sun, 27 Feb 2011 22:34:24 +0000 Frédéric Martinet http://www.actulligence.com/?p=1713 On a beaucoup parlé de cartographie sur Actulligence ces derniers mois.
La raison est simple : j’ai beaucoup travaillé sur ces aspects là et mobilisé beaucoup d’énergie.

J’ai testé différentes solutions, j’ai partagé avec de nombreuses personnes et je continue à échanger d’ailleurs avec eux.
En plus l’actualité m’a fourni l’occasion et surtout m’a poussé à prendre le temps de montrer ce que l’on peut faire en cartographie afin de prouver que l’on peut faire des choses intéressantes.

Dans les points que j’ai abordés et sur lesquels je tiens absolument à revenir car ils me semblent vraiment essentiels, il y a tout d’abord le fait que la cartographie n’est pas un « outil magique ». Ce n’est pas en poussant un bouton que l’on construit une cartographie qui vous dévoilera les secrets de l’univers concurrentiel ou d’influence.
Chaque étape de conception de la cartographie doit être réfléchie, cadrée afin d’éviter les biais et les erreurs, pensée également peut-être pour être actualisée. Le choix des indicateurs visuels est importants, la vérification des informations essentielle, etc.

Deuxième point et qui fera l’objet plus précisément de ce court billet aujourd’hui, l’extraction de l’information peut et même doit être automatisée.
Il devient quasiment impossible sauf sur des marchés de niche avec une très faible activité informationnelle d’extraire de la donnée automatisée.

Nombre de cette donnée peut se trouver sur le Web mais l’extraction en est difficile, tout du moins en attendant la généralisation des microformats…

J’avais présenté quelques outils sur le sujet qui sont plus ou moins simples à appréhender dont Web Harvest en Java mais qui nécessite quand même de solides connaissances en XQuery et XPath.

Dernièrement au fil d’un commentaire Amine a évoqué également l’outil Scrapy qui est en python et qui est plus une bibliothèque de scripts, un framework permettant de paramétrer de l’extraction de contenus issus du web de façon précise.

Maintenant je voulais vous montrer ce que cela peut donner technologiquement une fois que c’est fonctionnel.

La petite vidéo ci-après est issue de la technologie qu’a développé Sam et qui m’a aidé sur la conception de la cartographie de l’intelligence économique.
C’est lui qui a développé ce petit extracteur en technologie Ruby.

On le voir ici lancer une extraction des résultats d’une requête faîte sur se loger.
Cette extraction lui permet d’extraire en quelques minutes le prix, l’agence immobilière, le type du bien + sa surface, le téléphone et l’URL.

Le tout lui est restitué dans un beau fichier Excel (mais on pourrait imaginer d’autres formats comme un dump MySQL par exemple…) voir une alimentation directe en base de données.

Maintenant ne rêvez pas non plus. Ce que l’on ne voit pas derrière c’est le paramétrage de la solution qui doit être fait pour chaque site.

L’extraction de ces données, bien qu’elles soient publiques, doit se faire de façon méthodique et « chirurgicale », avec une grande précision.

Dans le cadre de l’analyse des réseaux (nombre de liens, intensité des liens, etc), il est d’autant plus nécessaire de mener cette extraction de données de façon méthodique, tout en conservant les liens entre ces dernières.

Aujourd’hui nous avons testé cette solution et paramétré différents modules d’extraction sur Twitter, Facebook, Viadeo, LinkedIn et cela fonctionne particulièrement bien en exploitation surtout pour l’analyse des réseaux humains mais également pour permettre de décrypter les écosystèmes d’influence, des communautés.

]]>
http://www.actulligence.com/2011/02/27/web-scraping-web-harvesting/feed/ 4
Support de formation à Website Watcher http://www.actulligence.com/2011/02/21/support-de-formation-a-website-watcher/ http://www.actulligence.com/2011/02/21/support-de-formation-a-website-watcher/#comments Mon, 21 Feb 2011 22:45:18 +0000 Frédéric Martinet http://www.actulligence.com/?p=1660 Un mois sans vrai billet, ça valait bien la peine que je me fende d’un vrai boulot.

Donc aujourd’hui je vous propose un support de formation à Website Watcher que j’ai réalisé.

Website Watcher est un logiciel  de veille « old school ». Le genre de logiciel qui a vu le jour au début des années 2000, développé par Martin Aignesberger, et dont la fonction principale d’aller visiter régulièrement des sites webs et de vous prévenir quand certains types de changements survenaient.

Ce type de logiciel, monoposte, mono-utilisateur et dont la cible évidente reste les professionnels de la veille ou de l’information-documentation n’a plus torp le vent en poupe depuis maintenant plusieurs années. On y préfère souvent les plateformes tout intégrées permettant de couvrir une partie plus importante du cycle de la veille et plus particulièrement la partie capitalisation et diffusion ou au contraire des dispositifs plus simples reposant sur l’utilisation d’un lecteur RSS.

Que j’ai pu l’entendre critiquer ce pauvre petit logiciel Website Watcher Et pourtant, et ce la n’engage que moi, il est aujourd’hui un des logiciels métiers incontournables pour ceux qui veulent surveiller des sites pointus se protégeant contre les crawleurs extérieurs.

Depuis son existence Website Watcher s’est perfectionné, amélioré, affiné, musclé.

C’est aujourd’hui le tout terrain de la veille et peu de sites lui résistent. J’espère que ce support de formation vous aidera à y voir plus clair… et vous  incitera peut être à le tester.

Quels sont les points forts, en vrac, de Website Watcher ? Attention  liste non exhaustive :

  • Website Watcher permet de surveiller des sites en profondeur à partir d’une page de départ. Il ira suivre les urls que vous lui auraient précisées. Il dispose pour cela de fonctionnalités de filtre avancées permettant de sélectionner les URLs selon leur forme.
  • Website Watcher dispose d’un système de macro lui permettant de simuler une connexion à un espace protégé par des identifiants ou de faire des requêtes automatisées sur des moteurs de recherche (utilisant le protocole POST). A titre d’exemple c’est un des seuls logiciels de veille qui permet de surveiller certains sites d’appels d’offres.
  • Website Watcher dispose de tout un ensemble de filtres apprenants : il va détecter les changements survenant entre deux versions de pages et pourra par exemple générer automatiquement des REGEX, des règles permettant de filtrer certaines variations parasites.
  • Website Watcher n’est pas cher !!! C’est sans conteste un investissement efficace en diable pour la modique somme de 100 €.
  • Website Watcher fonctionne ! Il ne plante que rarement (cela peut quand même lui arriver de rencontrer quelques défaillances mais pas plus qu’un pack Office par exemple).
  • Website Watcher dispose d’un langage de programmation intégré qui pourra vous permettre de pousser très loin sa personnalisation pour peu que vous disposiez de compétences informatiques. A titre d’exemple, la communauté de ses utilisateurs propose des plugins permettant de faciliter la surveillance de certains types de CMS ou de forums tels que vBoard ou PHPBB…

Mais alors quels sont ses points faibles ???

Il en a quand même quelques uns…

  • C’est compliqué. Hé oui mon bon monsieur et ma bonne dame. Certains outils demandent des compétences. Il ne suffit pas de porter un jean slim et une chemise entrouverte pour que ca vous claque des jolis graphes dashboardés couleurs pastels / web 2.
  • C’est moche. Conséquence plus ou moins directe du point précédent… et du fait que techniquement il y ait pléthores d’interfaces de paramétrage.
  • Il ne permet pas de « découper » une page pour n’en surveiller qu’une seule partie.
  • Comme tous les logiciels de veille il bloque sur les javascripts propriétaires qui permettent de suivre certains liens.
  • Heu… c’est pas français… (pardon on me dit dans l’oreillette que c’est pas forcément un problème…)

Mais à part ces quelques points noirs, ou plutôt gris tout au plus, il saura rapidement se rendre indispensables pour ceux qui ont à surveiller des sites complexes et qui réalisent des veilles un petit peu « touchys »?

Bon donc voilà, le support est à vous.

Parcourez, essayez, amusez vous.

C’est un support de premier niveau qui n’aborde pas entre autre la personnalisation des sorties ou bien encore la programmation.

Mais bon en cas de besoin ;) je fais aussi des formations en vrai. Avec un numéro de déclaration, des attestations. Tout ce qu’il y a de plus sérieux.

Publicité

]]>
http://www.actulligence.com/2011/02/21/support-de-formation-a-website-watcher/feed/ 11
Support de conférence « Twitter et la veille » par Actulligence http://www.actulligence.com/2010/10/01/twitter_et_la_veille/ http://www.actulligence.com/2010/10/01/twitter_et_la_veille/#comments Fri, 01 Oct 2010 13:05:05 +0000 Frédéric Martinet http://www.actulligence.com/?p=1420 Hier j’ai eu l’honneur et le plaisir d’intervenir dans le cadre des journées annuelles qui réunissent les adhérent(e)s du Réseau National de Documentalistes Hospitalières.

A cette occasion j’ai pu pendant deux heures leur présenter Twitter et son utilisation dans le cadre d’un contexte professionnel incluant un focus sur son utilisation et ses fonctions pour la veille.

La salle fût légèrement agitée, l’intervention n’ayant visiblement pas laissée indifférent.

Et c’est avec plaisir que je vous propose donc de télécharger le support de cette conférence accessible à l’adresse :

http://www.actulligence.com/ressources/telechargement/?did=29

Bonne lecture !

Publicité

Spotter, spécialiste de l'e-reputation et de la veille image

]]>
http://www.actulligence.com/2010/10/01/twitter_et_la_veille/feed/ 0
Veille sur Internet & furtivité : enfin la vérité… http://www.actulligence.com/2010/09/06/veille-sur-internet-furtivite-anonymat-enfin-la-verite/ http://www.actulligence.com/2010/09/06/veille-sur-internet-furtivite-anonymat-enfin-la-verite/#comments Mon, 06 Sep 2010 21:51:19 +0000 Frédéric Martinet http://www.actulligence.com/?p=1395 Dans la veille on est souvent connecté avec des logiciels à Internet. Souvent même.

Et parfois l’on utilise des logiciels de veille.

Et dans certains cas, des clients se posent des questions sur les problématiques de l’anonymat ou plus précisément de ce que nous pourrions appeler « furtivité ». En gros, que votre action de veille soit la plus invisible possible pour les sites qui en sont l’objet qu’il s’agisse de vos concurrents ou d’autres.

La problématique est vaste et comporte certains aspects techniques qui je l’espère n’effraieront pas la plupart d’entre vous. (Lecteur, j’ai confiance en toi!)

Il y a par ailleurs maintenant plusieurs mois à l’époque où je travaillais pour un éditeur de logiciel de veille, j’avais apporté quelques réponses concrètes à ce sujet en étant le plus objectif possible.

Vous pourrez bien évidemment consulter le message en question sur la sacro-sainte liste Veille à l’adresse ci-après :
http://fr.groups.yahoo.com/group/veille/message/23394

A l’époque c’était déjà assez solide comme réponse mais là je vais essayer de donner dans la pédagogie.

Bon reprenons maintenant depuis le début.

Tout d’abord en veille on distingue deux types de logiciels :

  • le logiciel installé chez le client sur un poste utilisateur dans le cas d’un logiciel monoposte ou sur un serveur « mutualisé » (hébergeant plusieurs applications ») ou sur un serveur dédié.
  • un logciel en SaaS, c’est à dire hébergé chez l’éditeur ou hébergé par l’éditeur chez un prestataire d’hébergement (et là aussi on distingue les deux types mutualisé et dédié (Oui : ne vous leurrez pas, des fois certaines de vos données confidentielles sont hébergées sur le même serveur que d’autres clients du dit éditeur même si vous ne le voyez pas forcément…)

Quelles sont les traces que vous laissez lorsque vous êtes hébergé chez vous et que vous faites de la veille sur Internet ?

1) La première trace est celle de votre proxy. Le proxy étant la machine qui connecte l’entreprise à Internet (sachant que les ordinateurs d’une même entreprise partagent le même proxy souvent). Dans le meilleur des cas ce proxy porte un nom générique, ou « bidon » ou bien il permet juste de voir l’adresse IP du proxy. Dans le pire des cas il portera le nom de l’entreprise, voire précisera l’établissement dont il s’agit. Et pour illustrer le tout quelques screenshots ci-après tirés de mes logs:

Donc en gros là je peux voir clairement de nombreuses entreprises qui se connectent à mon site web… Y a tout un tas d’application directes : prospection commerciale (ce ce que je ne fais pas encore), détection de plagiat, …

Mais bon, ne noircissons pas le tableau tout de même… c’est pas encore interdit d’aller visiter tous les jours les sites de ses concurrents et que ce dernier le sache. Il est pas stupide non plus et ne vas pas mettre des données sensibles (enfin normalement).

Paradoxalement les PME / TPE sont pour le coup souvent beaucoup plus furtives car elles passent par un abonnement Internet parfois grand public et leur proxy est en gros la plaque ADSL du coin qui permet de connecter plusieurs milliers de personnes.

Dans ce cas là on a un proxy du style : « bstou254 toulouse bloc 1″  qui à part la zone géographique de connexion ne nous en dit pas trop.

2) La seconde trace c’est celle de votre parcours…
Prenons ci-dessus l’expemple du Ministère de l’Intérieur. Force est de constater qu’ils apprécient mon site et qu’il vont y lire certains billets…
On saura par exemple qu’ils s’intéressent à ma société et que le billet Mikados la petite faiblesse qui vous perdra a également fait partie de leur playlist plutôt deux fois qu’une…bizarrement.

On verra aussi le nombre de visites, de pages et les articles et le temps passé sur chacun d’eux ci-dessous pour BNP Paribas.

On voit bien déjà que c’est beaucoup plus parlant : rubriques surveillées, éventuellement le nombre de visites sur chacun des articles qui vous permettraient de voir s’il y a eu un fort impact chez votre concurrent, etc.

3) La troisième c’est les mots clés qui vous ont menés ici. Concrètement si dans votre logiciel de veille vous avez paramétré une requête Google ou autre moteur et que vous la mettez en surveillance, ces mots clés sont récupérés par le logiciel de stats (ici en l’occurrence Google Analytics). ET pour se marrer on continue et on croise les données stats entre elles pour recouper quelles sociétés demandent quel mots clés.
Ci-après on verra par exemple qu’une personne au Ministère de l’intérieur s’intéresse à une « licence veille » mais aussi à la recherche « intelligence economique » et enfin à « Actulligence Consulting » (moi aussi je vous aime) et que les personnes de chez Alma Consulting Group s’intéressent à un de leur concurrents ACIES qui grâce à moi jouissent d’une formidable visibilité sur les moteurs de recherche.

Bon alors. Qu’est ce qui pourrez encore vous faire dire « la vache c’est flippant quand même !!! »

4) Imaginons que de votre logiciel de veille vous copiez un contenu vers un support interne : intranet, extranet, ged, ou autre. Pas de chance dans ce billet vos incluez un lien vers l’article original. et là vous êtes flashé. Oui : le destinataire obtient les URL de certaines de vos applications qui a priori n’ont pas à être publiques… tout simplement parce que la le site web de destination enregistre votre URL de provenance, on appelle ca le referrer.
Par exemple dans le screenshot ci-dessous je sais que deux sites avec une URL un peu spécifique ont inclus du contenu avec un lien vers mon site. Par la même occasion on déterminera les URL d’accès à deux plateformes de veille et on captera le nom d’un client du dit éditeur. On apprend donc que la société Ami Software a pour client Meyer Partenaires.

Donc voilà pour la partie concernant les logiciels de veille intégrés chez le client.
(Sachant que certains points se recoupent avec la suite.)

Maintenant en ce qui concerne les solutions de veille SaaS.

Que dévoilent-t’elles de vous  et de quelles façon ?

1) D’abord elles dévoileront surtout qu’un logiciel de veille est passé sur un site… et parfois dans le pire des cas elles feront la même erreur que les proxys d’entreprise en donnant un nom explicite à votre plateforme (cf le dernier point de la partie précédente…)

2) les plateformes de  veille SaaS se comportent comme des hôtes (elles encapsulent du trafic)  mais ne cachent pas tout. Par exemple ci-après j’ai croisé l’hôte Digimid-Evolution avec le fournisseur d’accès et on voit bien que j’ai des connexions émanant du Crédit Agricole,de Scor, de SmithKline, … à l’intérieur d’une plateforme Digimind (et on peut bien sur appliquer les mêmes croisements sur les URL visitées and so on.)

Dernier point abordé et valable pour les deux, il est des fois possible de faire des requêtes complexes avec plein de mots clés sur certains sites…. : sachez que tous ces mots clés, tous ces paramètres sont visible par le site que vous surveillez… Ne soyez jamais donc trop précis.

Voilà.

Et pour conclure, je serais tenté de vous dire de bien veiller à tous ces aspects.
Il se fait un peu tard mais j’évoquerai dans un prochain billet les possibilités pour pallier à certains de ces problèmes.

Coming soon, stay tuned !

NB 1 : Pour l’intégralité de ce billet j’ai utilisé uniquement les logs statistiques fournis gratuitement par Google Analytics. Pour mémoire les logs de visites de sites ne sont pas des données nominatives. J’ai veillé à prendre des exemples parlants mais pas trop « gênants » (je n’ai par exemple pas exploité les recherches internes faites directement sur mon site mais uniquement celles effectuées via Google) et je n’ai exploité qu’une petite partie des possibilités fournies par cet outil. Les reccherches internes faites sur un site couplées au nom du proxy reste une donnée souvent très parlante… à bon entendeur…

NB 2 : quelques soient les exemples pris, il me semble bon de rappeler que la veille sur Internet est à priori totalement légale, ne constituant qu’à exploiter des données publiques. La façon de le faire peut toutefois dévoiler des choses importantes liées à vos centres d’intérêt surtout à partir du moment où la collecte est massive, répétée et où vous n’en maîtrisez pas bien la plupart des maillons informatiques (logiciels et matériels.)

]]>
http://www.actulligence.com/2010/09/06/veille-sur-internet-furtivite-anonymat-enfin-la-verite/feed/ 30
Sindup vous offre un outil de scoring de sources http://www.actulligence.com/2010/04/22/sindup-vous-offre-un-outil-de-scoring-de-sources/ http://www.actulligence.com/2010/04/22/sindup-vous-offre-un-outil-de-scoring-de-sources/#comments Thu, 22 Apr 2010 21:16:32 +0000 Frédéric Martinet http://www.actulligence.net/site/?p=953  Sindup, plateforme de veille stratégique et de brand monitoring

Le monde de la veille c’est un mode qui vit dans des flots d’information. C’est un monde numérique mais c’est surtout un monde de personnes et d’échanges entre les personnes.

A l’occasion d’un déplacement à Angers, alors que j’étalais ma vie privée sur Facebook et autres réseaux sociaux, mettant gravement en jeu ma sécurité (sic), je fus contacté par Mickaël Réault de Sindup, qui apprenant ma venue dans son « arrondissement », me proposa d’échanger quelques propos autour d’une table angevine.

La soirée fut riches en échanges et parmis ces échanges se trouvait un petit projet que j’avais dans ma besace depuis quelques temps : proposer un outil de scoring des sources à tous les veilleurs. Mais quelques compétences me manquaient en PHP/ My SQL pour parvenir au résultat que je visais.

Cela tombait bien car chez Sindup, en plus des compétences en veille ils sont plutôt solides côté développement informatique.

L’idée plut à Mickaël qui fit travailler l’équipe de Sindup sur la finalisation de ce script et l’intégration de cette même fonctionnalité dans sa plateforme de veille.

Et le résultat est aujourd’hui là !

Désormais Sindup propose aux utilisateurs de sa plateforme de qualifier les sources d’information en fonction d’un nombre important de critères.

Ici pas d’indicateur mystico-statistiques maison. On se repose sur du concret ou en tout cas sur de l’indicateur qui existe depuis fort fort longtemps (à l’image du Web) : Google PageRank, Inbound links, Yahoo Indexed pages, présence ou non sur Dmoz, Alexa Rank, nombre de fois où la source est bookmarkée dans Delicious, nombre de lecteurs dans le cas d’un flux Feedburner…

Bref, toute une floppée d’indicateurs. L’objectif n’est pas d’avoir un indicateur unique, synthétique magique, mais d’avoir un ensemble de critères quantitatifs qui permettent d’évaluer une source, de filtrer une liste de sources en fonction des besoins du veilleur ou de l’analyste.

Et certes me direz vous ces indicateurs ne sont pas tous très fiables. Oui. C’est vrai. Mais par contre ils peuvent permettre de faire la différence entre deux sources.

C’est bien un outil d’aide à l’analyse dont il s’agit. Un outil qui permet de supputer que le post incendiaire publié par bogosse33 sur son Skyblog revête une importance très modeste avec 15 pages indexées et un PageRank de 1, ou au contraire de vous apercevoir que le blog spécialisé en cuisine de Maïté, il faudrait peut être faire attention à ce qu’elle dit sur vos derniers petits plats micro-ondables parce que son Technorati Rank de 172 et son PR de 6 c’est pas la même histoire.

Alors comment ça fonctionne ???

C’est tout simple :

1) Je me connecte sur ma plateforme Sindup

2) Si vous venez tout juste de créer votre compte Sindup, vous trouverez un menu « Sélectionner mes sources » dans la colonne de gauche ou si vous avez déjà utilisé cette fonction, un menu « Mes sources » avec un [+] cliquable

3) J’upload un fichier de mes sources format OPML, TXT, ou autres formats tels que bookmarks Firefox, etc.

4) En quelques minutes les sources qui font déjà partie de la base d’index de Sindup sont reconnues et leurs indicateurs s’affichent dans l’onglet « Sources ». Pour les nouvelles sources il vous faudra patienter de quelques minutes à quelques heures maximum.

5) Il ne vous reste plus qu’à filtrer vos sources ou alors à les trier par des entêtes de colonnes cliquables. De plus, à partir de maintenant, vous retrouverez les sources ajoutées à cet endroit, dès que Sindup aura procédé à leur indexation.

6) Et comme ils sont gentils chez Sindup vous pouvez même récupérer votre fichier de sources au format Excel, enrichi des indicateurs.

Je tiens à préciser que cette fonctionnalité est proposée gratuitement par SIndup : il vous suffit de disposer d’un compte utilisateur gratuit pour pouvoir proposer vos sources à Sindup et en obtenir une notation automatique selon les critères listés précédemment.

Donc de mon côté, je tiens à féliciter Mickaël et ses équipes pour le travail. Je suis l’aventure de Sindup plus ou moins de loin et plus ou moins depuis ses débuts. Leurs progrès en termes d’ergonomie, de restitution mais également de fonctionnalités vont croissants.

Il leur aura fallu à peine un peu plus d’une semaine pour intégrer cette nouvelle fonctionnalité de façon parfaitement claire et transparente pour l’utilisateur. On peut en faire des choses en une semaine quand on sait programmer (sachant qu’ils n’ont pas non plus arrêté de bosser pour leurs clients entre temps…)

Par ailleurs, il est probable que cette fonctionnalité sera amenée à évoluer.

Dans les dernières nouveautés de la plateforme Sindup que j’ai constaté à l’occasion de ce projet : la surveillance de site. Niveau de profondeur à l’appui. Certes le paramétrage reste assez basique sur la modularité du niveau d’alertes, mais c’est une fonctionnalité de plus qui vient renforcer la plateforme Sindup et qui est dans sa logique user friendly.

Egalement dans les dernières nouveautés de Sindup, la possibilité d’exclure une ou plusieurs sources d’un filtre afin de limiter le bruit généré par certaines sources sur des requêtes spécifiques.

Bien évidemment aussi, à chaque connexion sur Sindup, on trouve un nombre de sources indexées qui va crescendo.

Et pour finir, Sindup et moi-même donc, vous proposons de télécharger le script PHP qui vous permettra d’uploader une liste de sources, de les faire qualifier, et d’exporter cette liste avec les critères de qualification au format Excel.

Nous souhaitions avec cet outil, proposer quelque chose à la communauté des veilleurs et surtout à ceux qui oeuvrent dans l’e-reputation, un domaine de veille dont le contenant et son audience a souvent autant d’importance que le message véhiculé.

Attention, l’installation de ce script peut nécessiter quelques compétences informatiques, mais vous trouverez ci-dessous la marche à suivre.

  • Téléchargez le fichier ZIP suivant
  • Dézippez dans un répertoire nommé : «scoring »
  • Uploadez le dossier et son contenu à la racine de votre site web
  • Connectez vous sur : www.votrenomdedomaine.com/scoring/
  • Uploadez vos sources via l’interface
    • Vos sources doivent être saisies dans un fichier TXT brut comprenant une URL par ligne
  • Laissez mijoter quelques minutes
  • Exportez le fichier résultant
    • L’export vous est proposé au format CSV

NB : Sur certains hébergements mutualisés le script peut ne pas fonctionner selon les fonctions autorisées ou bloquées. Il faut par ailleurs que votre serveur tourne sous PHP5. Sinon, pas de problème, il vous suffira de créer un compte Sindup et de tester la fonctionnalité via leur plateforme.

Nous espérons tous que ce script vous sera utile et n’hésitez pas à le diffuser autour de vous mais également à nous faire part de vos retours, voire même de vos améliorations.

PS : malgré le ton adopté qui peut sembler décontracté, je tenais vraiment à remercier Mickaël qui a répondu favorablement et quasi instantanément à cette proposition, et qui malgré le travail que cela lui a demandé a accepté de diffuser librement ce script.

Pour aller plus loin :

]]>
http://www.actulligence.com/2010/04/22/sindup-vous-offre-un-outil-de-scoring-de-sources/feed/ 6
Wiki des solutions de social media monitoring http://www.actulligence.com/2010/04/20/wiki-des-solutions-de-social-media-monitoring/ http://www.actulligence.com/2010/04/20/wiki-des-solutions-de-social-media-monitoring/#comments Tue, 20 Apr 2010 21:11:53 +0000 Frédéric Martinet http://www.actulligence.net/site/?p=951 La liste des outils de social media monitoring et d’e-reputation est plus que conséquente. Difficile parfois de sy’ retrouver.

Arnaud d’As-Map, qui pense à me rappeler de bloguer, m’envoie ce lien particulièrement intéressant pour tous ceux qui souhaitent disposer d’une ressource récapitulative sur les solution de social media monitroing.

« Wiki of Social Media Monitoring Tools » proposé par Ken Burbary et comprenant de nombreux contributeurs de prestige tels que Michelle Sullivan, Len Kendall, Christine Fife,

Il s’agit comme son nom l’indique d’un Wiki et il vo us est donc possible d’en devenir contributeur en effectuant la demande via la page d’administration.

Le site est en anglais et ne propose qu’une liste des solutions. Pas d’évaluation ou de descriptif détaillé des solutions. On y trouvera par contre le nom de la société, le nom des services (de la plateforme souvent), le type de médias sociaux couverts,si le service est payant ou gratuit, l’URL d’accès au service, et le pays de la société.

On y retrouve des pure players de l’e-reputation tels que Radian 6, Attentio, Biz360, Scoutlabs mais également des moteurs ou métamoteurs tels que Google Blog Search, BoardTracker, BoardReader etc…

Une liste non exhaustive mais déjà trés complète avec 133 solutions listées.

A consulter de toutes urgences et à parcourir pour se faire une idée des solutions à côté desquelles vous auriez pu passer.

]]>
http://www.actulligence.com/2010/04/20/wiki-des-solutions-de-social-media-monitoring/feed/ 2
DIY : Mise en place d’un outil de veille collaboratif http://www.actulligence.com/2010/04/07/diy-mise-en-place-dun-outil-de-veille-collaboratif/ http://www.actulligence.com/2010/04/07/diy-mise-en-place-dun-outil-de-veille-collaboratif/#comments Wed, 07 Apr 2010 20:09:48 +0000 Frédéric Martinet http://www.actulligence.net/site/?p=924 Bien souvent l’on me pose la question de savoir s’il est possible de faire de la veille dans les PME. C’est une problématique récurrente pour les institutions, qui sont souvent en première ligne des programmes de « sensibilisation » des entreprises à l’intelligence économique.

Force est de constater que si ces dernières font bien leur œuvre pour la sensibilisation elles sont souvent dans l’incapacité de proposer des solutions concrètes aux PME.

Alors oui on leur propose bien des RSS, un agrégateur de flux, etc… Mais rares sont les solutions qui parviennent à couvrir de façon assez efficace les phases de collecte, de traitement et de diffusion et qui plus est de façon collaborative.
Or, Lozère Développement, qui a fait il y a quelques années l’acquisition de KB Crawl, a su l’utiliser de la façon la plus optimale possible et est parvenue à créer un vrai système de veille collaborative.

L’objectif de Lozère Développement était de disposer d’une plateforme de veille en coopération permettant d’identifier, de sélectionner et de diffuser auprès des entreprises une veille thématique. Si Lozère Développement assure la maîtrise technique de la solution, plusieurs partenaires institutionnels participent à la sélection et à la publication des contenus de veille les plus intéressants. L’information est ensuite diffusée sur un portail web sécurisé accessible aux entreprises lozériennes.
Afin de vous en expliquer le fonctionnement je vais vous en présenter toutes les briques techniques et l’organisation autour de cet outil.

1ère étape: la collecte.

Lozère Développement a identifié des filières importantes pour le département. Après des entretiens avec des entreprises locales et les partenaires institutionnels de chacune de ces filières, les sources d’informations essentielles et les axes de veille majeurs pour chacune des filières ont été identifiées. Deux groupes de veille ont été constitués, un sur la thématique agroalimentaire, un second sur l’éco-construction. Dans le cadre du programme de sensibilisation des entreprises à l’Intelligence Economique « Cybermassif 2010 », Lozère Développement a fait l’acquisition du logiciel KB Crawl version 3 et du module d’export des données KBC 2 XML qui permet de transformer les documents collectés par le système de veille et de les exporter au format RSS.

La veille a ainsi été paramétrée par des veilleurs, formés au logiciel, au sein de Lozère Développement, sur le logiciel KB Crawl.
Le flux RSS de veille brut ainsi généré est exporté sur un serveur Web afin d’être accessible à Google Reader.

2ème phase : le traitement

Il s’agit ici d’un traitement sous forme de filtre. Une fois les flux de veille bruts au format RSS mis en ligne sur une adresse sécurisée, ils sont ajoutés à Google Reader. La solution de veille s’appuie sur le système de veille individuelle de chaque veilleur. Les veilleurs disposent d’une expertise technique dans un domaine spécifique. Chaque veilleur réalise sa veille à partir des flux RSS générés par KB Crawl et peut décider de republier sur le portail de veille un contenu jugé intéressant directement à partir de son agrégateur RSS.

Variation : Cette phase de filtre peut aussi se faire via l’outil FeedDemon, solution client, qui se synchronise parfaitement avec Google Reader et offre une rapidité de traitement plus importante.

3ème phase : capitalisation

Une fois les documents collectés filtrés, ces derniers sont importés dans la solution de capitalisation, de publication et de partage. Lozère Développement a opté pour la solution Joomla qui est par ailleurs la solution Open Source sur laquelle s’appuyait la solution plateforme que proposait KB Crawl SAS à l’époque. Joomla est un CMS intéressant qui correspondait aux besoins de Lozère Développement : capaitalisation d’informations en rubriques et sous rubriques, gestion des droits utilisateurs en lecture, écriture, modifications.

Par ailleurs, Lozère Développement s’est appuyée sur un plugin Joomla qui permet de capitaliser en base de données un flux RSS : cela évite de les copier coller, et le plugin, simple d’installation, permet d’optimiser le traitement de la chaîne d’information.

Le plugin en question est : « Article Generator » (http://extensions.joomla.org/extensions/external-contents/automatic-articles/8956) qui est un plugin sous licence GPL mais payant. Ce dernier est hautement paramétrable et peut gérer plusieurs flux. Il gère également l’ajout de tags correspondant à chacun des documents collectés.

Une fois ces documents directement importés en base, ces derniers étant propres, plusieurs options sont possibles.
- Les veilleurs de la plateforme peuvent en retoucher certains au besoin, rédiger des commentaires.
- Les experts externes, faisant partie du projet de veille collaborative peuvent supprimer des documents, rajouter leurs commentaires métiers.

4ème phase : la diffusion

Toutes les semaines plusieurs newsletters thématiques, incluant les éléments rajoutés, les synthèses réalisées, peuvent être envoyées aux destinataires de la veille. Pour cela la solution de capitalisation Joomla retenue s’appuie sur le module de NewsLetter : « Acajoom »

Le module de newsletter permet la gestion de plusieurs newsletters et de liste de destinataires.

Systeme de veille collaboratif mis en place par Loezre Developpement

Budget : le budget logiciel du projet est de l’ordre de 4 000 € sachant qu’aujourd’hui, les prix de la licence KB Crawl ont augmentés et surtout que la V3 n’est plus commercialisée. Mais la V4 comporte également un module d’export XML qui permet de répliquer le schéma proposé ci-dessus.

Vous trouverez ci-dessous le schéma récapitulatif que Ludovic Toussaint, chef de ce projet, m’a fait parvenir pour illustrer le dispositif.

Conclusions :

En travaillant sur la mise en place d’un dispositif opérationnel, concret et outillé, Lozère Développement a su se doter d’un socle solide pour initier une démarche de veille à moindre budget. L’objectif de ce projet est bel et bien de montrer aux entreprises de petite taille qu’il est possible de faire vraiment de la veille à moindre frais avec de bons outils.

Une des préoccupations qui était de limiter le budget investi n’a pas impacté la qualité de la solution logicielle bâtie.

En s’appuyant sur un CMS Open source pour la capitalisation et la diffusion, Lozère Expansion a su s’affranchir d’un coût important et garder la maitrise totale de ce projet, la version de KB Crawl 3 ayant été achetée définitivement.

Commentaires personnel :

Il est bon de voir des institutions qui ne s’en tiennent plus qu’aux discours mais se donnent également les moyens d’optimiser les démarches de veille en s’équipant de logiciels qui sont aujourd’hui le seul moyen de traiter au mieux une masse d’information devenue colossale.

Je profite de ce billet pour dire un mot sur le concours de création d’entreprises innovantes actuellement organisé par Lozère Développement. Une dotation financière de 10 000 € récompensera les meilleurs projets : http://beecreative.fr/

]]>
http://www.actulligence.com/2010/04/07/diy-mise-en-place-dun-outil-de-veille-collaboratif/feed/ 5
Sindup, plateforme de veille, se professionalise http://www.actulligence.com/2010/01/02/sindup-plateforme-de-veille-se-professionalise/ http://www.actulligence.com/2010/01/02/sindup-plateforme-de-veille-se-professionalise/#comments Sat, 02 Jan 2010 12:40:00 +0000 Frédéric Martinet http://localhost:8888/actu_migra/?p=402 Sindup, plateforme de veille stratégique et de brand monitoringCela fait maintenant à peu près de deux ans que Sindup s’est lancé sur le créneau des plateformes de veille sur sources ouvertes.

Je l’avais d’ailleurs déja testé à l’époque de son lancement et si j’y reviens c’est car la solution propose désormais une offre professionnelle plus complète.

Sindup fait partie de ces solutions qui intègrent un corpus de sources prépatramétrées et qualifiées, qui sont indexées tous les jours.

Le client n’a qu’à paramétrer sa surveillance du corpus en construisant ses requêtes de veille.

Il s’agit donc là d’un outil extrèmement simple à prendre en main et à exploiter.

Tout est fait pour que l’ergonomie soit exemplaire et que n’importe quel utilisateur puisse en quelques minutes mettre en place sa stratégie de veille.

Sindup propose aujourd’hui 53 000 sources d’information toutes francophones : des blogs, des forums de discussion, des sites d’actualités, des sites de communiqués de presse.

C’est un périmètre certes limité mais qui est amené à s’étendre en intégrant au fur et à mesure de nouvelles sources d’information. Ainsi Sindup prévoit d’intégrer à court terme les différents réseaux sociaux dans son corpus de sources et à plus long terme, le développement sur des sources internationales.

Tous ceux qui utilisent aujourd’hui des plateformes de veille dans lesquelles l’utilisateur doit paramétrer ses propres sources à mettre en surveillance savent que l’intégration de nouvelles sources est un enjeu majeur : d’abord trés chronophage et ensuite dont l’optimisation est complexe. Souvent l’intégration de nouvelles sources est génératrice de bruit : la définition du chemin de crawl demeure souvent complexe à restreindre et les pages sont souvent bruitées par les menus, ce qui donne une infomration qu’il faut souvent retravailler en nettoyant à la main lors de la phase de validation des informations.

Le choix fait par Sindup, et par d’autres, est de préparamétrer les sources en les prédécoupant et en nettoyant le code HTML afin de s’assurer que l’information collectée est "propre" et peut facilement intégrer un processus de validation et de publication sans travail lourd.

Un choix finalement trés reposant pour le veilleur. Un choix qui pose toujours la maîtrise de son périmètre de veille mais bon quel gain de temps au final.

Sindup, de par son positionnement fonctionnel et tarifaire s’adresse donc plus particulièrement aux PME qui souhaitent surveiller leur environnement.

Concernant l’offre justement, Sindup se différencie en proposant une offre grand public gratuite qui permet par exemple de :

  • Déposer des alertes
  • Enregistrer vos filtres de recherche
  • Classer vos actualités
  • Partager des dossiers de veille collaboratifs
  • Rechercher dans l’historique

Le nombre d’alertes paramétrables reste toutefois limité.

Sindup propose également une version professionnelle, plus aboutie et permettant en plus de créer très simplement des rapports d’analyse relativement complets en choisissant le type de sources exploitées dans le rapport, les modules d’analyse (Sujets importants, Analyse comparative : Comparaison de présence médiatique entre plusieurs entités. Sources influentes : Mise en avant des sources les plus productives autour d’un sujet, Répartition par thèmes : Mesure de l’importance de chaque thématique abordée, Répartition par types de sources : Evaluation et comparaison de la présence médiatique par type de sources, Historique : Evolution sur une période du volume d’articles traitant d’un sujet.)

Sindup, plateforme de veille stratégique et de veille image

Exemple de rapport réalisé sous Sindup (seuls deux modules sont visibles ici)

Dans son offre professionnelle, Sindup propose également d’intégrer des sources complémentaires en fonction des besoins de ses clients.

Comment fonctionne Sindup ?

1ère étape : réaliser ses requêtes (nommées filtres dans Sindup)

Vous choisissez votre thématique, vous construisez votre requête booléenne à la main si vous savez faire et sinon vous utilisez les cases du formulaire (tous les mots, expression exacte, un des mots), la période si vous souhaitez collecter l’antériorité ou cibler juste une certaine période d’analyse.

Sindup, plateforme de veille stratégique et d'intelligence économique

2ème étape (optionnelle) : vous vous abonnez aux alertes soit par mail soit par RSS. Chaque filtre donnant lieu à un RSS.
NB : pour les alertes vous les recevez par défaut sur l’adresse mail de votre compte mais vous pouvez si vous le souhaitez mettre d’autres destinataires en copie.

3ème étape : Vous réalisez des dossiers de veille. En gros vous cliquez sur un "+" et vous saisissez le nom du dossier et vous choisissez également quels filtres vont alimenter automatiquement ce dossier. Certains dossiers peuvent ne pas avoir de filtres rattachés et être alimentés à la main.

4ème étape : Vous décidez de classer certains contenus dans vos dossiers à la main (en plus du dispatching automatisé) Ce classement peut se faire par simple Drag & Drop, ce qui est extrèmement pratique et manque à beaucoup de plateformes de veille que je connais.

Sindup, plateforme de veille, d'e-reputation et d'intelligence économique

Point important : Sindup dispose d’une fonction FilterLive permettant d’analyser votre façon de classer à la main les documents dans vos dossiers et au bout d’un certain temps d’apprentissage la plateforme pourra réaliser cette redistribution manuelle automatiquement.

Cette fonction "FilterLive" repose sur un algorithme maison intégrant entre autre des fonctions de text mining.

NB : je n’ai pas eu le temps de la tester donc je ne me prononcerai pas sur les résultats à attendre de cette fonction mais sur le papier cela peut être intéressant bien que personnellement je sois attaché à maîtriser ma catégorisation pour tous les articles sortant du cadre de ce qui est traitable par requpete booléenne.

5ème étape : Vous pouvez consulter vos dossiers ou les résultats de vos filtres

6ème étape : vous réalisez vos rapports en choisissant vos modules. Chacun des modules peut être alimenté par l’un de vos dossiers de veille.

Côté corporate, Sindup c’est 7 personnes à temps plein uniquement Sindup, mais c’est aussi une SSII orienté projet Web, Hegyd qui est du coup à même de répondre à des projets plus complexes comportant par exemple des problèmes d’intégration avec d’autres outils (Sinequa par exemple.)

Sindup est basée à Angers.

Côté prix, Sindup facture en fonction du nombre de modules demandés et commence à 24,9 euros par mois par utilisateur.

La facturation est variable aussi en fonction du nombre d’alertes, le package de base en comprenant une dizaine.

Sindup propose également la gestion de projet et le paramétrage même si je pense que cela relèverait de la pure paresse de passer par leurs services sur ce point tellement la plateforme est simplissime d’utilisation.

Ils réalisent également des prestations et proposent la réalisation de rapports de veille périodiques.

De sources sur mesure peuvent être intégrées sans surcoût sur demande à partir du moment où il s’agit de sources publiques, mais Sindup propose également à leurs clients d’intégrer des sources personnelles et / ou confidentielles.

Sindup a également actuellement en phase de développement des modules de surveillance des marques et de surveillance des noms de domaine. Tiens tiens, décidemment !

En synthèse, mon avis

Les points forts de Sindup :

  • Facilité de paramétrage et d’utilisation de la plateforme de veille
  • L’information collectée est propre
  • Les sources d’information sont catégorisées
  • Le rapport qualité / prix est excellent
  • Le dashboard (rapport) très simple à utiliser et à paramétrer et restant efficace, sans fioriture

Les points faibles :

  • Aucune source internationale
  • Même les sources francophones me paraissent peu complètes à ce jour

Sindup fait partie de ces plateformes de veille comportant des sources préparamétrées. Sa similarité avec Synthesio reste forte surtout si on compare Sindup à Synthesio 1 an et demi en arrière.

Je suis de plus en plus persuadé que ces plateformes simples à prendre en main, avec des livrables orientés tableau de bord, ont une vraie carte à jouer dans le paysage des plateformes de veille qu’ils ‘agisse de veille stratégique, de veille concurrencielle ou d’e-reputation.

A titre personnel j’utilise Sindup depuis plusieurs années pour réaliser ma "petite veille" Intelligence Economique / e-reputation. Sindup n’est qu’un des outils que j’utilise mais je suis pleinement satisfait de ce qu’il propose.

PS : Sindup a également un blog. Pas trés actif pour le moment mais qui devrait booster prochainement.


l

]]>
http://www.actulligence.com/2010/01/02/sindup-plateforme-de-veille-se-professionalise/feed/ 5