Rechercher
Fermer ce champ de recherche.
Blog

Nos articles

Clear Forest Gnosis

Grâce au site du CRVS consacré aux outils de veille et de gestion de l’information je découvre cette fabuleuse extension qu’est Clear Forest Gnosis.

Clear Forest Gnosis est une extension Firefox qu’il vous suffit d’installer si vous souhaitez disposer d’une technologie d’extraction d’entités nommées que vous pouvez appliquer sur n’importe quelle page.

Pour résumer, lorsque vous êtes sur une page, lancez Clear Forest Gnosis (motorisé par Clearforest…qui est une compagnie de Thomson Reuters Company) et ce dernier extraira à l’intérieur de cette page tous les noms de villes, de compagnies, de personnes, de médias, de technologies, de termes industriels, etc.

Cette même reconnaissance des termes est accompagnée de la mise en place d’une navigation à l’intérieur de la page à travers la barre latérale dde l’addon. Chacun des termes est souligné d’une couleur selon qu’il s’agit d’une personne, d’une ville,…

J’ai testé sur deux ou trois pages et c’est particulièrement efficace. Pour tous ceux qui ont testé cette technologie sur Exalead par exemple, vous pourrez vous apercevoir que cela semble un peu plus fiable. Par ailleurs si on le compare encore à Exalead, Gnosis, qui s’appuie sur le toolkit OpenCalais WS de Thomson Reuters propose plus de type d’entités nommées (Exalead Enterprise Search propose par exemple par défaut les personnes, les organismes, les lieux seulement alors que Gnosis va bien au delà sachant reconnaîre par exemple les différents noms des médias ou des chaînes TV, des catastrophes naturelles, …

Cela est d’ailleurs normal puisqu’Exalead applique surtout une couche de reconnaissance de casse pour dégager les entités nommées alors que Gnosis s’appuie sur une véritable bibliothèque d’algorithmes sémantiques.

Malheureusement, Gnosis a un gros inconvénient : il ne permet d’utiliser ses fonctionnalités que sur des pages en anglais.

Pour aller plus loin vous pourrez :

Partager cet article

Autres articles

à consulter