<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	
	>
<channel>
	<title>
	Commentaires sur : Co-Lab Sémantique : La recherche d&#8217;information	</title>
	<atom:link href="https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/</link>
	<description>Transformez l&#039;information en action</description>
	<lastBuildDate>Thu, 06 Jun 2013 09:28:26 +0000</lastBuildDate>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.7.1</generator>
	<item>
		<title>
		Par : ponceblanc92		</title>
		<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-531</link>

		<dc:creator><![CDATA[ponceblanc92]]></dc:creator>
		<pubDate>Thu, 06 Jun 2013 09:28:26 +0000</pubDate>
		<guid isPermaLink="false">https://www.actulligence.com/?p=1442#comment-531</guid>

					<description><![CDATA[La pertinence des moteurs de recherche est un sujet très vaste et complexe. Il semblerait que Google aujourd&#039;hui, à défaut de pouvoir analyser tous les sites par des humains classe les sites non pas par pertinence mais par popularité. Dans bien des cas, cette démarche est légitime puisque l&#039;idée est de répondre à la demande des internautes mais cela nuit surement aux sites Internet aux contenus de fond, plus pointus et moins abordables au premier abord.]]></description>
			<content:encoded><![CDATA[<p>La pertinence des moteurs de recherche est un sujet très vaste et complexe. Il semblerait que Google aujourd&rsquo;hui, à défaut de pouvoir analyser tous les sites par des humains classe les sites non pas par pertinence mais par popularité. Dans bien des cas, cette démarche est légitime puisque l&rsquo;idée est de répondre à la demande des internautes mais cela nuit surement aux sites Internet aux contenus de fond, plus pointus et moins abordables au premier abord.</p>
]]></content:encoded>
		
			</item>
		<item>
		<title>
		Par : La recherche d&#8217;information à l&#8217;ère du web social &#124; Digital Reputation Blog		</title>
		<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-530</link>

		<dc:creator><![CDATA[La recherche d&#8217;information à l&#8217;ère du web social &#124; Digital Reputation Blog]]></dc:creator>
		<pubDate>Tue, 14 Dec 2010 10:07:48 +0000</pubDate>
		<guid isPermaLink="false">https://www.actulligence.com/?p=1442#comment-530</guid>

					<description><![CDATA[[...] Le schéma ci-dessous est issu d&#8217;une excellente thèse doctorale réalisée en 2004 par Carlos Castillo sur la collecte d&#8217;informations, intitulée Effective Web Crawling, disponible en téléchargement libre. Pour en savoir plus, je vous recommande également le billet de Frédéric Martinet à ce sujet. [...]]]></description>
			<content:encoded><![CDATA[<p>[&#8230;] Le schéma ci-dessous est issu d&#8217;une excellente thèse doctorale réalisée en 2004 par Carlos Castillo sur la collecte d&#8217;informations, intitulée Effective Web Crawling, disponible en téléchargement libre. Pour en savoir plus, je vous recommande également le billet de Frédéric Martinet à ce sujet. [&#8230;]</p>
]]></content:encoded>
		
			</item>
		<item>
		<title>
		Par : AmineDigirep		</title>
		<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-529</link>

		<dc:creator><![CDATA[AmineDigirep]]></dc:creator>
		<pubDate>Wed, 01 Dec 2010 15:32:45 +0000</pubDate>
		<guid isPermaLink="false">https://www.actulligence.com/?p=1442#comment-529</guid>

					<description><![CDATA[Salut Frédéric,

Je suis toujours lecteur de ton blog. Le contenu est de qualité et le ton est franc. Ton expérience a son poids ;-)

Concernant le Web invisible, il est difficile de le définir. Tant cette notion a évolué, comme tu le soulignes, avec l&#039;évolution des moteurs de recherche. Moi même, ma perception de ce sujet a évolué avec le temps.

Au début des années 2000, pour moi &quot;Web invisible = Formulaires&quot; à l&#039;instar des pagesjaunes. Ensuite, &quot;Web invisible = Formulaires + certains formats de contenu&quot;. Aujourd&#039;hui, toute l&#039;information publique (information qu&#039;on veut partager, indépendemment du format du contenu) est accessible ou le sera rapidement dans l&#039;avenir via les moteurs de recherches.

La notion d&#039;invisible, à mon sens aujourd&#039;hui, est associée à la notion de  communauté donc inhérente à une volonté humaine. Auparavant, la notion d&#039;invisible était liée à un savoir faire technique.

Tu as donné l&#039;exemple des réseaux sociaux qui est pertinent. J&#039;ajouterai l&#039;exemple d&#039;un réseau de blogeurs qui se référencent les uns les autres où aucun de ces blogs n&#039;est indéxé par un moteur de recherche et aucun de ces blogs n&#039;est référencé par un blog ou site extérieur qui est potentiellement indéxé. Dans ce cas, si les blogeurs eux mêmes ne cherchent pas à s&#039;indéxer, aucun moteur de recherche ne pourra indéxer le réseau de blogs.
==&#062; Je fais l&#039;hypothèse que les moteurs de recherches n&#039;ont pas accès aux données des hébergeurs de sites ;-) Est ce toujours vrai ?]]></description>
			<content:encoded><![CDATA[<p>Salut Frédéric,</p>
<p>Je suis toujours lecteur de ton blog. Le contenu est de qualité et le ton est franc. Ton expérience a son poids 😉</p>
<p>Concernant le Web invisible, il est difficile de le définir. Tant cette notion a évolué, comme tu le soulignes, avec l&rsquo;évolution des moteurs de recherche. Moi même, ma perception de ce sujet a évolué avec le temps.</p>
<p>Au début des années 2000, pour moi « Web invisible = Formulaires » à l&rsquo;instar des pagesjaunes. Ensuite, « Web invisible = Formulaires + certains formats de contenu ». Aujourd&rsquo;hui, toute l&rsquo;information publique (information qu&rsquo;on veut partager, indépendemment du format du contenu) est accessible ou le sera rapidement dans l&rsquo;avenir via les moteurs de recherches.</p>
<p>La notion d&rsquo;invisible, à mon sens aujourd&rsquo;hui, est associée à la notion de  communauté donc inhérente à une volonté humaine. Auparavant, la notion d&rsquo;invisible était liée à un savoir faire technique.</p>
<p>Tu as donné l&rsquo;exemple des réseaux sociaux qui est pertinent. J&rsquo;ajouterai l&rsquo;exemple d&rsquo;un réseau de blogeurs qui se référencent les uns les autres où aucun de ces blogs n&rsquo;est indéxé par un moteur de recherche et aucun de ces blogs n&rsquo;est référencé par un blog ou site extérieur qui est potentiellement indéxé. Dans ce cas, si les blogeurs eux mêmes ne cherchent pas à s&rsquo;indéxer, aucun moteur de recherche ne pourra indéxer le réseau de blogs.<br />
==&gt; Je fais l&rsquo;hypothèse que les moteurs de recherches n&rsquo;ont pas accès aux données des hébergeurs de sites 😉 Est ce toujours vrai ?</p>
]]></content:encoded>
		
			</item>
		<item>
		<title>
		Par : Frédéric Martinet		</title>
		<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-528</link>

		<dc:creator><![CDATA[Frédéric Martinet]]></dc:creator>
		<pubDate>Tue, 30 Nov 2010 16:16:29 +0000</pubDate>
		<guid isPermaLink="false">https://www.actulligence.com/?p=1442#comment-528</guid>

					<description><![CDATA[En réponse à &lt;a href=&quot;https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-527&quot;&gt;Amine BENHAMZA&lt;/a&gt;.

Hello Amine,
J&#039;espère que tu vas bien !!!
Ravi de voir que tu lis toujours Actulligence :)
Bon pour répondre à ta question le sujet du web invisible a bien été abordé... J&#039;ai juste oublié de le retranscrire.
Ta question me pose un vrai problème en fait... Que veut dire selon toi web invisible ? Quelle est lé définition du mot que tu emploies.
Qui dit invisible dit invisible... Si tu veux y voir plus clair fait une petite requête sur Actulligence : je pense que j&#039;avais repris cette définition assez précisément suite à un premier billet de Christophe Asselin.
Donc par définition on ne peut connaître sa taille. La structure même du web fait de toute façon qu&#039;il est très dur d&#039;en connaître la taille vu que &quot;le web&quot; est atomisé sur des milliers de serveurs qui hébergent les sites et autres.
Le calcul de la taille du Web est quasi impossible mais l&#039;on peut partir du postulat que celui qui est le plus près d&#039;en connaître la taille c&#039;est Google.
Pour le Web invisible, l&#039;estimation de sa taille, la répartition Web visible et Web invisible je laisse le soin aux médiums, devins et gourous webs de te répondre avec des offres qui de toute façon ne pourront qu&#039;être tirés de leur chapeau.

Ce que l&#039;on peut dire je pense quand même sans prendre de risques c&#039;est que :
- La taille du web invisible croît ne serait ce que par le réseau Facebook et autres réseaux sociaux.
- La taille du web global est en croissance forte.
- Les moteurs de recherche ont améliorés leur performance sur ce qui était le web invisible auparavant et qui du coup n&#039;est plus le web invisible si l&#039;on part de l&#039;hypothèse que l&#039;on inclut par Web invisibles les contenus difficilement accessibles pour un utilisateur lambda (enfouis trop profondément à l&#039;intérieur d&#039;un site web, très mal référencés voire pas du tout.) ... Et les acceptions du web invisible peuvent varier sur ce point là.... En quoi ils ont réussis cela : crawl des URL&#039;s complexes comprenant de nombreuses variables get, interrogation des bases de données publiques accessibles uniquement par un formulaire de recherche en injectant des mots  clés courants et en générant des pages de résultats, suivi des liens javascripts simples, crawl améliorés du Flash, crawl de plus en plus de formats de fichiers etc....

Voilà, donc désolé... Pas de chiffres à te donner...]]></description>
			<content:encoded><![CDATA[<p>En réponse à <a href="https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-527">Amine BENHAMZA</a>.</p>
<p>Hello Amine,<br />
J&rsquo;espère que tu vas bien !!!<br />
Ravi de voir que tu lis toujours Actulligence 🙂<br />
Bon pour répondre à ta question le sujet du web invisible a bien été abordé&#8230; J&rsquo;ai juste oublié de le retranscrire.<br />
Ta question me pose un vrai problème en fait&#8230; Que veut dire selon toi web invisible ? Quelle est lé définition du mot que tu emploies.<br />
Qui dit invisible dit invisible&#8230; Si tu veux y voir plus clair fait une petite requête sur Actulligence : je pense que j&rsquo;avais repris cette définition assez précisément suite à un premier billet de Christophe Asselin.<br />
Donc par définition on ne peut connaître sa taille. La structure même du web fait de toute façon qu&rsquo;il est très dur d&rsquo;en connaître la taille vu que « le web » est atomisé sur des milliers de serveurs qui hébergent les sites et autres.<br />
Le calcul de la taille du Web est quasi impossible mais l&rsquo;on peut partir du postulat que celui qui est le plus près d&rsquo;en connaître la taille c&rsquo;est Google.<br />
Pour le Web invisible, l&rsquo;estimation de sa taille, la répartition Web visible et Web invisible je laisse le soin aux médiums, devins et gourous webs de te répondre avec des offres qui de toute façon ne pourront qu&rsquo;être tirés de leur chapeau.</p>
<p>Ce que l&rsquo;on peut dire je pense quand même sans prendre de risques c&rsquo;est que :<br />
&#8211; La taille du web invisible croît ne serait ce que par le réseau Facebook et autres réseaux sociaux.<br />
&#8211; La taille du web global est en croissance forte.<br />
&#8211; Les moteurs de recherche ont améliorés leur performance sur ce qui était le web invisible auparavant et qui du coup n&rsquo;est plus le web invisible si l&rsquo;on part de l&rsquo;hypothèse que l&rsquo;on inclut par Web invisibles les contenus difficilement accessibles pour un utilisateur lambda (enfouis trop profondément à l&rsquo;intérieur d&rsquo;un site web, très mal référencés voire pas du tout.) &#8230; Et les acceptions du web invisible peuvent varier sur ce point là&#8230;. En quoi ils ont réussis cela : crawl des URL&rsquo;s complexes comprenant de nombreuses variables get, interrogation des bases de données publiques accessibles uniquement par un formulaire de recherche en injectant des mots  clés courants et en générant des pages de résultats, suivi des liens javascripts simples, crawl améliorés du Flash, crawl de plus en plus de formats de fichiers etc&#8230;.</p>
<p>Voilà, donc désolé&#8230; Pas de chiffres à te donner&#8230;</p>
]]></content:encoded>
		
			</item>
		<item>
		<title>
		Par : Amine BENHAMZA		</title>
		<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-527</link>

		<dc:creator><![CDATA[Amine BENHAMZA]]></dc:creator>
		<pubDate>Tue, 30 Nov 2010 11:20:11 +0000</pubDate>
		<guid isPermaLink="false">https://www.actulligence.com/?p=1442#comment-527</guid>

					<description><![CDATA[Article intéressant et enrichissant Frédéric.

Il y&#039;a un point qui n&#039;a pas été évoqué et qui me semble pertinent : est ce que les moteurs de recherche indexe l&#039;ensemble du web (visible et invisible) ?

Je pense profondément que non. Quelle est alors la proportion indexée chez les leaders : 20%, 40%, 80% ?]]></description>
			<content:encoded><![CDATA[<p>Article intéressant et enrichissant Frédéric.</p>
<p>Il y&rsquo;a un point qui n&rsquo;a pas été évoqué et qui me semble pertinent : est ce que les moteurs de recherche indexe l&rsquo;ensemble du web (visible et invisible) ?</p>
<p>Je pense profondément que non. Quelle est alors la proportion indexée chez les leaders : 20%, 40%, 80% ?</p>
]]></content:encoded>
		
			</item>
		<item>
		<title>
		Par : Tweets that mention Co-Lab Veille : La recherche d’information &#124; Actulligence.com &#124; Veille Stratégique, Intelligence Economique » -- Topsy.com		</title>
		<link>https://www.actulligence.com/2010/11/28/co-lab-veille-la-recherche-dinformation/#comment-526</link>

		<dc:creator><![CDATA[Tweets that mention Co-Lab Veille : La recherche d’information &#124; Actulligence.com &#124; Veille Stratégique, Intelligence Economique » -- Topsy.com]]></dc:creator>
		<pubDate>Sun, 28 Nov 2010 21:52:46 +0000</pubDate>
		<guid isPermaLink="false">https://www.actulligence.com/?p=1442#comment-526</guid>

					<description><![CDATA[[...] This post was mentioned on Twitter by Stephane Lacassagne and Frédéric Martinet, ALSAGORA. ALSAGORA said: RT @actulligence Co-Lab Veille : La recherche d’information &#124; Actulligence.com &#124; Veille Stratégiqu.. http://bit.ly/iaUPjv [...]]]></description>
			<content:encoded><![CDATA[<p>[&#8230;] This post was mentioned on Twitter by Stephane Lacassagne and Frédéric Martinet, ALSAGORA. ALSAGORA said: RT @actulligence Co-Lab Veille : La recherche d’information | Actulligence.com | Veille Stratégiqu.. <a href="http://bit.ly/iaUPjv" rel="nofollow ugc">http://bit.ly/iaUPjv</a> [&#8230;]</p>
]]></content:encoded>
		
			</item>
	</channel>
</rss>
