<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
         xmlns:err="http://jelix.org/ns/xmlerror/1.0">
 <channel>

	
    <title><![CDATA[Commentaires du blog: Verticrawl : solution Moteur de recherche]]></title>
    <link>http://blog-verticrawl.over-blog.com/</link>
    <description>Les 25 derniers commentaires publiés sur le blog &quot;Verticrawl : solution Moteur de recherche&quot;</description>

        <language>fr</language>
    
        <image>
        <url>http://fdata.over-blog.net/1/29/14/48/avatar-blog-1010994254-tmpphpySPRmd.gif</url>
        <title><![CDATA[Commentaires du blog: Verticrawl : solution Moteur de recherche]]></title>
        <link>http://blog-verticrawl.over-blog.com/</link>
                            </image>
    
    <pubDate>Fri, 03 Feb 2012 11:19:56 +0100</pubDate>    <lastBuildDate>Fri, 03 Feb 2012 11:19:56 +0100</lastBuildDate>    <generator>Over-blog.com RSS 2.0 Engine</generator>    <copyright>Copyright 2012 blog-verticrawl.over-blog.com</copyright>            <category>Hi Tech</category>    <docs>http://www.rssboard.org/rss-specification/</docs>                        
      <item>
        <title><![CDATA[Commentaire de davy]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12390345-6.html#comment66050821</link>        <description><![CDATA[
  <p>
    Trés bon article, bien rédigé et clair.
  </p>
  <p>
    Merci
  </p>

  
]]></description>
        <pubDate>Thu, 12 Aug 2010 16:01:36 +0200</pubDate>        <guid isPermaLink="false">4d6e6bf533b1d7dc730e402204fec13a</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Delarue]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment58340046</link>        <description><![CDATA[
  Voilà bot est probablement le&nbsp;moteur qui&nbsp;clique le plus sur les adresses des pages du site dont j'ai la charge.<br>
  Néammoins, ce que je trouve bizarre, c'est que les pages correspondantes ne sont pas nécessairement indexées.&nbsp;A l'inverse, &nbsp;des moteur qui&nbsp;cliquent moins&nbsp;indexent pourtant
  davantage de pages.<br>
  J'aimerais bien comprendre la raison de cette bizarerrie.&nbsp;

  
]]></description>
        <pubDate>Thu, 18 Mar 2010 12:10:49 +0100</pubDate>        <guid isPermaLink="false">02bb734158a6041cad2a894a91551333</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de developpeur]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment39275886</link>        <description><![CDATA[En mars 2009 ... c'est toujours valable. Les d&eacute;veloppeurs de voilabot sont-ils conscient ?<br><br>A suivre]]></description>
        <pubDate>Sat, 21 Mar 2009 11:28:24 +0100</pubDate>        <guid isPermaLink="false">78e5fcb44c161f233ebc6a8eb6c45dcc</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de verticrawl]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment29113506</link>        <description><![CDATA[
  Bonne remarque qui amene de l'eau a notre (hélas) moulin.<br>
  <br>
  Quand a IPTABLE, nous avons donnes des exemples d'IP de voila. IPTABLES fonctionne (heureusement)... Vous avez prorbablement un probleme de parametrage.<br>
  <br>
  Quant aux IP de voila, ils n'en ont pas que 4.<br>
  <br>
  Je vous invite tout de même a utiliser le fichier robots.txt qui reste la meilleure garantie de votre volonté de référencement chez Voila et de la vitesse de crawl que vous souhaitez leur imposer.
  S'ils ne la respecte pas, vous aurez toujours le plan B (à savoir Firewal / iptables).<br>
  <br>
  Voila (c'est le cas de le dire:-) ) un retour d'expérience interessant. Merci M. Overblog de partager votre expertise sur ce blog...<br>

  
]]></description>
        <pubDate>Sat, 05 Jul 2008 23:54:13 +0200</pubDate>        <guid isPermaLink="false">69574787a37ef0f1f2f5fa0022abb602</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Proceau]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment29093198</link>        <description><![CDATA[Petit commentaire ironique, je viens de backlist&eacute; les 4 ips de voila pour la 2eme fois, la premiere fois c'etait il y a 1an motif plus de 30 000 pages / 10min inacessable (surtout que certaine en double)<br /><br />Je viens de reblacklist&eacute;, car apres le changement d'un firewall j'avais un jour de bont&eacute; en remettant la liste a 0<br /><br />Je peux voir que cela n'a pas changer, ce soir et pour la 3eme fois,&nbsp;&agrave; partir de 0h05 voila d&eacute;barque et aspire comme des dingues (j'ai aucun probleme ni avec google, ni msn)<br />et qu'on me dise pas que les crawl de voila soit intelligent, ils ont ete jusqu'a rendre indisponible (temps de reponse &gt;5s) les pages de tout overblog ... IPTABLES au revoir.]]></description>
        <pubDate>Sat, 05 Jul 2008 01:14:42 +0200</pubDate>        <guid isPermaLink="false">215348bd7ee5c68ded66cfb7e43ec0f5</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de verticrawl]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment28324120</link>        <description><![CDATA[
  Produire un droit de réponse c'est bien mais encore faut il le faire objectivement....<br>
  <br>
  Nous ne nous occupons pas des problemes de Voilabot.. mais des problemes qu'il pose sur les sites de nous clients : C'est un article sur Voila pour les webmestres.<br>
  <br>
  Par email, l'equipe Voila nous confirmait que la directive Crawl-Delay serait prise en compte en juin 2008 (soit 3 mois apres le message de ce blog).<br>
  <br>
  L'adresse email support.voilabot@orange-ftgroup.com est presente dans nos logs depuis avril 2008 environ. Il existait auparavant une adresse sur le site Voila (support Voilabot) dont nous attendons
  encore les retours de message de 2007...<br>
  <br>
  Quant à la volumetrie d'index de Voila ou Verticrawl... Posez donc la question à Larry Page ? et le débat sera clos.<br>
  <br>
  Voyons donc nos remarques comme des éléments positifs d'intéret pour Voilabot. Car il n'y a rien de pire que l'ignorance du webmestre pour votre robot.<br>

  
]]></description>
        <pubDate>Wed, 11 Jun 2008 15:59:45 +0200</pubDate>        <guid isPermaLink="false">df5927ab5e947dda6febea6d51c362c4</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de VoilaBot]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment25924411</link>        <description><![CDATA[DROIT DE REPONSE : <br />- "Depuis quelques temps, de nombreux webmestres commencent &agrave; se plaindre de la vitesse de crawl (indexation) de Voila."<br />L'ann&eacute;e 2007 a permis au moteur de recherche Voila d'augmenter de mani&egrave;re tr&egrave;s significative le volume des documents index&eacute;s. <br />Il y a pu avoir des effets de bord malgr&egrave; les pr&eacute;cautions qui ont &eacute;t&eacute;s prises.<br />Lorsque les informations nous sont remont&eacute;es par un webmaster, nous en tenons imm&eacute;diatement compte pour r&eacute;duire la charge de nos crawlers.<br /><br />- "Le site SITEFOO (exemple r&eacute;el) a re&ccedil;u la visite du crawler, sur son fichier robots.txt 7 fois en 6 secondes"<br />En effet, il se peut que par ph&eacute;nom&egrave;ne de vague, le fichier Robots.txt soit crawl&eacute; de mani&egrave;re un peu intensive (ca ne r&eacute;pr&eacute;sente quand meme qu'une requette http par seconde. En g&eacute;n&eacute;ral, les serveurs web savent l'absorber). Pour soulager la charge r&eacute;seau, le crawl "intensif" des robots.txt sera corrig&eacute; &agrave; la mi-2008.<br /><br />- "Moralit&eacute; : Ce cas d'appel multi-fichiers est (h&eacute;las) aussi pr&eacute;sent sur des fichiers web."<br />Seuls les fichiers robots.txt peuvent &ecirc;tre affect&eacute;s par ce probl&egrave;me. Normalement (&agrave; moins d'un cas extr&egrave;mement particulier), un m&ecirc;me fichier web ne peut &ecirc;tre appel&eacute; de mani&egrave;re cons&eacute;cutive par nos crawlers.<br /><br />- "C'est l&agrave; que l'on peut r&eacute;ellement consid&eacute;rer VoilaBot comme un aspirateur."<br />VoilaBot n'est pas un aspirateur, mais le processus de crawl du moteur de recherche Voila. <br /><br />- "A n'en pas douter, Les ing&eacute;nieurs
  ont un l&eacute;ger (gros) probl&egrave;me de s&eacute;rialisation des processsus... Bon courage !"<br />Les probl&egrave;mes dont vous parlez n'ont rien avoir avec une s&eacute;rialisation des processus. Nous vous remercions de vous pr&eacute;-occuper de nos probl&egrave;mes.<br /><br />- "<strong>Comment ralentir VoilaBot :</strong>"<br />Il existe une mani&egrave;re plus simple de ralentir le crawl de VoilaBot. Il s'agit d'utiliser la directive Crawl-Delay contenue dans le fichier Robots.txt . Nous prenons en compte cette valeur pour "r&eacute;duire" la vitesse de Crawl.<br /><br /><br />- "C'est bien dommage qu'un moteur Fran&ccedil;ais ne pr&ecirc;te pas plus attention au respect des sites qu'il indexe. "<br />Voila pr&ecirc;te une attention toute particuli&egrave;re aux webmasters. Une adresse mail support.voilaBot est d'ailleurs en cours de cr&eacute;ation pour permettre un meilleur contact avec eux. D&egrave;s qu'elle sera disponible, cette adresse mail sera incluse dans l'ent&ecirc;te http des processus de Crawl.<br /><br />- "Sans &ecirc;tre d&eacute;magogique, c'est un point sur lequel nous portons toujours notre attention quand
  nous lan&ccedil;ons VerticrawlBot."<br />Voila ne se permettra pas de rentrer dans une critique &agrave; l'encontre d'un autre processus de crawl quel qu'il soit. Une remarque n&eacute;anmoins, les probl&eacute;matiques que Verticrawl et Voila peuvent rencontrer ne sont pas du tout du m&ecirc;me ordre de grandeur (volum&eacute;trie).<br /><br />Bien cordialement<br /><br /><br />]]></description>
        <pubDate>Fri, 28 Mar 2008 16:35:53 +0100</pubDate>        <guid isPermaLink="false">2647ee2ff7a049568d191f75ff8acae0</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de verticrawl]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21586671</link>        <description><![CDATA[
  <p>
    Vos remarques sont très pertinentes.<br>
    <br>
    Si nous avons redigés cet article, c'est aussi parce que les régies ne nous semble pas très "customer oriented", d'une part et d'autre part, parce qu'il faut que les marchands sachent à qui ils
    s'adressent quand ils approchent une régie.<br>
    <br>
    Pour ce qui est de la redirection,un petit rappel s'impose :<br>
    <br>
  </p>
  <table class="wikitable" border="0">
    <tbody>
      <tr>
        <td>
          301
        </td>
        <td>
          <em>Moved Permanently</em>
        </td>
        <td>
          Document déplacé de façon permanente
        </td>
      </tr>
      <tr bgcolor="#EFEFEF">
        <td>
          302
        </td>
        <td>
          <em>Moved Temporarily</em>
        </td>
        <td>
          Document déplacé de façon temporaire
        </td>
      </tr>
    </tbody>
  </table>
  <p>
    <br>
    Une redirection 301 est un vrai backlink donné à la régie..alors qu'un 302 est backlink temporaire. Attention cette analyse n'est correcte QUE parce que G00gle calcule son le PR à période
    régulière (+/-longue). Dans tous les cas, vous faites de l'évasion pure et simple vers la régie.<br>
    <br>
    Rappel protocole http : Dans les 2 cas, l'entete http 3xx doit contenir un "location :"..c'est donc toujours un lien indexable par un moteur généraliste.<br>
    <br>
    INFO TECHNIQUE&nbsp; :<br>
    Astuce technique pour découvrir le contenu d'un tracker de régie : (vous allez voir, c'est drôle)<br>
    <br>
    Dans votre command shell préféré (désolé nous parlons unix...) :<br>
    <br>
    &nbsp; <em>wget -O montracker.htm http://maregie.com/ze_tracker.php</em><br>
    <br>
    &nbsp; puis observer le contenu du fichier ( more <em>montracker.htm)</em> .<br>
    <br>
    Testez cela chez vos régies [préférées]... vérifiez... nous sommes sûr qu'un débutant en info aurait fait mieux dans bons nombres de cas (sic !).<br>
    <br>
    On lance les paris :<br>
    &nbsp;&nbsp; 1) au moins 1 tracker de 1 régie va vous étonner ?<br>
    &nbsp;&nbsp; 2) Oui, elle fait partie des 3 plus présentes sur le marché !<br>
    <br>
  </p>

  
]]></description>
        <pubDate>Thu, 18 Oct 2007 20:02:53 +0200</pubDate>        <guid isPermaLink="false">b0ee668475d4cf0e92ede2450e756b7b</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de ludovic]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21389787</link>        <description><![CDATA[Bonne synth&#232;se de la situation des affili&#233;s dans ce business, il est clair que deux monde se contoient , d'un cot&#233; les r&#233;gies &#224; l'&#233;coute et <br />"reglo" et les autres o&#249; tu n'existes pas, on te retire tes ventes sans justifications et on te paie quand tu r&#233;clames. bref, j'esp&#232;re qu'avec le temps ces rapports vont d'am&#233;liorer car comme le dit netaffiliation (bonne r&#233;gie), si pas d'affili&#233;, pas de r&#233;gie...<br />sinon j'ai une remarque technique o&#249; vousparlez de redirection des clics track&#233;s, il semble que la plupart utilise des redirections 302 alors que du 301 serait bien plus efrficaces et m&#234;me moins dangereuse.<br />En effet, j'ai des urls index&#233;es de de tracking et ces urls sont justement en 302, &#231;a craint non ?<br />Ludovic]]></description>
        <pubDate>Thu, 11 Oct 2007 12:05:18 +0200</pubDate>        <guid isPermaLink="false">592a147dedee56107c29fd5ce8997657</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Nicooo]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21220101</link>        <description><![CDATA[<p class="MsoPlainText">Je trouve cet article int&#233;ressant, m&#234;me si je vous avoue que je vais mettre le c&#244;t&#233; technique de c&#244;t&#233;!</p>  <p class="MsoPlainText">Ce que je sais, c'est que de notre c&#244;t&#233; (NetAffiliation) d'un point de vue purement commercial nous considerons autant l'affili&#233; que l'annonceur, car sans affili&#233; il n'y aurait pas d'annonceurs...l'inverse est vrai aussi.</p>  <p class="MsoPlainText">C'est d'ailleurs la politique de l'entreprise, nous avons un service specialement pour les affili&#233;s, de celui qui gagne 1&#8364; par mois &#224; celui qui en gagne 30000&#8364;, o&#249; nous repondons &#224; TOUTES leurs questions, de comment faire un copier/coller &#224; comment modifier le tag pour l'adapter...</p>  <p class="MsoPlainText">Nous sommes constamment en relation avec les affili&#233;s, par mail, telephone, et msn, et tissons des relations constantes pour optimiser nos partenariats!</p>  <p class="MsoPlainText">Enfin, je trouve facile sur l'article de dire que beaucoup profitent des largesses des problemes de tracking, car pour nous autant que vous, un mauvais tracking ou des problemes nous font perdre de l'argent, pour nous il faut bien evidemment mieux que toutes les ventes soient track&#233;es (nous faisons aussi de nombreux tests pour verifier, et je peux vous assurer que tout est ok...reste les problemes de suppresison de cookies...</p>    <p class="MsoPlainText"><o:p>&#160;</o:p>Voila, je ne peux pas parler pour les autres regies, car je ne les connais pas assez, mais en tout cas chez nous ce n'est pas comme &#231;a! (m&#234;me si tout ne doit pas &#234;tre parfait j'en conviens).<br /><br />Nicooo</p>]]></description>
        <pubDate>Fri, 05 Oct 2007 17:22:03 +0200</pubDate>        <guid isPermaLink="false">8d11d6875ff9fed0bfae25a8dca4751f</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Fréderic]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12241928-6.html#comment20573217</link>        <description><![CDATA[Cela me semble plut&ocirc;t int&eacute;ressant.<br /><br />Si j'ai bien compris, cela ne remplace pas les r&eacute;gies de mot cl&eacute;s genre adsense ou overture : donc je conserve mes revenus actuels et je vend mes propres espace pub au prix que je fixe.<br /><br />simplement g&eacute;nial !]]></description>
        <pubDate>Sat, 08 Sep 2007 09:50:02 +0200</pubDate>        <guid isPermaLink="false">4bb7af404535b4726a9619cfbfaafb86</guid>
                                            </item>
  
 </channel>

</rss>
