<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
         xmlns:err="http://jelix.org/ns/xmlerror/1.0">
 <channel>

    <title><![CDATA[Commentaires du blog: Verticrawl : solution Moteur de recherche]]></title>
    <link>http://blog-verticrawl.over-blog.com/</link>
    <description>Les 25 derniers commentaires publiés sur le blog &quot;Verticrawl : solution Moteur de recherche&quot;</description>

        <language>fr</language>
    
        <image>
        <url>http://fdata.over-blog.net/1/29/14/48/avatar-blog-1010994254-tmpphpySPRmd.gif</url>
        <title><![CDATA[Commentaires du blog: Verticrawl : solution Moteur de recherche]]></title>
        <link>http://blog-verticrawl.over-blog.com/</link>
                            </image>
    
    <pubDate>Fri, 20 Feb 2009 09:32:19 +0100</pubDate>    <lastBuildDate>Fri, 20 Feb 2009 09:32:19 +0100</lastBuildDate>    <generator>Over-blog.com RSS 2.0 Engine</generator>                <category>Hi Tech</category>    <docs>http://www.rssboard.org/rss-specification/</docs>                        
      <item>
        <title><![CDATA[Commentaire de verticrawl]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment29113506</link>        <description><![CDATA[
  Bonne remarque qui amene de l'eau a notre (hélas) moulin.<br>
  <br>
  Quand a IPTABLE, nous avons donnes des exemples d'IP de voila. IPTABLES fonctionne (heureusement)... Vous avez prorbablement un probleme de parametrage.<br>
  <br>
  Quant aux IP de voila, ils n'en ont pas que 4.<br>
  <br>
  Je vous invite tout de même a utiliser le fichier robots.txt qui reste la meilleure garantie de votre volonté de référencement chez Voila et de la vitesse de crawl que vous souhaitez leur imposer.
  S'ils ne la respecte pas, vous aurez toujours le plan B (à savoir Firewal / iptables).<br>
  <br>
  Voila (c'est le cas de le dire:-) ) un retour d'expérience interessant. Merci M. Overblog de partager votre expertise sur ce blog...<br>

  
]]></description>
        <pubDate>Sat, 05 Jul 2008 23:54:13 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment29113506</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Proceau]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment29093198</link>        <description><![CDATA[Petit commentaire ironique, je viens de backlist&eacute; les 4 ips de voila pour la 2eme fois, la premiere fois c'etait il y a 1an motif plus de 30 000 pages / 10min inacessable (surtout que certaine en double)<br /><br />Je viens de reblacklist&eacute;, car apres le changement d'un firewall j'avais un jour de bont&eacute; en remettant la liste a 0<br /><br />Je peux voir que cela n'a pas changer, ce soir et pour la 3eme fois,&nbsp;&agrave; partir de 0h05 voila d&eacute;barque et aspire comme des dingues (j'ai aucun probleme ni avec google, ni msn)<br />et qu'on me dise pas que les crawl de voila soit intelligent, ils ont ete jusqu'a rendre indisponible (temps de reponse &gt;5s) les pages de tout overblog ... IPTABLES au revoir.]]></description>
        <pubDate>Sat, 05 Jul 2008 01:14:42 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment29093198</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de verticrawl]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment28324120</link>        <description><![CDATA[
  Produire un droit de réponse c'est bien mais encore faut il le faire objectivement....<br>
  <br>
  Nous ne nous occupons pas des problemes de Voilabot.. mais des problemes qu'il pose sur les sites de nous clients : C'est un article sur Voila pour les webmestres.<br>
  <br>
  Par email, l'equipe Voila nous confirmait que la directive Crawl-Delay serait prise en compte en juin 2008 (soit 3 mois apres le message de ce blog).<br>
  <br>
  L'adresse email support.voilabot@orange-ftgroup.com est presente dans nos logs depuis avril 2008 environ. Il existait auparavant une adresse sur le site Voila (support Voilabot) dont nous attendons
  encore les retours de message de 2007...<br>
  <br>
  Quant à la volumetrie d'index de Voila ou Verticrawl... Posez donc la question à Larry Page ? et le débat sera clos.<br>
  <br>
  Voyons donc nos remarques comme des éléments positifs d'intéret pour Voilabot. Car il n'y a rien de pire que l'ignorance du webmestre pour votre robot.<br>

  
]]></description>
        <pubDate>Wed, 11 Jun 2008 15:59:45 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment28324120</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de VoilaBot]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment25924411</link>        <description><![CDATA[DROIT DE REPONSE : <br />- "Depuis quelques temps, de nombreux webmestres commencent &agrave; se plaindre de la vitesse de crawl (indexation) de Voila."<br />L'ann&eacute;e 2007 a permis au moteur de recherche Voila d'augmenter de mani&egrave;re tr&egrave;s significative le volume des documents index&eacute;s. <br />Il y a pu avoir des effets de bord malgr&egrave; les pr&eacute;cautions qui ont &eacute;t&eacute;s prises.<br />Lorsque les informations nous sont remont&eacute;es par un webmaster, nous en tenons imm&eacute;diatement compte pour r&eacute;duire la charge de nos crawlers.<br /><br />- "Le site SITEFOO (exemple r&eacute;el) a re&ccedil;u la visite du crawler, sur son fichier robots.txt 7 fois en 6 secondes"<br />En effet, il se peut que par ph&eacute;nom&egrave;ne de vague, le fichier Robots.txt soit crawl&eacute; de mani&egrave;re un peu intensive (ca ne r&eacute;pr&eacute;sente quand meme qu'une requette http par seconde. En g&eacute;n&eacute;ral, les serveurs web savent l'absorber). Pour soulager la charge r&eacute;seau, le crawl "intensif" des robots.txt sera corrig&eacute; &agrave; la mi-2008.<br /><br />- "Moralit&eacute; : Ce cas d'appel multi-fichiers est (h&eacute;las) aussi pr&eacute;sent sur des fichiers web."<br />Seuls les fichiers robots.txt peuvent &ecirc;tre affect&eacute;s par ce probl&egrave;me. Normalement (&agrave; moins d'un cas extr&egrave;mement particulier), un m&ecirc;me fichier web ne peut &ecirc;tre appel&eacute; de mani&egrave;re cons&eacute;cutive par nos crawlers.<br /><br />- "C'est l&agrave; que l'on peut r&eacute;ellement consid&eacute;rer VoilaBot comme un aspirateur."<br />VoilaBot n'est pas un aspirateur, mais le processus de crawl du moteur de recherche Voila. <br /><br />- "A n'en pas douter, Les ing&eacute;nieurs
  ont un l&eacute;ger (gros) probl&egrave;me de s&eacute;rialisation des processsus... Bon courage !"<br />Les probl&egrave;mes dont vous parlez n'ont rien avoir avec une s&eacute;rialisation des processus. Nous vous remercions de vous pr&eacute;-occuper de nos probl&egrave;mes.<br /><br />- "<strong>Comment ralentir VoilaBot :</strong>"<br />Il existe une mani&egrave;re plus simple de ralentir le crawl de VoilaBot. Il s'agit d'utiliser la directive Crawl-Delay contenue dans le fichier Robots.txt . Nous prenons en compte cette valeur pour "r&eacute;duire" la vitesse de Crawl.<br /><br /><br />- "C'est bien dommage qu'un moteur Fran&ccedil;ais ne pr&ecirc;te pas plus attention au respect des sites qu'il indexe. "<br />Voila pr&ecirc;te une attention toute particuli&egrave;re aux webmasters. Une adresse mail support.voilaBot est d'ailleurs en cours de cr&eacute;ation pour permettre un meilleur contact avec eux. D&egrave;s qu'elle sera disponible, cette adresse mail sera incluse dans l'ent&ecirc;te http des processus de Crawl.<br /><br />- "Sans &ecirc;tre d&eacute;magogique, c'est un point sur lequel nous portons toujours notre attention quand
  nous lan&ccedil;ons VerticrawlBot."<br />Voila ne se permettra pas de rentrer dans une critique &agrave; l'encontre d'un autre processus de crawl quel qu'il soit. Une remarque n&eacute;anmoins, les probl&eacute;matiques que Verticrawl et Voila peuvent rencontrer ne sont pas du tout du m&ecirc;me ordre de grandeur (volum&eacute;trie).<br /><br />Bien cordialement<br /><br /><br />]]></description>
        <pubDate>Fri, 28 Mar 2008 16:35:53 +0100</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-18126250-6.html#comment25924411</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de verticrawl]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21586671</link>        <description><![CDATA[Vos remarques sont tr&#232;s pertinentes.<br /><br />Si nous avons redig&#233;s cet article, c'est aussi parce que les r&#233;gies ne nous semble pas tr&#232;s "customer oriented", d'une part et d'autre part, parce qu'il faut que les marchands sachent &#224; qui ils s'adressent quand ils approchent une r&#233;gie.<br /><br />Pour ce qui est de la redirection,un petit rappel s'impose :<br /><br /><table class="wikitable"><tbody><tr><td>301</td> <td><em>Moved Permanently</em></td> <td>Document d&#233;plac&#233; de fa&#231;on permanente</td> </tr> <tr bgcolor="#efefef"> <td>302</td> <td><em>Moved Temporarily</em></td> <td>Document d&#233;plac&#233; de fa&#231;on temporaire</td></tr></tbody></table><br />Une redirection 301 est un vrai backlink donn&#233; &#224; la r&#233;gie..alors qu'un 302 est backlink temporaire. Attention cette analyse n'est correcte QUE parce que G00gle calcule son le PR &#224; p&#233;riode r&#233;guli&#232;re (+/-longue). Dans tous les cas, vous faites de l'&#233;vasion pure et simple vers la r&#233;gie.<br /><br />Rappel protocole http : Dans les 2 cas, l'entete http 3xx doit contenir un "location :"..c'est donc toujours un lien indexable par un moteur g&#233;n&#233;raliste.<br /><br />INFO TECHNIQUE&#160; :<br />Astuce technique pour d&#233;couvrir le contenu d'un tracker de r&#233;gie : (vous allez voir, c'est dr&#244;le)<br /><br />Dans votre command shell pr&#233;f&#233;r&#233; (d&#233;sol&#233; nous parlons unix...) :<br /><br />&#160;<em> wget -O montracker.htm http://maregie.com/ze_tracker.php</em> <br /><br />&#160; puis observer le contenu du fichier ( more <em>montracker.htm) </em>.<br /><br />Testez cela chez vos r&#233;gies [pr&#233;f&#233;r&#233;es]... v&#233;rifiez... nous sommes s&#251;r qu'un d&#233;butant en info aurait fait mieux dans bons nombres de cas (sic !).<br /><br />On lance les paris : <br />&#160;&#160; 1) au moins 1 tracker de 1 r&#233;gie va vous &#233;tonner ? <br />&#160;&#160; 2) Oui, elle fait partie des 3 plus pr&#233;sentes sur le march&#233; !<br /><br />&#160;]]></description>
        <pubDate>Thu, 18 Oct 2007 20:02:53 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21586671</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de ludovic]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21389787</link>        <description><![CDATA[Bonne synth&#232;se de la situation des affili&#233;s dans ce business, il est clair que deux monde se contoient , d'un cot&#233; les r&#233;gies &#224; l'&#233;coute et <br />"reglo" et les autres o&#249; tu n'existes pas, on te retire tes ventes sans justifications et on te paie quand tu r&#233;clames. bref, j'esp&#232;re qu'avec le temps ces rapports vont d'am&#233;liorer car comme le dit netaffiliation (bonne r&#233;gie), si pas d'affili&#233;, pas de r&#233;gie...<br />sinon j'ai une remarque technique o&#249; vousparlez de redirection des clics track&#233;s, il semble que la plupart utilise des redirections 302 alors que du 301 serait bien plus efrficaces et m&#234;me moins dangereuse.<br />En effet, j'ai des urls index&#233;es de de tracking et ces urls sont justement en 302, &#231;a craint non ?<br />Ludovic]]></description>
        <pubDate>Thu, 11 Oct 2007 12:05:18 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21389787</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Nicooo]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21220101</link>        <description><![CDATA[<p class="MsoPlainText">Je trouve cet article int&#233;ressant, m&#234;me si je vous avoue que je vais mettre le c&#244;t&#233; technique de c&#244;t&#233;!</p>  <p class="MsoPlainText">Ce que je sais, c'est que de notre c&#244;t&#233; (NetAffiliation) d'un point de vue purement commercial nous considerons autant l'affili&#233; que l'annonceur, car sans affili&#233; il n'y aurait pas d'annonceurs...l'inverse est vrai aussi.</p>  <p class="MsoPlainText">C'est d'ailleurs la politique de l'entreprise, nous avons un service specialement pour les affili&#233;s, de celui qui gagne 1&#8364; par mois &#224; celui qui en gagne 30000&#8364;, o&#249; nous repondons &#224; TOUTES leurs questions, de comment faire un copier/coller &#224; comment modifier le tag pour l'adapter...</p>  <p class="MsoPlainText">Nous sommes constamment en relation avec les affili&#233;s, par mail, telephone, et msn, et tissons des relations constantes pour optimiser nos partenariats!</p>  <p class="MsoPlainText">Enfin, je trouve facile sur l'article de dire que beaucoup profitent des largesses des problemes de tracking, car pour nous autant que vous, un mauvais tracking ou des problemes nous font perdre de l'argent, pour nous il faut bien evidemment mieux que toutes les ventes soient track&#233;es (nous faisons aussi de nombreux tests pour verifier, et je peux vous assurer que tout est ok...reste les problemes de suppresison de cookies...</p>    <p class="MsoPlainText"><o:p>&#160;</o:p>Voila, je ne peux pas parler pour les autres regies, car je ne les connais pas assez, mais en tout cas chez nous ce n'est pas comme &#231;a! (m&#234;me si tout ne doit pas &#234;tre parfait j'en conviens).<br /><br />Nicooo</p>]]></description>
        <pubDate>Fri, 05 Oct 2007 17:22:03 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-12827216-6.html#comment21220101</guid>
                                            </item>
      <item>
        <title><![CDATA[Commentaire de Fréderic]]></title>
        <link>http://blog-verticrawl.over-blog.com/article-12241928-6.html#comment20573217</link>        <description><![CDATA[Cela me semble plut&ocirc;t int&eacute;ressant.<br /><br />Si j'ai bien compris, cela ne remplace pas les r&eacute;gies de mot cl&eacute;s genre adsense ou overture : donc je conserve mes revenus actuels et je vend mes propres espace pub au prix que je fixe.<br /><br />simplement g&eacute;nial !]]></description>
        <pubDate>Sat, 08 Sep 2007 09:50:02 +0200</pubDate>        <guid >http://blog-verticrawl.over-blog.com/article-12241928-6.html#comment20573217</guid>
                                            </item>
  
 </channel>
</rss>