Présentation

Syndication

  • Feed RSS 2.0
  • Feed ATOM 1.0
  • Feed RSS 2.0

Recommander

Cliquez ici pour recommander ce blog
Mercredi 26 mars 2008
Depuis quelques temps, de nombreux webmestres commencent à se plaindre de la vitesse de crawl (indexation) de Voila.

Voila, via son robot "VoilaBot", indexe fortement les sites du rayon "France". En soit, pas de problème si vous souhaitez être référencé chez eux, mais le probleme se pose quant aux vitesses d'indexation et aux type de document collectés.

Voici un exemple à date :

 Le site SITEFOO (exemple réel) a reçu la visite du crawler, sur son fichier robots.txt 7 fois en 6 secondes, en provenance de l'ip 193.252.149.15.

------------Extrait des log apache ------------
SITEFOO 193.252.149.15 - - [26/Mar/2008:09:39:01 +0100] "GET /robots.txt HTTP/1.1" 200 5594 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
SITEFOO 193.252.149.15 - - [26/Mar/2008:09:39:01 +0100] "GET /robots.txt HTTP/1.1" 200 4967 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
SITEFOO 193.252.149.15 - - [26/Mar/2008:09:39:03 +0100] "GET /robots.txt HTTP/1.1" 200 4958 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
SITEFOO 193.252.149.15 - - [26/Mar/2008:09:39:04 +0100] "GET /robots.txt HTTP/1.1" 200 4957 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
SITEFOO 193.252.149.15 - - [26/Mar/2008:09:39:04 +0100] "GET /robots.txt HTTP/1.1" 200 5594 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
SITEFOO 193.252.149.15 - - [26/Mar/2008:09:39:05 +0100] "GET /robots.txt HTTP/1.1" 200 4957 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"

------------Extrait des log apache ------------


L'ip 193.252.149.15 est natcrawlbloc02.net.s1.fti.net : c'est donc bien Voila.

Moralité : Ce cas d'appel multi-fichiers est (hélas) aussi présent sur des fichiers web. C'est là que l'on peut réellement considérer VoilaBot comme un aspirateur. A n'en pas douter, Les ingénieurs ont un léger (gros) problème de sérialisation des processsus... Bon courage !


Comment ralentir VoilaBot :

Pour ceux qui dispose d'un serveur dédié sous linux, nous conseillons l'emploi de IPTABLES (firewall) pour effectuer des drops sur certaines IP de VoilaBot. Cela ne ralenti pas votre référencement (puisque plusieurs IP de Voila restent ouvertes) mais cela empêche de vous faire aspirer brutalement par eux.

Voici certaines IP de VoilaBot  :
193.252.149.16,  81.52.143.16,  81.52.143.15 ... n'hesitez pas à faire un POST si vous en connaissez d'autres ..

Conclusion :
C'est bien dommage qu'un moteur Français ne prête pas plus attention au respect des sites qu'il indexe. Sans être démagogique, c'est un point sur lequel nous portons toujours notre attention quand nous lançons VerticrawlBot.

Ce n'est pas en indexant plus vite que l'on rattrape son retard (proverbe de La Fontaine, version web)...
par verticrawl publié dans : Moteurs généralistes
ajouter un commentaire commentaires (0)    créer un trackback recommander
Vendredi 15 février 2008
Le 12 février 2008 (oui oui.. la date est  importante !), Live search annonçait de nouvelles fonctionnalités dans ses process de crawl.


Entre autre, et en vrac :

HTTP Compression: HTTP compression allows faster transmission time by compressing static files and application responses, reducing network load between your servers and our crawler. We support the most common compression methods: gzip and deflate as defined by RFC 2616 (see sections 14.11 and 14.39). Compression is currently supported by all major browsers and search engines. Use this online tool to check your server for HTTP compression support.


Bref : LiveS comprend maintenant les entetes http et les contenus compresse via le mode Gzip . Vous avez probablement remarqué que nous avons placé cet article dans la rubrique hum[e|o]ur ...


La compression d'entete c'est quoi ?

Basiquement, on compresse les documents pour qu'ils prennent moins de place (sur un disque dur ou en transfert entre ordinateurs).. Par exemple, si vous décider de reduire la largeur des voitures, vous pourrez faire passer plus de voitures de front sur une route (vous multipliez alors la quantité de voitures passante à l'heure... En informatique c'est pareil.

Dans un dialogue entre 2 ordinateurs, si l'un des deux transmet un doc compressé, l'autre doit pouvoir le lire.. Donc si vous ne disposez pas du logiciel pour décompresser (ou compresser), vous etes marron !

En clair, nous venons de vous dire que Microsoft ne disposait pas de logiciel de zip pour LiveSearch... drôle non ?


Indexation et compression : Quel enjeux ?

Le processus de crawl (collecte de document sur le net) est naturellement gourmant en bande passante. L'intéret n°1 est dedonc de réduire le flux de données transmis. Un crawler qui comprend le mode Gzip-deflate/inflate peut donc dialoguer avec des serveurs web qui acceptent ce mode... Ce n'était pas le cas de LiveS auparavant.

Avantage pour Lives :
    - moins de flux, moins de coût bande passante ou transfert plus rapide.
    - crawl un peu plus loin (car décompression après crawl ou lecture dans le gzip)

Avantages pour le serveur web ?

    - En fait pas grand choses.
    - Plus de temps cpu (compresser le doc avant  transfert)
    - Gérer l'anciennété du document (IIS surtout)
    - Moins de bande passante (très dépendante du cout  de hosting du serveur).

    - Contrainte forte sur IIS (document pré-compressé et en cache)


Avantage pour l'internaute ?
    - Avec un modem 56Ko... y pas photo !
    - Le navigateur doit décompresser le doc avant affichage..cela peut réduire la vitesse machine.


Histoire drôle !
Le communiqué de presse date du 12 février 2008, Verticrawl exploite les fonction Gzip dans ces processus d'indexation depuis ... 1999.

Hypothèse : Microsoft veut s'acheter Yahoo pour stocker ses documents non compressés? ..Ca fait cher le winzip ;-)

Sacré Microsoft !














par verticrawl publié dans : billet d'hum[e|o]ur
ajouter un commentaire commentaires (0)    créer un trackback recommander
Vendredi 15 février 2008
Il y a plusieurs semaines, Google annonçait qu'il allait personnaliser les pages 404  (document non-trouvé) des sites internets.

Au delà  de la polémique qui se trame autour des thèmes "publicité de mes pages d'erreur",  on encore "je vais donner mes visiteurs à Google",  nous avons l'impression que tout le monde passe à coté de l'objectif prioritaire de Google...


Et oui : Pouquoi Google désire t'il personnaliser ces fameuses pages 404 ?

Tout d'abord, il faut remarquer qu'il existe plusieurs types de code d'erreur (301 - redirection permanente, 302 - redirection temporaire, 500 - plantage serveur, etc...).  Donc, si Google personnalise un type de page...pouquoi ne choisirait -il pas de personnaliser TOUS les types de page d'erreur ?

Evidement : Comme la société est une excellente communiquante, elle a pris la précaution de ne parler QUE du sujet qui fache les webmastres, à savoir la page 404.

Alors pourquoi "intercepter" les erreurs des serveurs web ? Au profit de l'internaute : oui probablement. Au profit de Google : Oui biensur !

Les approches stratégiques sont les suivantes :

    - d'abord offrir des outils supplémentaires au webmestres (de type "je personnalise mes pages d'erreur").
    - mais surtout : disposer d'une quantité impressionnante de crawler qui font la mise à jour de mon index à ma place !


Pour Google : Exploiter les fonctions de la Toolbar ou des javascripts pour mettre à jour son index :

On sait depuis longtemps chez Verticrawl que le principal centre de coût d'indexation est le traitement des urls en erreur. En effet, elles augmentent considérablement le temps de crawl (parce qu'elle doivent être traitées comme de vrais documents). C'est au moment du crawl que l'on découvre une url en statut 404 (on ne peut jamais le deviner autrement).

Et c'est là que la méthode Google est implacable : Donner à d'autres son propre travail de recensement des documents inconnus ! Celà etait déjà (en partie) fait avec les Webmaster tools et les sitemaps. Maintenant c'est l'internaute qui fera le travail de nettoyage de l'index de Google... Etonnant non ?


Comment un navigateur web peut verifier un statut http d'un document ?

Ceux qui connaissent les processus asynchrones d'ajax voient déjà ou nous voulons en venir...

Si votre page web (en l'occurence la page de recherche de Google) contient un javascript interconnecté en ajax avec vos serveurs centraux) alors vous pouvez collecter le status http d'un document consulté depuis votre page  sur le navigateur de l'internaute (et donc l'exploiter sur vos serveur).. Des fonctions comme HTTP.request (fonction native du xml object) offrent tous les moyens technique de traitement : CQFD !

Résultat des courses : Ce n'est plus X Googlebot qui crawlent le web mais X puissance Y navigateurs web qui nettoyent l'index de Google.  Evidement, cela est encore plus simple quand vous installer votre logiciel sur l'ordinateur de l'internaute (Google toolbar).


Soyons visionnaire et/ou paranïaque ???

N'oublions pas que Google investi largement dans le projet Mozilla et Firefox ...Rien n'ai jamais sans conséquence ;-)

Il y a fort à parier que les pluggins de Firefox / MSIE et la toolbar installée par les internautes servent aussi d'outils d'identification de contenu (recensement d'url) et l'actualisation de contenu (maintenance de l'index).

Google dispose de la 1ère structure de développement en informatique (bien loin devant Microsoft). Parions qu'ils ont déjà pensés à exploiter le principe des centres de calcul collaboratifs entre pc pour déployer une puissance de traitement énorme. Comme quoi : il n'y pas que les entreprises Français qui délocalisent ! Même Googlebot se fait "virer" de Palo Alto ;-)


Dans l'internet, rien n'ai jamais sans conséquence...En conséquence rien n'ai jamais gratuit !
(proverbe webmestre)
par verticrawl publié dans : Moteurs généralistes
ajouter un commentaire commentaires (0)    créer un trackback recommander
Jeudi 4 octobre 2007
Le développement rapide du secteur E-commerce a vu naitre de nouveaux métiers et de nouvelles entreprises qui développent des services de web-marketing pour les marchands.

Ces régies d'affiliation ont une mission d'intermédiation entre le marchand et l'affilié. Elles rémunèrent l'affilié en fonction des ventes réalisé sur le site marchand par son intermédiaire.

Sous forme de paiement à la performance, au clic, au lead, l'affilié peut  développer son business autour de ces modèles.


Quel intéret pour le marchand ?
Vous pourrez rapidement développer votre notoriété autour d'un réseau rapidement constitué de revendeurs. Il faudra lui fournir des outils d'aide à la vente (pub, catalogue produit, etc) et assurer son animation via la régie d'affiliation. Vous devrez aussi intégrer le(s) tracking de la régie sur votre site marchand.


Pour l'affilié : quel intéret ?
Un moyen simple et rapide de gagne de l'argent avec son site internet ? Pas si sûr, nous le verrons plus bas. Un vrai moyen d'exploiter  légalement la force des marques dans le cadre d'un site de contenu, tout  en évitant de passer par des régies au clic, assurement...


Et pourtant :
Pour que ce type de relation fonctionne (puisqu'elle est basé techniquement sur un triangle marchand / regie / affilié), il faut que l'intermédiation soit efficace (la régie).  Et, comme nous sommes sur l'internet, c'est l'informatique qui doit prendre le relais pour opérer un tracking des actions effectuées depuis le site de l'affilié, via la régie d'affiliation, à destination du site marchand...(ouf !).

Vous imaginez que cette chaine peut être rompue : et c'est là que les problèmes commencent !


Tracking :  défaillance  technique ou volontaire ?

Tout d'abord, sur quoi repose le tracking post clic et pré-vente :  Essentiellement sur 3 points techniques et 1 point humain.
  • 1 - la pose d'un cookie lors du clic de tracking (régie)
  • 2 - l'acceptation du cookie par le navigateur de l'internaute
  • 3 - l'activation d'un tracker de la regie lors d'une vente sur le site marchand.
  • 4 - la validation des ventes par le marchand sur la plateforme de la régie.
Vous remarquerez, que pour gagner un peu d'argent il faut passer à traver toutes les mailles de ce filet..

Nous avons testé 7 régies d'affiliations bien connus en France, elles représentent environ 80% des programmes d'affiliations gérés : Seulement 2 sur 7 dispose d'un tracking fiable. Fiable dans 90% des cas, seul l'acceptation d'un cookie par le navigateur reste problématique (puisque lié au navigateur de l'internaute), tous les autres points ne sont QUE dépendants du marchand ou de la régie (point 1,3 et 4).

Voici notre grille d'analyse que vous pourrez reproduire à votre guise : Il est entendu que si votre régie ne respecte pas cela, elle vous payera probablement 1 vente sur 10... Simple principe de probabilité de tracker des actions.

Google sanctionne les liens de tracking des régies :
Depuis début Mars, Google a ajouté une information de taille dans ses Guidelines de référencement. (et donc de ranking) concernant les régies d'affiliation et les liens de tracking

Voici un extrait de
http://www.google.com/support/webmasters/bin/answer.py?answer=35769
Évitez les pages satellites ("doorway") créées exclusivement pour les moteurs de recherche ou d'autres solutions, telles que les programmes d'affiliation, sans véritable contenu informatif.

C'est donc sans ambiguité. Aussi, si vous constatez des liens de tracking référencés dans les moteurs de recherche, vous êtes prevenue des risques que vous prenez. Et Oui!, c'est l'auteur du lien qui est sanctionné par Google (et non pas la regie), c'est à dire vous en tant qu'affilié .

Par ailleurs, comment une regie qui laisse référencer ses liens de tracking peut-elle justifier d'un vrai visitorat de qualité ?  Aucune regie ne peut prétendre avoir Google comme affilié...sauf Adwords !


Exploitation des entetes http :
    - vérification des clauses P3P (IE7)
    - redirection par status 301 sans contrôle de pose de cookie.
    - multi-cookies avec restriction d'accès (domaine, url etc).
    - durée de vie multiples pour les cookies.
    - pas de vérification d'acceptation de cookie.
    - pas de vérification du user agent.
    - redirection pas javascript dans une page web (cas d'une très grande régie).
    - pas de vérification de cohérence user agent  / IP.

    - en cas de status 301 (redirection externe), le site marchand n'ajoute pas de cookie de provenance. S'il travaille avec plusieurs régies, la vente ne vous sera pas imputé puisqu'il ne sait pas à qui la transmettre (tracker post vente)

url du tracker de clic :
  - absence de robots.txt avec disallow /*  (implication immédiate sur les backlinks de votre propre référencement et sur le pagerank du site marchand [puisque redirection 301 vers le marchand] .).
  - si l'url du tracker est référencée dans un moteur généraliste : C'est signe que la régie se fait de la notoriété à pas cher (le pire serait que le code affilié référencé soit celui de la régie elle-même...)

Pour tester votre propre url de tracking affilié, utilisez simplement les outils d'analyse d'entete http www.webmaster-hub.com/outils/http-viewer.php

NOTA : Nous avons demandé aux régies de modifier leur tracking en conséquence : 1 seule à pris réellement en compte nos remarques et à effectuée les changements Les autres ont bizarrement ignorées le problème .

Les régies, les marchands et les catalogues produits :

Les régies d'affiliation proposent l'intégration de catalogue produits des marchands aux affiliés. Ces catalogues (au format CSV ou XML) contiennent un certain nombre d'informations sur les produits vendus par les marchands.

En matière de qualité des informations fournis dans les catalogues : les résultats des régies, dans ce domaine, son notoirement déplorables. On peut citer par exemple (et sans que cette liste soit limitative - hélas) :

Qualité des catalogues :
- Lien image produit rompus (image non maintenue par le marchand) - (30% des produits)
- Description produit contenant des fautes d'orthographes ou des contre-sens (10% des cas)
- Url des produits en 404 (si si ! les produits transmis par le marchand à la régie n'existent plus !) (5% des produits).
- frais de port, de garantie, de livraison quasi inexistant.
- format fichier non standart (1 régie = X marchands = X formats différents) : la régie n'as pas vérifiée le format avant de l'intégrer.
- encodage des données très aléatoire (de l'utf-8 exporté vers ISO qui repasse en UTF) : voir notre article sur les charset.

Téléchargement des catalogues produit sur la plateforme de régie :
- temps d'attente de transfert supérieur à 3 mn pour certaines (solution sous dimensionnée)
- encapsulage de données parfois étonnant (1 champ contient des sous-champs en CSV...)

Relations avec les affiliés :
Affligeant ! Sur 7 régies, 2 seulement considérent la relation avec les affiliés comme une priorité et réagissent rapidement aux questions (techniques ou commerciales).  Les autres vous considèrent plus comme un NON-partenaire (genre mets ta pub et tais-toi : nous sommes les plus forts).


EN CONCLUSION :
Après lecture de cet article, que faut-il penser des régies d'affiliation ?

 - Elles n'ont pas encore compris que le pouvoir était du coté des affiliés puisque c'est eux qui légitime leur métier (elles se rémunèrent souvent au pourcentage des ventes que fait l'affilié).
 - Bien peu malin, le marchand qui ne profiterait pas du système.
 - Sur le net, les gloires se font vite, aussi vite que les gamelles.
 - Bref, une profession qui mérite de s'assainir pour le grand plaisir des acteurs sérieux du domaine.


NOTE AU LECTEUR :
Cet article étant publié sur internet le 05 octobre 2007 :
 - les régies peuvent faire évoluer leur solution (nous espérons y contribuer ;-] )
 - nous ne pouvons évidement pas citer de nom (en bien ou en mal).
 - l'article diffuse clairement des pistes d'audits : à vous d'analyse les régies pour vous faire une idée..

Pour celui qui souhaite les nom des régies "de qualité" :
Confucius disait " Plutot que lui donner un poisson, apprends lui à pécher "  ... C'est l'objectif de cet article.

Pour celui qui souhaite le nom des régies auditées :
Lisez bien, si vous trouvez plus de 7 régies sur le marché, passez nous l'info : on l'auditera ;-)


par verticrawl publié dans : billet d'hum[e|o]ur
ajouter un commentaire commentaires (2)    créer un trackback recommander
Samedi 15 septembre 2007
Tout le monde utilise un clavier, et bizarrement, on oublie assez facilement que les claviers des autres pays sont différents.  Prenons pour exemple le clavier espagnol qui contient des caractères spécifiques.

Evidement, une charset n'est pas un clavier... quoi que  :
En fait, une charset est une table de définition (informatique) de chaque caractères d'une langue. En français, le A prendra le numéro 1 et le B le numéro 2 (par exemple).

Jusque là : tout est simple...mais certaines langues contient des tables de caractères qui ne sont pas occidentaux (ni même francophone). Le Mandarin, le Russe, l'Arabe ne s'écrivent pas avec notre alphabet.

Mais, comme l'informatique évolue plus vite que les langues et leurs symboles, il a fallut faire évoluer tout cela pour tenter d'harmoniser les échanges electroniques.

Stockage de données : l'enjeux
L'encodage des données, depuis que l'informatique est "tous publics", encode les données en binaire (0 et 1), ces données , par paquet de 8 bits donnent 1 octet. Cet octet représente 1 lettre de 1 alphabet. Avec l'alphabet Français cela donnera un E par exemple. Mais si vous lisez ce binaire avec une autre machine (configurée en Chinois par exemple) cela donnera un autre symbole...

Aussi, le code binaire découpé en octets produit des résultats différents suivant la langue dans laquelle est configurée votre ordinateur.

Méta données d'encodage :
Pour éviter de lire du Chinois en Francais, il faut stocker la langue dans laquelle est rédigée ce binaire. On appelle cela une CHARSET. C'est elle qui précise l'encodage d'un document ainsi que la langue dans laquelle est rédigé le document.
spanish-keyboard.gif
Conversion de Charset :
Des initiatives ont permis la mise en place de Charset internationales comme UTF et UNICODE. Ces quasi-normes ont regroupées toutes les langues et leurs symboles en une table unique de plusieurs milliers de symboles (je simplifie...).

Très logiquement, cette table nécessitait de donner un numéro plus élevé à chacun des signes représentés (puisqu'elle regroupe toutes les langues). Résultat le code UTF de "é" n'est pas le code ISO-8859-1 (europe occidentale - Français) de "é". De plus l'encodage binaire des alphabets en UTF s'effectue sur 3 octets (au maximum). C'est donc un véritable cryptage de texte.

Aussi, il est possible de convertir un texte de ISO-8859-1 vers UTF-8 mais extrêmement aléatoire de faire l'inverse sans une table de conversion très efficace.

glif.jpgAlors pourquoi choisir ISO ou UTF :
Réellement : 0 impact sur le développement, 0 impact sur le référencement... mais des kilos d'ennuis avec les utilisateurs de votre site uniquement parce que Microsoft joue les troubles fêtes dans cette universalité.

Et oui, Msoft dispose de ces propres charsets. Aussi, si vous laissez le soin à un utilisateur winbovvs d'ajouter des articles, il risque de fournir des données encodées 'windows-1252" au lien de fournir du UTF-8 ou ISO-8859-1. Résultat  : des données mal codées dans les bases de données...et en ligne.

C'est particulièrement vrai pour les outils de CMS ou les utilisateurs font "copier coller" depuis word...sic !

Pour votre site, toujours vérifier que :
- l'ensemble des données (y compris interne SQL) sont bien dans la même charset. (1)
- la configuration de votre serveur web (qui peut transmettre des entetes avec une charset différente par défaut).
- vos pages contiennent la bonne balise meta content="text/html; charset=XXX" http-equiv="content-type"
- que le contenu de vos pages est bien conforme à votre charset choisie. (1)
- que vos métas sont aussi encodés correctement :-)

Le piège des caractères &#xxx;  :
Ces caractères sont intégrés au code html pour définir un code de caractères. le "xxx" représente le numéro dans la table de codage de votre page web. Aussi, si vous déclarez une page "UTF", vous devrez coder le "é" avec l'encodage numérique de l'utf (qui n'est pas celui de l'iso - cqfd).

(1) MYSQL 5 et supérieur utilise le préfixe de CHARSET=XXX  et COLLATE=XXX pour définir la charset et l'encodage des données. Si vous utilisez "XXX_LATIN_XX", vous êtes conforme à ISO-8859-1, si vous utilisez XXX_UTF_XXX, vous êtes en unicode. La conversion ISO vers UTF pour le Français est utf8_swedish_ci.

(2) Utilisez la fonction "voir source " du navigateur puis "encodage des caratères" et changer d'encodage pour vérifier.


Pour aller plus loin :

en.wikipedia.org/wiki/Character_encodings_in_HTML
par verticrawl publié dans : Indexation - crawling
ajouter un commentaire commentaires (0)    créer un trackback recommander
Samedi 8 septembre 2007
A l'instar de ses confères moteur de recherche généralistes, Verticrawl intègre une solution de gestion de régie CPC module de recherche Pay per Click - Answordpersonnelle (lien sponsorisé) suivant le principe des enchères de position sur mot-clef dans sa solution Verticrawl Seek.

Régie de mot clef en mode ASP - Hébergé :
Les solutions de recherche Verticrawl sont déjà connues pour leur reactivité et leur simplicité de mise en oeuvre dans le cadre de sitesearch pour site marchand ou de contenu. Il manquait une corde à l'arc de Verticrawl : Proposer à ces clients des solutions personnelles de publicité contextuelle sous forme d'annonce (interne ou payante) intégrée au résultats du moteur.


Quel intérêt :
Dans le design des résultats de recherche, les moteurs présentent des produits ou des contenus mais ne proposent aucune contextualisation d'information complémentaire. Le responsable marketing du site souhaite souvent systèmatiser l'utilisation de modules contextuels pour mettre en avant des informations spécifiques (promotion, remise, produit associé, mot du président, etc..).

Grâce au module Answord, il est maintenant possible de présenter, en plus des résultats pertinents sur la demande de l'internaute, des informations propres au site et qui répondent en même temps à la requête du client. On sait que les modules contextuelles représentent environ 20% des clics dans les recherches et sont aussi efficaces que les recherches naturellles.

Answord est donc la régie privée du client de Verticrawl pour ses propres espaces publicitaires contextuels. En effet, il intègre des emplacements multi-média (vidéo, flash, lien texte, etc...) dans les différents formats IAB. Verticrawl contextualise donc des emplacements publicitaires en fonction du document consulté, des formats publicitaires ou du moteur de recherche interne.


Answord régie complémentaire des régies CPC classiques :
Dans le cadre des sites de contenu, une grande partie des revenues générés par le site proviennent des publicités contextuelles. Le revenu généré par chaque clic est souvent bien inférieur au prix réel payé par l'annonceur. Avec Answord, il est maintenant possible de commercialier ses propres mot clé auprès de ses propres clients, sur son propre site, aux enchères, tout est conservant les régies existantes. Le gain estimé dans ce cas est supérieur à 30% des CPC classiques.

Avec Verticrawl Answord : Chaque site peut devenir sa propre régie de mot clef et de publicité contextuelle !

Verticrawl Answord : Tier de confiance
Comme dans tout système de régie au CPC, le système de tracking est le coeur de la facturation client. Aussi, Verticrawl a mis en oeuvre une technologie anti-fraude. L'interface d'administration offre donc toutes les garanties de conformité afin d'assurer la possibilité de facturation des clics aux clients des sites qui utilise la technologie.

Des fonctionnalités avancées
Autour d'un pool d'annonceurs, le site peut intégrer différentes version des annonces, dans tous les formats IAB ou texte. Chaque annonce est associée à une campagne de mot-clef contenant plus de 30 paramètres donc CPC, formats, durée, budget etc... Chaque API de recherche peut intégrer des paramètres spécifiques de la régie (nombre d'annonces, format, etc..) afin de produire des résultats d'enchères totalement intégrés au look de site. Fini le design pauvre et le logo de la régie avec laquelle vous travaillez : Maintenant les annonces sont totalement intégrées dans l'esprit du site et dans le contexte du contenu.

Exemples d'utilisation de Verticrawl Answord :

Un site marchand :
Mettre en avant des promotions, des produits dérivées de la demande de l'internaute, sous forme de publicités ou de lien produits.

Un site institutionnel :
Prévenir d'une particularité administrative. Par exemple, une commune peut informer l'internaute qui recherche des informations sur les passeports en lui indiquant un lien ou directement la procédure et les formulaires.

Un site de presse :
Contextualiser la recherche sur un événement particulier. Mettre en avant les promotions sur les abonnements online, etc..

Un site de contenu :
Commercialiser ses espaces commerciaux auprès de ses propres annonces en complément des espaces classiques (bandeaux, skyscraper, carré).
Answord est livré dans la solution de recherche Verticrawl Seek.




FOIRE AUX QUESTIONS :

Est-ce un concurrent des régies de mot-clef ?
Non, Verticrawl Answord peut être couplé avec les régies existantes du site.

Puis-je l'utiliser pour annoncer sur un site ?
Oui, en contactant le site éditeur directement. Nous ne commercialisons pas les espaces de chacun de nos clients.

Puis-je utiliser Verticrawl Answord pour mon site ?
Oui, dans le cadre de nos solutions de recherche Seek.

Existe t'il une API spécifique Answord ?
Oui, elle sera disponible en juin 2007.

Peut-on afficher des Answord dans les pages de contenu ?
Bien sur, ce module est en phase de finalisation.

CPC, CPM , Pay per click ?
CPC : Coût par click
CPM : Coût pour 1000 affichages
Pay per click : prix facturé à l'annonceur quand 1 internaute clique.
par verticrawl publié dans : Module de recherche
ajouter un commentaire commentaires (1)    créer un trackback recommander
Vendredi 7 septembre 2007
open-office.jpg Depuis le 10 juin, Verticrawl indexe, en plus des classiques html et pack office, de nouveau formats.

Nous voulions augmenter considérablement les formats supportés : c'est choses faite  avec :

  • Les formats Word et Excel pocket (PDA et téléphone portable).
  • Les formats Openoffice et Staroffice
  • Les formats CSV et SYLK  (noter que l'indexation ne se fait pas ligne à ligne dans ces formats)
  • Les format LateX (prononcer [ LATEC ] : les scientifiques font adorer :-).

Notre technique d'indexation comporte maintenant plus de 300 formats et versions de logiciels.

De quoi couvrir 99,9% des CMS et des modules de gestion de contenu. Consulter la liste des formats
par verticrawl publié dans : Indexation - crawling
ajouter un commentaire commentaires (0)    créer un trackback recommander
Mercredi 5 septembre 2007
trombine.gif
Bonjour,


Vous découvrez le blog de Verticrawl dédié aux activités de moteur de recherche et de nos logiciels d'indexation documentaire.

Quelles sont les intentions de ce blog :

D'abord présenter les évolutions technologiques de nos produits et dialoguer avec vous sur leurs utilisations dans vos projets de gestion de contenu.

Ensuite, de vous offrir des informations sur les déploiements de nos technologies dans le cadre du référencement, du e-commerce et du web marketing.

Mais aussi, de vous présenter une veille sur les activités de nos produits "béta" dans le monde du recrutement et des comparateurs de prix.  Nous gérons 2 produits web particulièrement intéressants pour l'analyse des besoins en matière de moteur de recherche et qui nous apportent une réelle expertise pour le métier de nos clients.

Et enfin, de vous apporter des guides à certaines stratégies online, entre autre, pour les moteurs de recherche généralistes. Le quasi-monopole de certains nous pose clairement des questions éthiques [et économiques].

Alors : Bonne lecture et surtout réagissez à nos articles en publiant vos propres posts...

Jean-François Lhuisset
Fondateur de Verticrawl

par verticrawl publié dans : Editos
commentaires (0)    recommander

Recherche

Calendrier

Mai 2008
L M M J V S D
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
<< < > >>
Créer un blog sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur avec TF1 Network - Signaler un abus