Archives pour la catégorie on page SEO

Détecter qui hotlink vos image et comment en tirer profit

On dit souvent que le hotlinking est comme un poil à gratter, ça nous ennuit, nous bouffe de la bande passante, mais on peut en tirer facilement profit pour driver du trafic vers nos sites.

Détecter le hotlinking

Mais d’abord comment détecter qu’une image est hotlinkée? Deux façon de la savoir, le premier est de balayer les serps de Google Images, et de voir si une de vos image n’est pas hotlinkée, quand vous la survolez, (l’image dont vous êtes sûr d’être à l’origine), le domaine apparait.

Mais ceci est fastidieux, car il n’est vraiment pas évident de trouver, et il faut se fier à al chance.

Une autre méthode plus scientifique est de regarder les log Apache.

Voici comment se présente cette ligne :

92.156.158.106 – - [24/Sep/2013:13:05:33 +0200] « GET /942-1333-large/anse-5156-2-marron.jpg HTTP/1.1″ 304 263 « http://lafibrecreative.canalblog.com/archives/2012/05/09/24225174.html » « Mozilla/5.0 (Windows NT 6.1; WOW64; rv:24.0) Gecko/20100101 Firefox/24.0″

Je reprends cette ligne en soulignant les éléments intéressants :

92.156.158.106 – - [24/Sep/2013:13:05:33 +0200] « GET /942-1333-large/produit-5156-2-marron.jpg HTTP/1.1 » 304 263 « http://coupable.canalblog.com/archives/2012/05/09/24225174.html » « Mozilla/5.0 (Windows NT 6.1; WOW64; rv:24.0) Gecko/20100101 Firefox/24.0″

 

Le second segment de phrase souligné en gras est la page qui demande le média. Normalement, cette page est une page de votre site, mais dans ce cas précis non ! Vous tenez le coupable !

Vengeance

Maintenant que vous avez identifié la page coupable, identifiez l’endroit où se trouve l’image, suivant votre CMS, et si une réécriture est faite via htaccess, vous devez plus ou moins chercher.

Téléchargez l’image et retravaillez la en ajouter l’url de votre site web, simple comme bonjour !

Comment chercher dans les logs Apache ces lignes?

Bonne question ! là c’est la partie technique, la méthode que je vous dis ne marche que pour les hébergement où vous avez accès à vos logs.

Il vous faut maitriser un peu la commande grep qui sert à trouver une chaine de caractère dans un fichier. Un tuto sur grep sur cette page. en un peu plus complet mais en anglais (googlez quoi)

Je ferai un autre article sur les logs Apache, mais en gros voilà ce qu’il faut faire:

  1. chercher les lignes concernant les images téléchargées et les mettre dans un nouveau fichier
  2. à partir de ce fichier, ne garder les lignes qui ne sont pas téléchargées par votre site web et les mettre dans un nouveau fichier
  3. ensuite ne garder les lignes qui ne sont pas téléchargées par les moteur de recherche type google, bing, yandex
  4. maintenant vous devriez avoir un fichier plus petit, au besoin ne pas garder les lignes qui contiennent des information manquantes comme la chaine de caractère « - »
  5. Passez au peigne fin les lignes, et repérez les url des sites web que vous ne connaissez pas c’est tout.

Les commandes :

Une fois que vous connaissez un peu les commandes grep voici pour les différentes étapes ci-dessus les syntaxe je suis pas un cador en regex mais si vous repérez une erreur dites le mois, Je fait la recherche de fichier gif,jpg, et png :

  1. grep -i « (\.gif|\.png|\.jpg) HTTP » fichierlog > fichierlog2 (regex pour détecter plusieurs types d’image)
  2. grep -i -v « www\.monsite\.com » fichierlog2 > fichierlog3
  3. grep -i -v « bing » fichierlog3 > fichierlog4  ( répéter pour les autres moteurs de recherche)
  4. grep -i -v « \ »-\ »" fichierlog15 > finallog

le caractère \  (backslash) sert à échapper les caractères spéciaux.

Ce que je fais est que j’ajoute l’url de mon site sur l’image je pense que ça marche le mieux. Bonne chasse !

 

Obtenir un sitelink Google pour son site web


Cet article est paru il y a deux mois dans la section membre du forum, j’ai voulu partager cette information pour vous. Si vous désirez d’autres billets de ce niveau allez sur cette page.

Depuis belle lurette déjà Google vous propose une série de liens sur la page de résultat juste en dessous de votre site dans les SERP pour souligner :
1/la pertinence de votre requête pour le mots clé tapés
2/mais nous voyons sur tout une récompense par rapport à la valeur de notre site
3/un meilleur CTR dû au fait que votre site ressort plus que les autres.

Ces sitelinks apparaissent pour votre site au bout d’un certain temps. Mais la plupart d’entre nous reste frustré car on ne les a pas toujours ! En général, c’est sur une requête égal à votre nom de domaine que vous voyez apparaitre ces sitelinks.

C’est en voulant chercher pourquoi un de nos site ne possède pas de sitelink alors qu’un concurrent avec un site « inférieur » au nôtre l’a que je me suis penché sur les raisons de l’attribution des sitelinks, cette récompense que tout webmaster recherche.

Le site en question a peu de liens entrant, et possède pourtant un sitelink ! Le nombre de liens n’est pas forcément un facteur (j’ai pris ça comme hypothèse).

Le profil de backlinks, peut être que la diversité des backlinks joue un rôle, notamment les fameux liens avec l’url en guise d’ancre. (http://www.domaine.com).
Je ne vous détaille pas l’analyse, mais je suis arrivé à la conclusion que c’est sans doute le nom de domaine mis en début du titre de la homepage qui influe le plus.

Par exemple, le titre de notre site en home :
« Formation Referencement Naturel Google | Referencementschool.com« , j’ai toujours formaté les title en home de cette façon (vu sur Seomoz.org), résultat, aucun de mes sites ne possèdent de sitelinks. Tout au moins un mini sitelink sur une ligne comme ceci :

sitelink Google

 

Vous pouvez avoir plusieurs sitelinks pour différentes sections de votre site comme ci-dessous:

Dans les Webmaster tools de Google, vous pouvez choisir de bloquer un lien du groupe si vous le désirez (si vraiment vous vous la pétez)

sitelink Google

Au bout de dix jours exactement, les sitelinks sont apparus pour notre site !
Donc pour confirmer l’astuce, j’ai appliqué à referencementschool.com le même traitement, en changeant le titre en:
« Referencementschool.com, Formation Referencement Naturel Google | Referencementschool.com »

J’ai attendu dix jours exactement et j’obtiens les sitelinks également.

sitelink Google

A ceci près que c’est mon blog qui est en première position cette fois -ci et non la home page du site.

Donc deux sites qui ont gagné leur sitelink avec cette manipulation simple. Je tente un troisième et vous tiens au courant, ce site est plutôt jeune et je suis pas sûr de les obtenir.

Ca ne marche pas toujours !

J’ai essayé sur 3 autre sites, et ça n’a pas marché, deux site sont agés mais peu de backlinks, un autre site jeune et pas assez de backlinks donc. Je pense que les texte d’ancre et la navigation jouent un rôle ainsi que l’ancienneté du site et des backlinks.

SMX Paris -15% avec le code REFERENCEMENT010

SMX veut dire Search Marketing Expo. Si vous lisez Search Engine Land, vous connaissez sans doute cet événement phare du search marketing. Search Engine Land est fondé par Danny Sullivan, peut être le premier SEO du monde à ma connaissance, mais en tout cas il a suivi le moteur de recherche Google à ses début, et il fait autorité incontestablement dans la paysage du search au USA (et dans le monde).

Lorsque que j’ai discuté avec Sarita (SEMPO) l’année dernière à l’occasion d’un apéro référencement, elle m’expliquait que Danny Sullivan ne voulait s’occuper que du marché US (il faut savoir que SMX est une véritable industrie). Je savais à l’époque que SMX existait quasiment partout en Europe Occidentale sauf en France un comble ! Justice est faite à présent, et on y verra les grand experts du webmarketing français et étranger. Google fera de la relation publique, mais cependant SMX, ce n’est pas Seocampus.

D’abord, vous risquez d’être déçu si vous êtes un petit webmaster, car les premiers intéressés c’est des sites comme AlloCiné, la Redoute avec des niveau de trafic stratosphérique. Cependant ce qui sera dit s’appliquera très bien à vos sites, mais vous ne networkerez pas aussi bien ne jouant pas dans la même cour.

Ensuite il y a SMX et SMX Advanced. Philippe Yonnet me disait pour l’édition de Seocampus 2009 que plusieurs sessions étaient du niveau de SMX Advanced…voilà c’est je m’était senti moins intimidé du coup. Mais ce n’est pas pour cette raison qu’il ne faut pas y aller, vous ne devez pas rater une occasion de networker si vous en avez l’occasion, ayez en tête l’esprit de faire du business, qui sait des opportunités se présenteront (si vous voulez changer d’employeur par exemple en négociant une augmentation de salaire : ) ). En bref voir les gens en vrai est 10à fois plus efficace pour faire du linkbuilding.

D’un point de vue marketing, la machine est bien rodée pour Danny Sullivan (on n’en doute pas un seul instant). SMX est décliné esn SMX East et West, un webcast existe également, Sphinn est aussi un projet de SearchEngineLand. Ceci me fait penser que le SEO ne doit pas être une fin, mais que seul le développement de votre business justifie votre action marketing. Finin les heures interminable à paufiner vos titres et description, votre temps est mieux employé à faire du relationnel et à trouver des idées de linkbait.

N’oubliez pas qu’avec le code REFERENCEMENT010 vous bénéficiez de 15% de réduction sur l’entrée.

Paramètres influençant votre position dans les moteurs de recherche

Seomoz (qui est une véritable institution outre Atlantique en référencement) vient de publier le dernier sondage des maîtres référenceurs de tout bord (pays), portant sur l’importance relative des facteurs influençant la position d’une page web dans les Serps.

Le principe de l’étude est de demander au panel de référenceurs quelle importance possède un facteur (exemple : titre de la page) sur le positionnement d’une page. Ensuite les réponses sont compilées et moyennées avec un écart-type, ce dernier permet de mesurer le consensus du panel de référenceurs sur les facteurs.

Voici le lien vers cette étude. Lire la suite

HTML5 et référencement, quel est le programme?

J’avoue n’avoir pas du tout vu arriver la vague HTML5 avec les nouveaux navigateurs comme Firefox 3.5 et Safari (moteur Webkit). Comme on parle souvent de la corrélation entre la validation d’un document web et indexation de la même page dans les moteurs de recherche, il est légitime de se poser la question de l’implémentation de HTML5 dans vos pages web. Lire la suite

Le Meilleur CMS pour bloguer selon moi

Ma première expérience avec un logiciel de blog date d’il y a plus de 3 ans. C’était avec WordPress 1.2. Une petite expérience avec la plateforme Serendipity, ensuite je suis passé sous Dotclear, car il me semblait mieux gérer les caractères unicode (dans d’autres langues non latines). J’ai donc utilisé Dotclear 1.2 jusqu’à la version 2 en bêta. Ensuite j’ai utilisé Joomla et PhpNuke pour d’autres sites, j’ai aussi expérimenté un peu de Drupal. Bien que chaque CMS (Content Management system = système de gestion de contenu) cité possédait une forte communauté, j’ai malgré le support dont j’ai pu bénéficier de la communauté française, décidé il y a un an que s’il n’y avait qu’un CMS open source à retenir, c’était WordPress.

Lire la suite

Titres efficaces pour un bon référencement

L’importance de la balise titre n’est plus à discuter en référencement. Par expérience j’ai pu gagner des dizaines de places rien qu’en ajustant quelques mots  voire un seul mot. Le plus important est l’ordre dans lequel sont sont placés les mots. Je vois souvent les pages avoir un titre dont les mots sont exactement mis dansl’ordre inverse de ce qu’il leur faudrait. Le cas le plus révélateur est la configuration par défaut du logiciel de forum PhpBB (par ailleurs excellent).  Pour chaque page vous avez Nom Site > Nom Rubrique > Nom de la discussion.

Lire la suite

Le référencement mal vu mais pourtant nécessaire

Qui sont les gens qui n’aiment pas le SEO? et pourquoi?

Lors des rencontres entre blogueurs, il m’arrive encore de croiser des gens (et pas des vieux) qui me disent que le référencement c’est mal. Et d’ajouter aussitôt que des sites de m***e sont positionnés avant eux pour telle requête.  Vous saisissez le problème? Google nous dit qu’il faut produire des pages de haute qualité et que le reste se fait tout seul. Cependant, malgré le fait que l’algorithme des moteurs de recherche aient fait beaucoup de progrès ces dernières années, même Google n’a pas réussi à éliminer les petits malins de spammer les résultats de recherche. Pourquoi un site comme Wikipedia qui emprunte du contenu des autres sites web truste-t-il quasiment toutes les requêtes à vocation informative et éducative?

Lire la suite