SEO · 2 min read · Dec 01, 2025
Spam de recherche Google : les sites proxy classés plus haut que les originaux
Il y a eu beaucoup de débats concernant la grande quantité de résultats de recherche spam sur Google au cours des dernières semaines, y compris les fermes de contenu et autres, à tel point que Google a même lancé une extension Chrome pour permettre aux utilisateurs de bloquer certains sites d’apparaître dans leurs résultats de recherche personnalisés. Mais le problème principal des scrapers de contenu, des agrégateurs et des sites proxy classés plus haut que les sites originaux existe toujours.
Le problème de l’indexation des sites proxy qui redirigent simplement l’URL de la page originale via leurs serveurs n’est pas nouveau. Le problème remonte à 2007 et avec l’introduction de la balise canonique en 2009, Google a annoncé que le problème était résolu. Mais cela ne semble pas être le cas. Le piratage proxy est de retour et pour une raison mystérieuse, il semble être répandu sur les sites proxy hébergés sur le propre moteur d’application de Google, en ignorant la balise “rel=canonical”.
Laissez-moi expliquer avec un exemple. Au cours des derniers jours, j’ai observé une chute considérable du trafic organique pour certains mots-clés importants. Aujourd’hui, je me suis forcé à creuser et à vérifier ce qui n’allait pas. J’ai été choqué de voir un site proxy – suzetteklierocks.appspot.com se classer à la place où mon blog se classait auparavant. À ma grande surprise, je n’ai trouvé mon propre blog nulle part dans les premières pages de recherche Google.

Dans la capture d’écran ci-dessus, le premier résultat est celui du site proxy qui a piraté ma page. Voici l’URL listée sur Google – http://suzetteklierocks.appspot.com/techpp.com/2010/07/05/dropbox-alternatives-sync-files-online/. Comme vous vous y attendez, c’est juste un des nombreux cas où le site proxy se classe mieux que le mien. La raison pour laquelle je n’ai pas observé le changement énorme dans le trafic/revenus était que les sites proxy redirigent simplement vers la page originale, mais les sites du moteur d’application ont une restriction sur l’utilisation de la bande passante par jour et cessent donc de fonctionner vers la fin de la journée lorsqu’ils dépassent la limite.
Une recherche rapide pour site:suzetteklierocks.appspot.com révèle plus de 200 000 pages indexées pour le site proxy. J’ai bien les balises canoniques sur la page, qui sont d’une manière ou d’une autre ignorées par Google lors de l’indexation de la page proxy dupliquée. Je ne suis pas un expert en SEO, et je ne suis pas sûr de manquer quelque chose ici. Le gourou du spam web de Google, Matt Cutts, a promis de jeter un œil au problème, et je suis sûr qu’il le résoudra dans les plus brefs délais.
Une autre demande à Matt et Google ; Il ne semble pas y avoir de moyen approprié pour signaler les sites hébergés sur le moteur d’application de Google. Veuillez faciliter leur signalement. De plus, si possible, rendez les URL proxy basées sur le moteur d’application “noindex” par défaut.
Mise à jour : Je ne peux pas explicitement bloquer le site proxy tant que je ne récupère pas le SERP, car je perdrai également le trafic redirigé.
Update 2 : Je réalise que j’ai fait une erreur dans le titre. Le bon est – “Les sites proxy REMPLACENT les originaux” SIGH
Update 3 : Barry Schwartz de SEL en a parlé hier.
Update 4 : Matt Cutts a rapidement agi comme il l’avait promis. Merci Matt !
Update 5 : Je vois déjà quelques changements en cours, mais le processus n’est pas encore complet.
Recevez de nouveaux articles dans votre boîte de réception.
Aucun spam. Désabonnez-vous à tout moment.