search
top

Les commandes Google et les footprints : Les bases à connaitre

De nombreux outils pour vous aider dans le référencement, certains sont payants, d’autres sont gratuits. Certains sont utiles, d’autres ne le sont pas. Et bien souvent, il existe de simple techniques qui peuvent simplifier la vie. Ainsi, j’affectionne particulièrement, les commandes Google et les footprints qui sont des empreintes utilisées par chaque site Internet et applications, qui associées, aux commandes, vont permettre de rechercher des informations précises. Il y en a beaucoup et vous savez-vous quoi? C’est gratuit! Alors pourquoi s’en priver? Voici donc un petit tour d’horizon des principales commandes et des footprints.

Les commandes Google de base

Avant de se lancer corps et âmes dans les footprints, voici quelques commandes et opérateurs de bases à connaitre sur le bout des doigts. Il y a déjà quelques articles qui les listent ici,  ou encore . Je vous laisse donc aller consulter ces articles si vous souhaitez toutes les connaitre et je vous liste les principales ici:

  • Site:www.domaine.fr va vous permettre d’avoir les pages indexées pour un domaine donné.
  • (all)intitle:mot-clé va vous donner toutes les pages qui contiennent le mot clé dans la balise title
  • (all)inurl:mot-clé vous donnera toutes les pages contenant le mot-clé dans les URL
  • (all)inanchor:mot-clé liste uniquement les pages qui contiennent le mot clé dans leurs ancres de liens
  • cache:url vous donne la dernière version en cache d’une page donnée
  • filetype:extension va permettre de filtrer une recherche par types de fichiers
  • info:url vous donnera le snippet de la page et quelques options qui sont listées juste ci-dessus.

Les (all) signifient que vous pouvez utiliser soit la commande avec all qui listera les résultats avec l’ensemble des mots clés entrés dans votre requête. Sans le all, cela listera des résultats qui contiennent un ou plusieurs mots clés saisis. Exemple, intitle:achat bleu va lister des sites qui ont soit « achat » soit « bleu » dans le title, parfois les deux termes alors que allintitle:achat bleu listera les sites qui ont uniquement les deux termes.

Vous pouvez également mixer ces commandes avec d’autres opérateurs pour mieux filtrer les résultats:

  • Les guillemets (« mot clé ») pour une recherche exacte
  • Le signe moins (-mot clé) pour exclure un terme d’une recherche
  • La tilde (~mot clé) pour étendre la recherche aux synonyme. Par exemple, checkez la différence entre la requête allintitle:~automobile et allintitle:automobile.
  • L’étoile est une sorte de joker dans la mesure où elle remplacera n’importe qu’elle terme.
  • OR vous permet d’avoir des résultats avec l’un où l’autre terme utilisé
  • AND fonctionne sur le même principe à la différence qu’il prendra en compte les deux attributs
  • Les points de ponctuations (…) entre deux chiffres permettent d’avoir des résultats inclus entre ces deux valeurs.

Bien sûr, il existe encore d’autres commandes mais celles-ci sont les principales, en tout cas, celles que j’utilise le plus souvent. Rien qu’avec ces commandes, il est possible de récupérer pleins d’informations utiles sur un site Internet et de mettre en place des corrections pour obtenir un meilleur positionnement dans les SERP.

Se servir des commandes et des footprints

Voici quelques cas où on peut utiliser ces commandes et les footprints qui vont nous être d’une grande aide pour vérifier certains points et trouver des informations vraiment très utiles. A noter, que vous pouvez mixer les commandes, les opérateurs et les footprints. Là on rentre avec des requêtes assez puissantes sur Google qui, bien gérées, peuvent vous faire découvrir des pépites, surtout sur le linking.

Vérifier l’indexation des pages d’un site: 

  • site:www.domaine.com/page.html vous dira si votre page est indexée. Si vous l’avez mis en ligne depuis un moment, il va falloir se pencher sur son cas.
  • Cela peut même être utile si on sort du cadre du référencement pur et dur. Combien d’entreprises et de particuliers laissent leurs données sensibles accessibles à tous? Essayez avec filetype:pdf intitle: »rapport confidentiel » et encore, certains laissent leurs mots de passes indexés, mais je ne vous donnerais pas le footprint…Bon en même temps c’est pas bien compliqué.
  • site:preprod.* vous donnera tous les sites  qui ont laissé l’environnement de preprod indexé. Vous pouvez essayé avec « dev », « developpement », « recette », « test » etc… Vérifiez sur vos sites, ça évitera le contenu dupliqué.

Vérifier la présence de contenus dupliqués:

  • La première chose à faire est de prendre un bout de texte sur votre site et d’utiliser les guillemets pour voir si on vous duplique…où si vous vous dupliquez vous mêmes. Un petit exemple avec la définition du référencement que l’on trouve sur wikipedia. 1760 résultats avec la même phrase. Aussi prenez une phrase au milieu de votre article, c’est toujours mieux.
Un contenu dupliqué sur plusieurs milliers de pages

Utilisez les guillemets pour surveiller les contenus textes

  • site:www.domaine.fr « impression » devrait vous donner toutes les fiches d’impressions indexées pour un domaine donné. Est-ce qu’elles sont utiles au référencement? Certainement pas, du coup, pourquoi ne pas les désindexer?
  • site:domaine.fr allintitle:mots clés va donc vous donner tous les titres dupliqués ou sémantiquement très proches sur un domaine donné.

Trouver des sources de liens:

  • Parmi les footprints les plus connus, il y a les fameux « powered by wordpress » AND « commentaires »« Ce blog utilise KeywordLuv » ou encore « VotrePrénom@vos mots-clés ». Cela va vous permettre de trouver des pistes sur lesquels vous pour faire des commentaires de blogs. Il y en a des centaines à vous de les chercher, mais on trouve encore beaucoup de pépites: bon PR, non-spammés, dofollow… Vous pouvez déjà débuter avec ce site qui vous propose des footprints prêtent à consommer.
  • Vous ne souhaitez pas poser un lien à coté des pilules bleues? Utilisez votre footprint avec -mot clé à exclure.
  • N’oubliez pas, si vous tombez sur une page qui vous parait trop spammy, de checker les autres pages du site via la commande site: et votre scrapper préféré pour le PR.
  • Il n’y a pas que Google et WordPress dans le monde des footprints…
Vous pouvez également automatiser le tout en utilisant les Bookmarklet SEO qui sont décrits et disponibles sur le blog de @RaphSEO.

A vous de jouer!

Voila pour cette petite initiation aux commandes Google et aux footprints. Il y a véritablement beaucoup d’utilisations possibles de ces opérateurs, surtout pour trouver des sources de liens. Bien sûr, si vous utilisez déjà beaucoup les footprints, je doute que cet article change votre façon de chercher de les utiliser mais je ne souhaitais pas non plus balancer tous les petits plans non spammés, en tout cas pour la partie linking. Aussi, vous pouvez automatiser un peu le tout avec des Scrapper comme Scrapebox ou RDDZ, afin de gagner du temps dans la récupération et le tri des informations. Il y a beaucoup à dire également là-dessus, peut-être que cela sera le sujet d’un prochain article. Enfin, n’oubliez pas de bien travailler le on-site et les contenus dupliqués qui peuvent être bloquant si vous vous lancez directement dans le linking.

Killian Kostiha, 27 printemps, SERP addict, curieux et passionné, je suis consultant en référencement dans une agence web à Paris, Spikly. Je partage ici quelques articles sur le référencement, le SMO, des bases SEO et des outils pratiques pour mieux gérer un site Internet. Vous pouvez également me suivre sur TwitterFacebookGoogle Plus pour discuter et échanger sur le référencement naturel, où autre. Il n’y a pas que Google dans la vie :-) .

22 Responses to “Les commandes Google et les footprints : Les bases à connaitre”

  1. Merci pour ce rappel. Pour les commandes Google, j’aime bien le site suivant :
    http://www.googleguide.com/advanced_operators.html

  2. Lereferenceur dit :

    Voilà un bon rappel.
    Ca permet d’éviter de chercher à droite à gauche les différentes commandes.

    Je ne connaissais pas le site de Jean Louis Bourghol.

  3. Attrape robots dit :

    Très bon tout ça, d’autant plus qu’avec un minimum d’imagination il est possible d’utiliser ces astuces de footprints pour attirer les robots sur ses sites ;-)

  4. Fred dit :

    Bonjour et merci pour le rappel, ça fait pas de mal.
    Si en plus on utilise des bookmarklets on arrive à optimiser le travail avec ces commandes.

  5. loran from Coeur du Web dit :

    hello

    je suis étonné que tu ne parles pas du formalisme utilisé dans le spintax { et }.

    Exemple : https://www.google.fr/search?q=loran%20%20{r%C3%A9f%C3%A9renceur|SEO}

    on peut largement (enfin largement, je dirai modérément, on ne sait jamais si on va trop loin) l’utiliser lors de nos recherches Google.

  6. Céline dit :

    Merci pour cet article et les idées d’utilisation.
    Moi j’utilise la page http://www.webrankinfo.com/commandes/ qui liste toutes les commandes avec des exemples

  7. Xavier dit :

    Merci pour ton article qui est très complet, je ne connaissais pas la commande cache, elle va m’être bien utile afin de vérifier le dernier crawl de notre cher ami Google.

    Connais tu des commandes similaires pour Yahoo ou Bing?

    Merci, Xavier ;)

  8. Le Juge dit :

    Arf … je m’attendais a plus que cela, mais bon la pour le coup c’est ma faute je m’attends toujours a plus… mais bon je comprends aussi t’es pas la pour nous macher la viande non plus, faut qu’on bosse un peu – Tu donnes les bases et ensuite au taf, je suis fainéant moi c’est pour ca … tres bien la petite guideline en tout cas y’a plus qu’a mettre les pieces ensembles pour chopper de la footprint

  9. SEO is not a crime dit :

    @Fred : Oui c’est vrai, j’ai rectifié l’article avec un joli lien vers son blog et j’ai édité ton commentaire. Merci :-)

    @Loran: Pour être honnête, je ne l’utilisais pas mais je vais approfondir un peu plus. Thanks.

    @Xavier: Les mêmes…

    @Le juge: Le truc c’est que si j’en donne plus, on va tous se retrouver sur les mêmes spots (concernant les BL) et du coup ça perd son sens.

    @Le référenceur, Attrape Robots, Céline: De rien.

  10. Antoine dit :

    @Loran : je ne savais pas qu’on pouvait utiliser cette syntaxe de recherche. Ton exemple n’est pas très frappant, on ne retrouve pas le terme référenceur dans les résultats. Aurais tu un autre résultat à nous montrer ?

  11. SEO is not a crime dit :

    @Antoine: Teste avec allintitle:{paris|moscou|londres} :-)

  12. Jalis dit :

    Pour une fois que Google travaille pour le référenceur, autant en profiter ! Merci pour cette liste qui va bien nous faire gagner du temps.

  13. Pierre from Materiel BTP dit :

    Merci pour cette liste !
    Dans l’ensemble les commandes ne m’étaient pas inconnues par contre leur application pour faire du « footprints », je ne connaissais pas…

  14. Nick07 dit :

    Moi qui voulait me faire un récap tout beau tout propre. Voilà un rappel qui m’en dispense. Il manque le site:www.domaine.com/* qui permet semble-t’il de trouver les pages dans l’index primaire.

  15. Marian dit :

    Merci pour cette synthèse. Sinon on peut également citer un article de Jeremy (disponible ici : http://blog.jeremy-allard.com/commandes-google-les-bonnes-regles/)

    Existe-t-il une alternative à la recherche avec inurl pour éviter de se prendre rapidement un captcha ? J’avais vu une solution passer un temps mais je l’ai perdu

  16. SEO is not a crime dit :

    @Marian : J’avais pas vu cet article. Si tu automatises, passe pas des proxies, des breakers de captchas…

  17. Simon dit :

    Très Sympa ces découvertes et révisions ! J’aime bien « filetype:pdf intitle: » . Bon slideshare c’est pas mal aussi ;)

  18. Bonjour,

    Merci pour cet article, je propose 2 liens complémentaires pour ceux qui ne connaissent pas le portail dédié à la recherche google (dommage pas encore traduite en français :( ) :http://support.google.com/websearch/bin/answer.py?hl=en&answer=134479&topic=1221265&ctx=topic

    Autrement, en dur, un petit bouquin « google code »:

    http://www.amazon.fr/Da-Google-Code-chercher-commencez/dp/2744024600

    Bonne journée..

  19. Eliz dit :

    Bon p’tit rappel ! Merci des infos ;)

  20. Julie dit :

    Il y a t’il un moyen de de rechercher un élément html a partir de google ?

    Par exemple chercher les pages qui ont <link rel="canonical" dans leur code html ?

  21. luc dit :

    @jalis: google travailler pour les référenceurs: la blague ! ^^

  22. SEO is not a crime dit :

    @Julie : Pour ça, il faut se tourner vers des scrappers comme RDDZ.

top