Initiation à l’intégration XHTML/CSS - séance 12
jan
22
2010
Dans le cadre de la formation proposée aux étudiants SRC Hunan, dispensée par l’IUT Michel de Montaigne, Bordeaux III, nous avons créé des supports de cours que nous mettons a la disposition des éleves de la formation et de tous au travers du blog e-tropisme. Il s’agit ici de la 12ème séance de cours dispensée aux élèves.
Son objet est de :
- corriger les épreuves réalisées lors de la précédente séance,
- donner des notions de base concernant le référencement naturel ou SEO.
Corrections des épreuves
Nous reprendrons ici étape par étape le travail qui devait être réalisé lors des épreuves d’intégration XHTML/CSS.
Vous pouvez également télécharger les documents correspondant aux corrections :
- Correction de l’épreuve n°2 : epreuve2-correct.html,
- Correction de l’épreuve n°3 : epreuve3-correct.html.
Notion de référencement naturel ou SEO
Définitions et généralités sur le “référencement” et le “positionnement”
Référencement
Un site est référencé sur un moteur de recherche à partir du moment où les pages qui le composent sont indexées par un moteur de recherche.
Positionnement
Le positionnement définit la visibilité du site parmi tous les autres sites qui sont indexés sur le moteur de recherche.
Référencement versus positionnement
Un site Internet peut se comparer à un produit dans un supermarché :
- lorsque le produit est présent dans le supermarché, il est référencé comme tous les autres produits proposés par l’entreprise
- lorsque le produit est présent en tête de gondole, il est non seulement référencé, mais acquière une bonne visibilité à priori favorable à ses ventes, le produit possède alors un bon positionnement, c’est-à-dire une bonne visibilité.
Par excès de langage les termes référencement et positionnement sont souvent amalgamés au profit du seul terme référencement.
Définitions et généralités « liens organiques » « liens sponsorisés »
Liens organiques
Les liens organiques ou liens naturels proviennent du cœur même du moteur de recherche fournis par l’algorithme propre à chaque moteur. Ils n’ont rien à voir avec les liens sponsorisés assimilables à une démarche de publicité.
Liens sponsorisés
Les liens sponsorisés ou liens commerciaux sont également affichés dans les résultats proposés par les moteurs de recherche, mais ils le sont dans des zones indépendantes des résultats naturels. La présence d’un site parmi les liens sponsorisés peut se comparer à une campagne publicitaire.
Définitions et généralités : 3 étapes lors du référencement
L’affichage des résultats par un moteur se décompose en 3 étapes clés :
- Extraction depuis l’index du moteur des pages contenant les mots de la requête saisie. Le moteur se sert d’un index de recherche dans lequel les pages du site devront être présentes.
- Classement des résultats par pertinence. Les mots clés pertinents par rapport à l’activité du site devront être présentes dans les pages indexées par le moteur.
- Restitution dans le navigateur des résultats. Les termes clés pertinents devront être positionnés dans des « zones chaudes » essentielles pour un bon positionnement.
Sources : http://www.google.fr/intl/en/corporate/tech.html.
Définitions et généralités : Quelles positions sont cruciales en terme de recrutement de prospect ?
Classiquement on peut parler d’un site positionné s’il figure parmi les 30 premiers résultats.
Cependant différentes études ont montré que seule une position parmi les 5 premiers résultats de la première page permettait de drainer réellement des nouveaux internautes sur un site.
Etude de la Cornell University (sources : http://cs.cornell.edu/People/tj/publications/joachimes_etal_05a.pdf)
- 40% des internautes cliquent d’abord sur le premier résultat
- 16% sur le 2nd
- 10% sur le 3ème
- 5-6% sur les 4, 5 et 6èmes résultats.
Triangle d’or
Une étude menée par Dit-It.com, l’œil de l’internaute exploite un « triangle d’or » situé en haut et à gauche des pages de résultat de Google, ce qui permet d’établir un taux de visibilité pour chaque rang des liens proposés par le moteur :

- position 1 à 3 : 100%,
- position 4 : 85%,
- position 5 : 60%,
- position 6 et 7 : 50%
Plus le résultat est rouge vif, plus la zone est lue instinctivement par l‘œil des internautes.
La ligne rouge horizontale représente la ligne de flottaison (partie visible du navigateur sans scroll).
Sources : http://www.prweb.com/releases/2005/03/prweb213516.htm
Définitions et généralités : pages satellites
Pages satellites
Il s’agit de pages web correspondant à plusieurs critères :
- page entièrement conçue pour les moteurs et le référencement,
- page optimisée pour être réactive par rapport aux critères de pertinence des moteurs,
- page contenant des redirections automatiques vers les pages réelles du site.
De 2004 à 2006, l’essentiel des référenceurs usaient et abusaient de ces procédés. C’est désormais à proscrire :
- Les moteurs de recherche considèrent les pages satellites comme du spam,
- Certains moteurs n’hésitent pas à « blacklister » les sites usant encore de ces systèmes pour optimiser le référencement,
- Le positionnement et son amélioration doit se faire au niveau des pages réelles du site par des actions simples et honnêtes.
A consulter : http://www.google.fr/support/webmasters/bin/answer.py?answer=35769
Fonctionnement des moteurs et annuaires
Fonctionnement des moteurs et annuaires : Moteur de recherche
Un moteur de recherche est un ensemble de logiciels parcourant le web pour indexer les pages visitées avec 3 étapes principales :
- COLLECTE D’INFORMATIONS : ou « crawl » grâce à des robots (crawlers, spiders)
- INDEXATION DES DONNEES COLLECTEES : dans une base de données de documents nommée index
- TRAITEMENT DES REQUETES : grâce à un système d’interrogation de l’index et le classement des résultats en fonction des critères de pertinence par rapport à la requête de l’internaute.
Le système de ranking
Le ranking est un processus consistant pour le moteur à classer automatiquement les données de manière à ce que les pages les plus pertinentes apparaissent en premier dans les résultats.
Les moteurs utilisent généralement un mélange de différents systèmes de ranking :
- Le tri par pertinence
Les résultats d’une requête sont triés en fonction de 6 facteurs principaux appliqués au terme de la question :
- Localisation du mot dans le document ou son adresse (url)
- Densité du mot (nombre d’occurrences)
- Mise en exergue du mot,…
- Le tri par popularité
C’est le pagerank pour google à priori indépendant du contenu des pages, il désigne le nombre et la qualité des liens pointant vers les documents.
Plus une page est pointée par des liens émanant de pages populaires, plus sa popularité est grande et meilleur est son classement.
- Le tri par mesure d’audience
- Le tri par clustering,…
Fonctionnement des moteurs et annuaires : Annuaires
Un système très différent de celui des moteurs :
- Aucune recherche n’est effectuée sur le contenu des documents
- Ils proposent une collection de fiches descriptives des sites référencés
- Chaque site est rangé dans une hiérarchie de catégories et sous-catégories
- L’intégration dans les données de l’annuaire correspond à une action volontaire non automatisée.
A noter que le trafic généré par les annuaires est désormais très faible.
La préparation du référencement
6 étapes clés :
1. Choix des mots clés
Ils doivent répondre à 2 notions :
- l’intérêt des mots clés par rapport aux requêtes saisies par les internautes
- la faisabilité du positionnement
Concept de « longue traine » (long tail) :

Source de l’image : Webilus
La sélection des mots clés stratégiques se réalise sur :
- l’intuition
- la base d’outils permettant d’élargir la réflexion notamment en fonction du comportement des internautes.
- sondages/enquêtes
- résultats constatés sur les moteurs
- audit de concurrence
- fautes d’orthographe potentielles
2. Choix des moteurs et annuaires à prendre en compte
- Vérifier ceux qui induisent déjà la plus grande part de la conquête de clients.
- Ceux où les concurrents sont déjà présents.
3. Création/modification des pages en fonction des mots clés
4. Soumission/vérification de l’indexation des pages dans les moteurs
5. Vérification du positionnement et du trafic généré
6. Suivi et corrections/améliorations
Optimisation des pages du site
« Content is king »
Aucun positionnement possible sans contenu c’est désormais la règle d’or du référencement naturel.
Le concept de « zone chaude »
Dès lors que le contenu est réfléchi et optimisé pour permettre d’envisager un bon positionnement, la phase d’optimisation est envisageable. Cette optimisation nécessite de travailler au niveau du code html des pages et se focalise sur certaines zones du code, d’où le concept de « zones chaudes ».
zone chaude n°1, la balise <title></title>
C’est le titre du site qui s’affiche au niveau de la partie haute du navigateur.
Plus elle est placée haut dans le code html, meilleur sera le poids de la balise dans le référencement.
Toutes les pages doivent avoir un titre différent, et le titre doit comprendre au maximum les expressions clés à raison de 5 à 10 mots.
Attention toutefois à ne pas travailler le titre que pour le référencement, car c’est aussi le premier élément lu par les internautes consultant les résultats d’un recherche sur un moteur.
Le titre doit : contenir 10 mots au maximum, résumer la page en question, contenir les mots clés importants en rapport avec le contenu.
zone chaude n°2, le texte visible
Il s’agit de tous les éléments textuels des pages (pas les images, les flashs,…) s’affichant sans aucune action de l’internaute (donc pas les attributs alt et title).
Classiquement, on considère les premiers mots de la pages comme prépondérants du point de vue du référencement, il est donc nécessaire que cette première partie contienne les mots et expressions clés importantes.
- La mise en exergue du texte : si les mots clés sont contenus dans les balises <strong> ou <em> ou constitue un lien les moteurs les considéreront avec plus de poids. De même l’utilisation des balises de structuration du texte font varier l’interprétation du poids des expressions par les moteurs (balises <h1>, <h2>, <h3>, <h4>,…)
- A priori les moteurs sont incapables de prendre en compte l’interaction avec les feuilles de styles (CSS). Il vaut mieux mettre en gras un mot clé à l’aide de la balise <strong> que d’appliquer le style gras en css (font-weight : bold;).
- L’indice de de densité d’un mot clé, c’est-à-dire sa redondance par rapport au texte possède un poids et influence le positionnement. Ce critère est cependant de moins en moins considéré. L’outil http://www.keyworddensity.com/ permet d’évaluer cette densité. A priori, la redondance forte (supérieure à 10%) est le seuil d’influence sur le positionnement.
- Les déclinaisons du type féminin, pluriels sont à considérer pour augmenter l’impact du mot clé en matière de positionnement.
- Créer une page dédiée par expression clé, c’est-à-dire spécialiser les pages est favorable aux actions de référencement.
zone chaude n°3, l’url de la page
- Posséder un nom de domaine signifiant sans redirection
- Ajouter des mots clés dans le nom de domaine
- Un seul nom de domaine pour éviter d’être considéré comme du spam
- Privilégier plusieurs petits sites plutôt qu’un vaste et unique site
- Séparer les mots clés importants dans le nom de domaine ou l’url
- Créer des sous domaines du type : motclé.votresite.com
- Insérer les mots clés importants et intelligibles séparés par des tirets dans les url
zone chaude n°4, liens et réputations
- La première règle est de construire des liens de forme simples : <a href=« »>texte du lien</a> et d’éviter tout recours aux javascripts.
- Utiliser un lien pointant vers une page dont la sémantique est pertinente à par rapport au texte du lien revêt également une grande importance : <a href=«parier-en-direct.html»>parier en direct</a>. C’est le principe du Google Bombing. Il faut donc que le texte du lien soit signifiant et en rapport avec le contenu de la page pointée et son url.
zone chaude n°5, liens PageRank et popularité
L’indice de popularité est devenu au fil du temps un critère important pour le classement des résultats des moteurs. Il est donc nécessaire de mettre en place :
- De nombreux liens pointant vers son site
- Des liens provenant de sites eux-mêmes populaires c’est-à-dire reconnus notamment pour leur audience
L’indice de popularité est calculé pour chaque page et non pour un site globalement.
Focus sur le mode de calcul du Pagerank de Google :
- Le Pagerank s’affiche dans la barre d’outils de Google sous forme d’une note variant de 0 à 10 (http://www.google.com/tools/firefox/toolbar/FT3/intl/fr/index.html)
- Le mode de calcul du PageRank répond à une formule complexe, qui peut s’expliquer au travers des 2 exemples suivants. La conclusion est qu’il vaut mieux avoir peu de lien entrant de qualité que beaucoup de liens entrant venant de pages au PR faible.
- Pour augmenter le PR d’une page, il faut que d’autres pages ayant un PR important renvoient vers cette page, et que ces pages possèdent peu de liens renvoyant vers d’autres pages.
Zone chaude n°6, les balises META
- L’influence des balises META sur le positionnement d’un site est de moins en moins important.
- Elles sont intégrées dans l’en-tête de la page (<head></head>) au plus haut dans le code dans l’ordre suivant :
Consignes pour l’optimisation des META :
- TITRE : 10-15 mots, s’affichant dans le haut du navigateur & comme lien souligné dans le moteur
- DESCRIPTION :
200 caractères, s’affichant dans le haut du navigateur et sur la page de résultat des moteurs - MOTS CLES :
10-15 mots, s’affichant dans le haut du navigateur et sur la page de résultat des moteurs - ROBOTS :
ici on « autorise » l’indexation par les moteurs, et on les « autorise » à suivre tous les liens de la page
1 2 3 4 | <title>PMU : consulter le programme des courses, les arrivées, les résultats des courses hippiques, jouer aux paris PMU</title> <meta name="Description" content="Avec le PMU, consultez les programmes, les arrivées et les rapports des courses hippiques. Jouez au Quinté+, Quarté+, Tiercé, pariez spOt. " /> <meta name="Keywords" content="Quinté+, Quarté+, Tiercé, pariez spOt, programmes, arrivées, rapports, courses hippiques," /> <meta name="robots" content=" index, follow " /> |
Seules ces 4 balises ont un impact sur le référencement et le positionnement d’un site, toutes les autres n’ont aucun impact.
- Pour les 3 premières balises, pour maximiser le positionnement elles doivent contenir des expressions clés :
- En rapport avec le contenu de la page
- En rapport avec l’url de la page
- Réellement saisies par les internautes
- Indiquer dans la balise keywords les masculins/féminins/pluriels maximise également le référencement, il en est de même pour les caractères accentués à écrire sous forme normale ou sous forme codée (é pour é,…)
- Il faut également noter que la mise en place de titre et description spécifique à chaque page a tendance à augmenter le nombre de pages indexées par le moteur de recherche.
zone chaude n°7, alt et title
Le alt est pris en compte par google, pas par Yahoo et MSN, l’attribut title est pris en compte par aucun des 3 moteurs principaux.
Les autres critères favorables au positionnement
- Validité/conformité W3C du code html
- Date de création (une page ancienne a plus de poids) : exemple « bouchon » sur google pour le site Amorim
- Nombre de pages du site (plus il a de volume, plus il est considéré comme de confiance)
- Fréquence de mise à jour (plus elle est importante, plus le site est considéré comme intéressant)
- Historique du site (taux de renouvellement,…)
Les contraintes et obstacles au référencement
Les animations flash sont très mal « indexables »
Le contenu d’animations flash n’est pas indexable en l’état, il faut donc replacer tous les contenus textuels présents dans l’animation dans une balise placée sous la balise de l’animation flash, la balise <noembed></noembed>
La problématique javacript
- Les moteurs de recherche ne peuvent interpréter les javascripts.
- Il est donc nécessaire de fournir aux moteurs de recherche (comme aux internautes naviguant sans javascript) de pouvoir accéder au contenu proposé via un javascript, ou suivre un lien proposé sous forme de javascript.
Autres contraintes
- la présence de frames,
- les redirections,
- les pages bloquées par un login/mot de passe,
- les pages dynamiques et url exotiques,
- la présence de cookies empêchant la navigation en cas de non acceptation,…
Le plan du site et le sitemap, une bonne arme pour contourner les problèmes d’indexation
- Le recours à la création d’une page de plan du site pourra permettre de contourner aisément les problématiques de « blocage » des moteurs de recherche par les javascripts, les fichiers flashs ou les autres obstacles au référencement
- Le sitemap (fichier xml contenant toutes les url des pages du site, leurs noms, et des informations associées (date de mise à jour,…) est assez récent (Google – juin 2005) et permet à certains moteurs de suivre tous les liens contenus dans le site malgré certains obstacles potentiels à l’indexation).
Sources
Cette présentation a été réalisée sur la base de l’ouvrage :
- « Réussir son référencement web » d’Olivier Andrieux (http://www.editions-eyrolles.com/Livre/9782212122640/reussir-son-referencement-web) aux Editions Eyrolles

