Archive pour la catégorie 'Général'

2 principes clés de l’optimisation : décompte et densité (IDM)

Dimanche 21 octobre 2007

Le décompte et la densité font partie des paramètres utilisés par les moteurs de recherche pour juger de la pertinence d’une page web par rapport à un mot-clé. La densité ou IDM (Indice de Densité d’un Mot-clé) semble plus importante que le décompte. Il ne faut néanmoins pas négliger le décompte.

Décompte

Le décompte renvoie simplement au nombre d’occurrence d’un mot-clé dans un texte.

Densité

La densité est un peu plus subtile, mais reste accessible ;-) . C’est le rapport entre le décompte et le nombre total de mots. Elle mesure l’importance de la présence d’un mot-clé par rapport à l’ensemble d’un texte. Si un mot-clé apparaît 2 fois sur un total de 400 mots, il est moins présent que s’il apparaît 1 fois pour un total de 30 mots.

Exemple détaillé

Dans le texte suivant,

Le football, appelé soccer aux États-Unis et au Canada par opposition au football américain et au football canadien, est un sport collectif qui opposent deux équipes de onze joueurs, dont le but est de mettre un ballon sphérique dans le but adverse, sans utiliser les bras. Le football est le sport le plus populaire dans le monde.

Le mot-clé football apparaît à 4 reprises et il y a au total 57 mots. Nous avons donc un décompte de 4 et une densité de 4/57 = 7%, ce qui est très élevé.

Pour améliorer la densité d’un mot-clé, on peut soit augmenter le décompte, soit réduire le nombre total de mots.

Transformons le texte précédant comme suit,

Le football, appelé soccer aux États-Unis et au Canada par opposition au football américain et au football canadien, est un sport opposant deux équipes de onze joueurs, ayant pour but de mettre un ballon dans le but adverse, sans utiliser les bras. Le football est un sport très populaire.

Le mot-clé football apparaît toujours à 4 reprises et il y a au total 49 mots. Nous avons donc un décompte de 4 et une densité de 4/49 = 8.2%, soit un gain de 1.2%, ce qui est encore plus élevé. La signification est très proche mais la densité est meilleure, ce qui favorise davantage un bon référencement.

Pour terminer

Le référencement n’est pas une science exacte. Les moteurs de recherche se gardent bien de livrer le secret de leurs algorithmes. Nous nous trouvons face à des boîtes noires et seule l’expérimentation fournit des pistes sérieuses. La plupart des conseils relèvent donc de l’expérience, d’observations et de tests.

Ces 2 critères de décompte et densité sont valables pour toutes les balises html : title, a/href, img/alt, h1, strong, etc … Ils le sont également pour les urls. De manière générale pour un bon référencement, il faut un décompte et une densité supérieurs à la moyenne (des meilleurs, soit le top 10) pour les mots-clés visés, sans toutefois tomber dans l’excès (spamdexing, parfois pénalisé en terme de positionnement).

Le HTML pour le référencement

Vendredi 19 octobre 2007

Nous abordons aujourd’hui notre premier volet sur l’optimisation du code HTML. Avant d’entrer dans le vif du sujet, nous devons faire quelques rappels à propos du langage HTML.

HTML, le minimum

Ces rappels représentent le minimum de connaissances nécessaires en HTML sans lesquelles il est vain d’espérer pouvoir optimiser vos pages web. Ceux qui sont familiers du HTML n’y apprendront rien de nouveau et y trouveront même quelques approximations à portée purement pédagogique.

HTML, Kezako ?

A chaque page web, que vous visitez sur Internet, est associé un fichier au format HTML que votre navigateur (Internet Explorer, Opera, Firefox ou autre) reçoit et a la charge d’afficher. Ce fichier au format texte (donc humainement lisible) décrit l’apparence que doit avoir la page web correspondante (texte, images, mise en forme, etc …).

Par exemple, en vous rendant sur la page d’accueil du journal du Net, vous pouvez afficher le fichier qu’a reçu votre navigateur (clic droit + Afficher la source dans Internet Explorer). Dans un éditeur de texte s’affiche alors le texte suivant (code HTML) de la page d’accueil du journal du Net.

optimisation code html - jdn

Cette description est faîte en HTML. Le HTML (Hyper Text Markup Language) est un langage standard qui repose sur des balises (de mise en forme, en général). Il existe des balises pour afficher du texte, pour le mettre en gras, pour insérer des images, etc … Les balises ou tags (en anglais) sont toujours présentées entre chevrons <nom de la balise>. Le texte mis en forme est la plupart du temps encadré par une balise ouvrante et une balise fermante.

Par exemple,
pour afficher en gras le texte baladeur mp3, on utilise la balise b (pour bold, gras en anglais) comme suit,

<b>baladeur mp3</b>

Autre exemple, pour afficher en titre de premier niveau le texte voiture de sport, on utilise la balise h1 comme suit,

<h1>voiture de sport</h1>

Structure d’une page HTML

Une page HTML est divisée en deux sections : un entête (HEAD) et un corps (BODY). On trouve dans l’entête des balises spécifiques d’entête qui fournissent des informations d’ordre général sur le document à afficher. Et on trouve dans le corps le document à afficher et ses mises en forme par des balises spécifiques de corps.

Voici comment s’organise une page HTML,

<HTML>
   <HEAD>
      ... Balises d’entête -> informations d'ordre général...
   </HEAD>

   <BODY>
      ... Balises de corps -> page web et mise en forme ...
   </BODY>
</HTML>

Aller plus loin

Les connaissances qui précèdent sont succinctes et sont le minimum nécessaire à la compréhension des prochains articles sur l’optimisation du code HTML de vos pages web. Davantage de connaissances en HTML est néanmoins préférable.

Vous trouverez sur le site du zéro un excellent tutorial sur le XHTML, un « HTML amélioré » (compris par les moteurs de recherche). Vous devriez en peu de temps faire d’immenses progrès.

Pour aller encore plus loin, il peut être intéressant de consulter les standards HTML 4.01 et XHTML 1.1.