Réalisation de sites web

Sommaire du site

Présentation
Comment apprendre
L'équipement
La page web
  Styles et CSS
  HTML, structure de la page
  HTML, éléments du corps
Le langage JavaScript
  JavaScript, objets "core"
  JavaScript, DOM, les bases
  JavaScript, DOM, node
  JavaScript, compléments
Le langage PHP, les bases
  PHP, fonctions utiles
  PHP pour le web
  PHP, compléments
SQL, introduction
  MySQL et PHP pour le web
  MySQL, plus loin...
Applications AJAX
Annexes utiles
  Fichier .htaccess
  Sécurité des sites web
  Conception d'un site web
  Référencement, syndication

Sommaire détaillé

Mentions légales.

Chapitres de cette page
Contenu  -> 

Page mise à jour le : 12-08-2015

Haut de la page

Préparation du référencement
Fichier "Sitemap"
Référencement
Dépot légal
Flux de syndication

Référencement, syndication

Le référencement consiste à faire connaitre aux principaux systèmes de recherche web l'existence du site et ses pages afin que les internautes puissent accéder au contenu du site depuis un moteur de recherche web.

Le référencement est important si vous estimez que des internautes inconnus seraient intéressés par votre site.

En revanche vous pouvez laisser votre site caché à ces système (web invisible) mais il faut savoir que si un site référencé donne, sur une de ses pages l'adresse du vôtre, vous serez référencé à votre insu.

Il existe un nombre important de moteurs de recherche et d'annuaire indexant le web. Mais il faut constater que la plupart des internautes utilisent "Google" pour chercher des pages web (près de 90 % des recherches en France début 2010). Il est donc important de se faire référencer au moins par celui-ci.

On peut trouver une liste (certainement incomplète) des systèmes de recherche sur :
http://www.zefab.info/

Il est intéressant que des sites thématiquement proches du votre placent des liens depuis leurs pages vers le vôtre. Cela vous amènera des visiteurs concernés par vos sujets et améliorera le référencement (si ces sites sont eux-mêmes référencés).

Enfin il est préférable de faire référencer votre site lorsqu'il est terminé, tout au moins opérationnel. Car auparavant les internautes qui le visiteront risquent d'être déçus et, donc, de ne pas y revenir.

Préparation du référencement

Important à savoir

La plupart des systèmes de recherche sont automatisés (robots). Ils ne référencent généralement pas :

Si vous voulez savoir ce que "voit" un robot de moteur de recherche, utilisez un navigateur rustique comme "Lynx".

Cependant de plus en plus de moteurs de recherche acceptent de recevoir un fichier "Sitemap" qui décrit la composition du site. Cela permet de faire connaitre à ces moteurs l'existence de pages auxquels ils n'auraient pas accédés par l'exploration. Voir plus bas, plus de précisions sur ce fichier "Sitemap".

Il existe tout un ensemble d'éléments "META" d'en-têtes destinés aux robots de recherche, mais certains en tiennent peu compte, notamment Google. Celui-ci se base plutôt sur le contenu de la page.

Par contre l'élément "TITLE" jour un rôle très important dans l'indexation de la page par les robots. Il faut donc le "soigner".

Balises META pour les robots de recherche

Voici les éléments 'META' (à placer dans la section d'en-tête des pages) spécifiquement destinés aux robots.

<meta name="description" content="...">

Courte description de la page.

<meta name="author" content="...">

Nom de l'auteur ou du responsable du contenu.

<meta name="keywords" content="..., ..., ...">

Liste des mots-clefs, séparés par une virgule, que l'on souhaiterait voir pris en compte par les robots.

<meta name="date" content="aaaa-mm-jjThh:mm:ss+dh:dm">

Date et heure de la dernière mise à jour de la page. Ce qui suit le signe '+' indique le décalage horaire par rapport au temps universel, par exemple :
2010-03-27T23:45:00+01:00

<meta name="robots" content="...">

Indique si le robot peut indexer cette page et suivre ses liens. Derrière 'content' on met l'une des valeurs :
  'index, follow' la page doit être indexée et ses liens suivis
  'index, nofollow' la page doit être indexée mais ses liens ignorés
  'noindex, follow' la page ne doit pas être indexée mais ses liens seront suivis
  'noindex, nofollow' la page ne doit pas être indexée et ses liens ignorés.

Balises META "Dublin Core"

Une méthode de description de ressources a été définie sous le nom de "Dublin Core". Elle est normalisée ISO et est utilisée par beaucoup d'organisations notamment les bibliothèques nationales.

Cette méthode peut être appliquée aux pages web par 15 balises "META" spécifiques.

On en trouvera une description sur le site de Openweb :
http://openweb.eu.org/articles/dublin_core

Fichier "Sitemap"

Il s'agit d'un fichier placé sur le site qui fourni la liste des pages à visiter et à indexer par le robot du moteur de recherche.

Ce peut être un simple fichier texte où chaque ligne indique l'adresse complète d'une page, mais il est préférable de produire un fichier XML.

En effet, non seulement ce format XML est normalisé (protocole Sitemap) donc théoriquement accessible à plus de robots de recherche mais, de plus, ce document peut contenir d'autres renseignements utiles sur les pages :

La description d'un Sitemap XML est décrite à la page "protocole" du site : http://www.sitemaps.org/fr/

Si le site pour lequel on veut réaliser ce fichier contient beaucoup de pages, il est utile d'utiliser un programme qui le génère automatiquement, on en trouve assez facilement sur le web mais il n'est pas très compliqué de le faire soi-même.

Une fois le fichier Sitemap produit il faut le placer sur le site (généralement à la racine) et indiquer son existence aux robots de recherche.

Pour cela, on utilise l'interface de gestion des moteurs de recherche (par exemple : "Outils pour les webmasters" pour Google) qui permet de donner l'adresse du fichier Sitemap.

Mais il est aussi utile d'indiquer son existence en plaçant dans le fichier "robot.txt" du site la ligne :

http://www.monsite.com/sitemap.xml

 

Référencement

Donc, vous souhaitez que vote site soit référencé, vous avez bien préparé vos page, il ne reste plus qu'à le faire connaitre aux (principaux) systèmes de recherche.

Là vous avez plusieurs possibilités.

Si vous faites le référencement vous-même, vous aurez certainement du mal à trouver comment se faire référencer par les systèmes de recherche les plus utilisées, car souvent la page qui le permet est bien cachée.

Je vais vous donner un "tuyau" pour "Google" (valable en mai 2010).

Depuis la page d'accueil du site (http://www.google.fr/), cliquez sur le lien "A propos de Google", ensuite "Envoyez votre contenu à Google", puis "Web", enfin "Ajout de votre URL à l'index Google".

Et là il suffit de remplir le formulaire.

Dans tous les cas, il ne faut pas s'attendre à être référencé rapidement. En particulier certains systèmes de recherche réalisent le référencement manuellement, le délai est alors de plus d'un mois.

De plus, si vous souhaitez être dans les premiers résultats des moteurs de recherche (on peut rêver), il faut que beaucoup d'autres sites aient un lien vers le vôtre. Donc, il faut se faire bien connaître.

Dépot Légal (France)

En France, tout producteur de document a l'obligation de déposer une copie de son contenu à la Bibliothèque Nationale de France ( ou auprès d'un autre organisme habilité).
http://www.bnf.fr/fr/professionnels/depot_legal.html

Pour ce qui est du web cette obligation reste effective, tout au moins pour les sites hébergés en France ou produits par des personnes y résidant.

Mais, dans ce cas, la procédure est très simple car il n'y a aucune démarche à faire. En effet, un jour le robot indexeur de la BNF viendra visiter votre site et le dépôt légal sera réalisé.

Cependant la Loi pour la Confiance dans l'Economie Numérique (LCEN) du 21 juin 2004 impose les éditeurs de site à proposer sur leur production une page : "Mentions légales" qui identifie un responsable des contenus. Toutefois pour un site placé sur un serveur mutualisé, il est possible de n'indiquer que les coordonnées de l'hébergeur.
Voir : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000801164
article 6, paragraphe III

 

Flux de syndication

RSS

Si votre site à un contenu qui évolue souvent, il est intéressant de lui associer un flux de syndication.

Ainsi les internautes pourront associer à ce flux un ensemble de liens dynamiques qui pointeront vers les nouvelles pages du site ou vers celles récemment mises à jour.

Ces liens dynamiques sont gérés par des logiciels spécifiques "agrégateurs", par quelques navigateurs web récents et par certains logiciels de messagerie.

Les sites web qui proposent des liens dynamiques sont remarqués par le logo représenté ci-dessus apparaissant dans la barre d'outils ou la barre d'adresse du navigateur.

Comme il existe encore des internautes qui ne connaissent pas ces flux, il peut être utile de placer sur votre site qui les utilise une petite information.

Par ailleurs, un site web peut consulter les flux de syndication d'un autre et placer ainsi sur le sien des liens dynamiques.

Il existe deux formats de flux de syndication : Atom et RSS, nous ne décrirons ici que celui-ci (le format ATOM est très proche).

Mise en place d'un fil RSS

Il faut placer sur le site un fichier XML décrivant le flux et dans les pages un élément d'en-tête "link" indiquant ce fichier.

Sur les sites fournissant beaucoup d'informations, il est possible de créer plusieurs flux (par catégories).

Elément "link" d'indication de flux RSS

<link rel="alternate" type="application/rss+xml" href="chemin" title="titre">

Où "chemin" indique l'adresse du fichier XML de description et "titre" est l'intitulé que vous donnez à ce flux.

Fichier XML de description du flux

Il s'agit donc d'un fichier texte.

Voici le minimum :.

<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"> <channel> <title>Titre flux</title> <description>Description du flux</description> <link>URL du site</link> <item> <title>Titre page</title> <description>Description page</description> <link>URL de la page</link> </item> </channel> </rss>

L'élément 'channel' doit être unique il décrit le flux.

On peut y inclure autant d'éléments 'item' pour chaque "actualité". Chacun identifie la page du site associée à cette "actualité". Dans "item" on peut mettre un élément "titre" ou "description" mais au moins l'un des deux.

La spécification de la norme RSS 2.01 (en français) est disponible à :
http://www.scriptol.fr/rss/RSS-2.0.html

Utilisation de fils RSS d'autres sites

Dans la mesure où vous connaissez un site proposant des flux RSS en rapport avec le vôtre, il est facile de retrouver l'élément "link" d'indication du flux RSS sur ses pages. Par là on peut accéder au fichier de description de flux et réaliser un agrégateur en PHP qui vous permettra d'obtenir les liens dynamiques du site.

On peut aussi se simplifier le travail de programmation en utilisant une bibliothèque de fonctions d'agrégation RSS pour le PHP tel que l'application libre MagpieRSS.