Sommaire du site
Présentation
Comment apprendre
L'équipement
La page web
Styles et CSS
HTML, structure de la page
HTML, éléments du corps
Le langage JavaScript
JavaScript, objets "core"
JavaScript, DOM, les bases
JavaScript, DOM, node
JavaScript, compléments
Le langage PHP, les bases
PHP, fonctions utiles
PHP pour le web
PHP, compléments
SQL, introduction
MySQL et PHP pour le web
MySQL, plus loin...
Applications AJAX
Annexes utiles
Fichier .htaccess
Sécurité des sites web
Conception d'un site web
Référencement,
syndication
Page mise à jour le : 12-08-2015
Le référencement consiste à faire connaitre aux principaux systèmes de recherche web l'existence du site et ses pages afin que les internautes puissent accéder au contenu du site depuis un moteur de recherche web.
Le référencement est important si vous estimez que des internautes inconnus seraient intéressés par votre site.
En revanche vous pouvez laisser votre site caché à ces système (web invisible) mais il faut savoir que si un site référencé donne, sur une de ses pages l'adresse du vôtre, vous serez référencé à votre insu.
Il existe un nombre important de moteurs de recherche et d'annuaire indexant le web. Mais il faut constater que la plupart des internautes utilisent "Google" pour chercher des pages web (près de 90 % des recherches en France début 2010). Il est donc important de se faire référencer au moins par celui-ci.
On peut trouver une liste
(certainement incomplète) des systèmes de recherche sur :
http://www.zefab.info/
Il est intéressant que des sites thématiquement proches du votre placent des liens depuis leurs pages vers le vôtre. Cela vous amènera des visiteurs concernés par vos sujets et améliorera le référencement (si ces sites sont eux-mêmes référencés).
Enfin il est préférable de faire référencer votre site lorsqu'il est terminé, tout au moins opérationnel. Car auparavant les internautes qui le visiteront risquent d'être déçus et, donc, de ne pas y revenir.
La plupart des systèmes de recherche sont automatisés (robots). Ils ne référencent généralement pas :
Si vous voulez savoir ce que "voit" un robot de moteur de recherche, utilisez un navigateur rustique comme "Lynx".
Cependant de plus en plus de moteurs de recherche acceptent de recevoir un fichier "Sitemap" qui décrit la composition du site. Cela permet de faire connaitre à ces moteurs l'existence de pages auxquels ils n'auraient pas accédés par l'exploration. Voir plus bas, plus de précisions sur ce fichier "Sitemap".
Il existe tout un ensemble d'éléments "META" d'en-têtes destinés aux robots de recherche, mais certains en tiennent peu compte, notamment Google. Celui-ci se base plutôt sur le contenu de la page.
Par contre l'élément "TITLE" jour un rôle très important dans l'indexation de la page par les robots. Il faut donc le "soigner".
Voici les éléments 'META' (à placer dans la section d'en-tête des pages) spécifiquement destinés aux robots.
Courte description de la page.
Nom de l'auteur ou du responsable du contenu.
Liste des mots-clefs, séparés par une virgule, que l'on souhaiterait voir pris en compte par les robots.
Date et heure de la dernière mise à jour de la page. Ce qui suit le
signe '+' indique le décalage horaire par rapport au temps universel,
par exemple :
2010-03-27T23:45:00+01:00
Indique si le robot peut
indexer cette page et suivre ses liens. Derrière 'content' on met l'une
des valeurs :
'index, follow' la page doit être indexée
et ses liens suivis
'index, nofollow' la page doit être indexée mais ses liens
ignorés
'noindex, follow' la page ne doit pas être indexée mais ses
liens seront suivis
'noindex, nofollow' la page ne doit pas être indexée et ses
liens ignorés.
Une méthode de description de ressources a été définie sous le nom de "Dublin Core". Elle est normalisée ISO et est utilisée par beaucoup d'organisations notamment les bibliothèques nationales.
Cette méthode peut être appliquée aux pages web par 15 balises "META" spécifiques.
On en trouvera une description sur le site de
Openweb :
http://openweb.eu.org/articles/dublin_core
Il s'agit d'un fichier placé sur le site qui fourni la liste des pages à visiter et à indexer par le robot du moteur de recherche.
Ce peut être un simple fichier texte où chaque ligne indique l'adresse complète d'une page, mais il est préférable de produire un fichier XML.
En effet, non seulement ce format XML est normalisé (protocole Sitemap) donc théoriquement accessible à plus de robots de recherche mais, de plus, ce document peut contenir d'autres renseignements utiles sur les pages :
La description d'un Sitemap XML est décrite à la page "protocole" du site : http://www.sitemaps.org/fr/
Si le site pour lequel on veut réaliser ce fichier contient beaucoup de pages, il est utile d'utiliser un programme qui le génère automatiquement, on en trouve assez facilement sur le web mais il n'est pas très compliqué de le faire soi-même.
Une fois le fichier Sitemap produit il faut le placer sur le site (généralement à la racine) et indiquer son existence aux robots de recherche.
Pour cela, on utilise l'interface de gestion des moteurs de recherche (par exemple : "Outils pour les webmasters" pour Google) qui permet de donner l'adresse du fichier Sitemap.
Mais il est aussi utile d'indiquer son existence en plaçant dans le fichier "robot.txt" du site la ligne :
http://www.monsite.com/sitemap.xml
Donc, vous souhaitez que vote site soit référencé, vous avez bien préparé vos page, il ne reste plus qu'à le faire connaitre aux (principaux) systèmes de recherche.
Là vous avez plusieurs possibilités.
Si vous faites le référencement vous-même, vous aurez certainement du mal à trouver comment se faire référencer par les systèmes de recherche les plus utilisées, car souvent la page qui le permet est bien cachée.
Je vais vous donner un "tuyau" pour "Google" (valable en mai 2010).
Depuis la page d'accueil du site (http://www.google.fr/), cliquez sur le lien "A propos de Google", ensuite "Envoyez votre contenu à Google", puis "Web", enfin "Ajout de votre URL à l'index Google".
Et là il suffit de remplir le formulaire.
Dans tous les cas, il ne faut pas s'attendre à être référencé rapidement. En particulier certains systèmes de recherche réalisent le référencement manuellement, le délai est alors de plus d'un mois.
De plus, si vous souhaitez être dans les premiers résultats des moteurs de recherche (on peut rêver), il faut que beaucoup d'autres sites aient un lien vers le vôtre. Donc, il faut se faire bien connaître.
En France, tout
producteur de document a l'obligation de déposer une copie de son
contenu à la Bibliothèque Nationale de France ( ou auprès d'un autre
organisme habilité).
http://www.bnf.fr/fr/professionnels/depot_legal.html
Pour ce qui est du web cette obligation reste effective, tout au moins pour les sites hébergés en France ou produits par des personnes y résidant.
Mais, dans ce cas, la procédure est très simple car il n'y a aucune démarche à faire. En effet, un jour le robot indexeur de la BNF viendra visiter votre site et le dépôt légal sera réalisé.
Cependant la Loi pour la Confiance dans l'Economie Numérique (LCEN) du 21 juin 2004 impose les éditeurs de site à proposer sur leur production une page : "Mentions légales" qui identifie un responsable des contenus. Toutefois pour un site placé sur un serveur mutualisé, il est possible de n'indiquer que les coordonnées de l'hébergeur.
Voir : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000801164
article 6, paragraphe III
Si votre site à un contenu qui évolue souvent, il est intéressant de lui associer un flux de syndication.
Ainsi les internautes pourront associer à ce flux un ensemble de liens dynamiques qui pointeront vers les nouvelles pages du site ou vers celles récemment mises à jour.
Ces liens dynamiques sont gérés par des logiciels spécifiques "agrégateurs", par quelques navigateurs web récents et par certains logiciels de messagerie.
Les sites web qui proposent des liens dynamiques sont remarqués par le logo représenté ci-dessus apparaissant dans la barre d'outils ou la barre d'adresse du navigateur.
Comme il existe encore des internautes qui ne connaissent pas ces flux, il peut être utile de placer sur votre site qui les utilise une petite information.
Par ailleurs, un site web peut consulter les flux de syndication d'un autre et placer ainsi sur le sien des liens dynamiques.
Il existe deux formats de flux de syndication : Atom et RSS, nous ne décrirons ici que celui-ci (le format ATOM est très proche).
Il faut placer sur le site un fichier XML décrivant le flux et dans les pages un élément d'en-tête "link" indiquant ce fichier.
Sur les sites fournissant beaucoup d'informations, il est possible de créer plusieurs flux (par catégories).
<link rel="alternate" type="application/rss+xml" href="chemin" title="titre">
Où "chemin" indique l'adresse du fichier XML de description et "titre" est l'intitulé que vous donnez à ce flux.
Il s'agit donc d'un fichier texte.
Voici le minimum :.
<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"> <channel> <title>Titre flux</title> <description>Description du flux</description> <link>URL du site</link> <item> <title>Titre page</title> <description>Description page</description> <link>URL de la page</link> </item> </channel> </rss>
L'élément 'channel' doit être unique il décrit le flux.
On peut y inclure autant d'éléments 'item' pour chaque "actualité". Chacun identifie la page du site associée à cette "actualité". Dans "item" on peut mettre un élément "titre" ou "description" mais au moins l'un des deux.
La spécification de la norme RSS 2.01 (en français) est disponible à :
http://www.scriptol.fr/rss/RSS-2.0.html
Dans la mesure où vous connaissez un site proposant des flux RSS en rapport avec le vôtre, il est facile de retrouver l'élément "link" d'indication du flux RSS sur ses pages. Par là on peut accéder au fichier de description de flux et réaliser un agrégateur en PHP qui vous permettra d'obtenir les liens dynamiques du site.
On peut aussi se simplifier le travail de programmation en utilisant une bibliothèque de fonctions d'agrégation RSS pour le PHP tel que l'application libre MagpieRSS.