Sitemap XML : le guide complet pour bien le configurer

Sitemap XML : le guide complet pour bien le configurer

Le sitemap XML est un fichier qui liste toutes les pages importantes de votre site pour les moteurs de recherche. Bien configuré, il accélère l'indexation et améliore la couverture d'un site dans Google. Voici le guide complet pour créer, soumettre et optimiser votre sitemap.

Qu'est-ce qu'un sitemap XML ?

Un sitemap XML est un fichier au format XML qui répertorie toutes les URL d'un site, accompagnées de métadonnées (date de dernière modification, fréquence de mise à jour, priorité). Il sert de plan du site pour les robots des moteurs de recherche.

Pourquoi en avoir un ?

  • Faciliter la découverte de toutes les pages, même les plus profondes
  • Accélérer l'indexation des nouvelles pages
  • Indiquer la priorité relative des pages
  • Notifier Google des mises à jour
  • Améliorer la couverture pour les sites à structure complexe

Particulièrement utile pour : sites neufs, gros sites e-commerce, sites avec peu de liens internes, sites en SPA.

Format de base d'un sitemap XML

Structure minimale :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://exemple.com/page1.html</loc>
    <lastmod>2026-04-20</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Les balises clés expliquées

<loc>

URL absolue de la page (obligatoire). Doit être conforme à l'encodage URL.

<lastmod>

Date de dernière modification au format ISO 8601 (YYYY-MM-DD). Aide Google à recrawler les pages mises à jour.

<changefreq>

Fréquence indicative de changement. Valeurs : always, hourly, daily, weekly, monthly, yearly, never. Google la traite comme un indice, pas une directive stricte.

<priority>

Priorité relative de la page (0.0 à 1.0). 1.0 pour la page la plus importante, 0.5 par défaut. Utilisée comme indication, pas comme règle absolue.

Limites techniques

  • Maximum 50 000 URLs par sitemap
  • Taille maximum 50 Mo non compressé (peut être compressé en .gz)
  • Pour les sites plus gros : créer un sitemap index qui regroupe plusieurs sitemaps

Le sitemap index

Pour les sites volumineux, un sitemap index regroupe plusieurs sitemaps :

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://exemple.com/sitemap-articles.xml</loc>
  </sitemap>
  <sitemap>
    <loc>https://exemple.com/sitemap-categories.xml</loc>
  </sitemap>
</sitemapindex>

Stratégie de segmentation

Pour les grands sites, segmenter par type de contenu :

  • sitemap-pages.xml : pages statiques
  • sitemap-articles.xml : articles de blog
  • sitemap-products.xml : fiches produits
  • sitemap-categories.xml : catégories e-commerce
  • sitemap-images.xml : images si très nombreuses
  • sitemap-news.xml : actualités (format spécifique Google News)

Cette segmentation facilite l'analyse de la couverture par type de contenu dans Search Console.

Créer un sitemap : les méthodes

WordPress

Plugins :

  • Yoast SEO (génération automatique)
  • RankMath (génération automatique avec options avancées)
  • WordPress core (sitemap natif depuis WP 5.5)

Le sitemap est généré automatiquement et accessible à /sitemap.xml ou /sitemap_index.xml.

Site sur mesure (PHP, Node, etc.)

Génération via script qui parcourt les contenus et produit le XML. À régénérer à chaque ajout/modification de page (ou via cron quotidien).

Outils en ligne

  • XML-Sitemaps.com (gratuit jusqu'à 500 URLs)
  • Screaming Frog (export sitemap après crawl)
  • Sitebulb (audit + génération)

Soumettre le sitemap à Google

Via Google Search Console

  1. Connexion à GSC sur la propriété concernée
  2. Menu « Sitemaps »
  3. Saisir l'URL relative du sitemap (ex : sitemap.xml)
  4. Cliquer sur « Envoyer »
  5. Vérifier le statut sous quelques heures

Via robots.txt

Ajouter dans le fichier robots.txt :

Sitemap: https://exemple.com/sitemap.xml

Cela permet à tous les moteurs de découvrir le sitemap automatiquement.

Via ping

Pour notifier Google d'une mise à jour : appel HTTP GET vers https://www.google.com/ping?sitemap=URL.

Vérifier le statut du sitemap

Dans Search Console, l'écran « Sitemaps » indique :

  • URL du sitemap soumis
  • Date de dernière lecture par Google
  • Statut (Réussi / Échec)
  • Nombre d'URLs découvertes
  • Nombre d'URLs indexées

Le ratio « indexées / découvertes » est un indicateur clé de la santé du sitemap.

Erreurs fréquentes

  • URLs en erreur 404 dans le sitemap
  • URLs avec balise noindex (contradiction)
  • URLs canonicalisées vers une autre URL (double signal)
  • Sitemap trop gros (> 50 000 URLs ou 50 Mo)
  • Date lastmod incorrecte ou pas mise à jour
  • URLs en HTTP alors que le site est en HTTPS
  • URLs avec slashes finaux incohérents
  • Caractères spéciaux mal encodés

Optimisation avancée

Sitemap d'images

Format dédié pour aider Google Images. Voir notre guide d'optimisation des images.

Sitemap de vidéos

Format spécifique avec metadata vidéo (durée, miniature, description).

Sitemap de news

Pour les sites éligibles à Google News : balises additionnelles (publication_date, title, language).

Hreflang dans le sitemap

Pour les sites multilingues, déclarer les versions linguistiques :

<url>
  <loc>https://exemple.com/page</loc>
  <xhtml:link rel="alternate" hreflang="en" href="https://exemple.com/en/page"/>
  <xhtml:link rel="alternate" hreflang="fr" href="https://exemple.com/fr/page"/>
</url>

Maintenance du sitemap

  • Mettre à jour automatiquement à chaque ajout/modification de page
  • Vérifier mensuellement le statut dans Search Console
  • Nettoyer les URL obsolètes (404, redirigées)
  • Adapter la segmentation si le site grossit

Sitemap et stratégie SEO globale

Le sitemap n'est qu'un facilitateur d'indexation. Il ne remplace pas :

Conclusion

Le sitemap XML est un élément technique simple mais essentiel pour une bonne indexation. Configurez-le correctement, soumettez-le à Search Console, et maintenez-le à jour. Pour aller plus loin : SEO technique complet, robots.txt, Schema.org, Core Web Vitals.