Utilizzi delle Sitemap che forse non conoscevi

sitemap

Oggi parliamo di un archivio noto a tutti, la Sitemap. Un file che la maggior parte dei progetti Internet stanno usando e molto pochi la usano in modo corretto.

Ero ansioso di parlare di questo ed è arrivato il momento, visto che questo file la maggior parte delle volte passa inosservato e automaticamente genera un plugin o modulo e non viene mai più toccato. La verità è che ha molti usi che voglio raccontare lungo questo articolo.

In questo articolo voglio discutere alcuni aspetti che ci sono nei lavori da fare giorno per giorno con Sitemap e le soluzioni da scegliere a seconda del progetto, del volume e dello stato dello stesso.

Cos’è la Sitemap?

La Sitemap è un file che viene utilizzato per segnalare a qualsiasi motore di ricerca (Google in questo caso) le URL di un progetto Web, affinché i robot rastrellino in modo più efficiente il progetto. Inoltre, la Sitemap assicura pure che i robot raccolgano questa informazione prima, mentre che l’uso che ne facciano di questa dipende da altri fattori che ti racconterò lungo questo articolo.

Formati con i quali possiamo generare una Sitemap:

  • XML: Questo è il più utilizzato e ti raccomando di usarlo. La maggior parte dei plugin, moduli e estensioni che usano gestori di contenuti come
  • WordPress, Prestashop o Magento, usano questo formato.
  • RSS: Se hai generato un feed che consente di automatizzare il caricamento di nuovi contenuti, è possibile includerlo come Sitemap, ma fai attenzione a questo perché la maggior parte dei feed si dimenticano di molte pagine antiche che non sono state generate automaticamente.
  • Documento di Testo: Puoi pure includere file .txt per generare la tua Sitemap. Ma bisogna includere una URL per riga.
  • Google Sites: Un’altro modo di creare la tua Sitemap che Non ti raccomando, ma che Google permette di usare, qui ti lascio tutte le info: https://support.google.com/webmasters/answer/183668?hl=es&ref_topic=4581190#sitemapformat

Bisogna evidenziare il fatto che è pure possibile creare delle Sitemap per immagini, video o cellulari, questo qualcosa che ogni giorno vedo più implementato nei progetti che trovo.

IMPORTANTE: Finora abbiamo dato solo una panoramica su cosa sia una Sitemap e quali formati possa usare. Niente che tu non possa trovare nelle linee guida di Google come dico sempre (lì c’è tutto, e non in altre web). Se non conoscevi tutti i suoi usi, ho lasciato diversi link ai documenti ufficiali di Google. Ahhhh! Ricorda che non puoi generare Sitemap per oltre 50.000 URL, anche se io, in base alla mia esperienza, ti consiglio di non superare le 40.000. Quando hai molte migliaia di URL conviene realizzare un indice di Sitemap.

Qualcosa che devi tenere presente che nella maggior parte dei casi non si calcola, sono i seguenti aspetti:

  • Non includere nella Sitemap URL con Noindex
  • Non includere nella Sitemap URL che rispondano a un codice 200
  • Non includere nella Sitemap URL NON canonical

QUESTE SONO LE 3 REGOLE D’ORO DELLA SITEMAP

IMPORTANTE: La Sitemap non serve a indicizzare l’URL, ma è anche vero che la generazione di Sitemap in modo idoneo aiuta il monitoraggio, ma non c’è bisogno di indicizzare e questo non è manco un file obbligatorio. Qualsiasi web piccola o media non ha bisogno di una Sitemap affinché Google indicizzi le sue URL, semplicemente è sufficiente un buon collegamento interno.

ERRORI AL MOMENTO DELLA CREAZIONE DELLE  SITEMAP

Nel corso degli ultimi anni, auditando siti web e lavorando con diversi progetti, ho trovato di tutto in relazione al tema delle Sitemap, ma ciò che più risalta in assoluto è quanto segue:

  • Includere URL che rispondono a codici 301.
  • Includere URL che rispondono a codici 404.
  • Includere URL che hanno il canonical che punta verso un’altra URL.
  • Includere URL bloccate dal Robots.txt (questa è la meglio xD).

E’ molto semplice verificare che a un progetto non stia accadendo niente di tutto questo, hai bisogno solo della Sitemap del progetto e di Screaming Frog. Ti spiego il processo in più step:

STEP 1: Scarica il file Sitemap per poter lavorare con il documento.

STEP 2: Avvia Screaming Frog >> Mode>> List >> Upload List >> from a file >> seleziona Sitemap xml. Facendo così potrai caricare la tua Sitemap per analizzarla in profondità e trovare gli errori che possa generare.

STEP 3: Identifica gli errori e crea una Sitemap corretta. Facendo così avrai una miglioria importante del rastrellamento. Dipendendo dallo stato della tua Sitemap, questa miglioria del rastrellamento può fare in modo che il tuo progetto inizi a migliorare nelle posizioni.

Quando si deve seguire questo controllo?

Ora elencherò qualche situazione generale dove questo controllo è importantissimo, così come la creazione di una nuova Sitemap che faccia sì che il robot di Google passi in modo più intelligente per il tuo sito:

  1. Se hai implementato il famoso HTTPS sulla tua pagina, allora è un momento cruciale per controllare la tua Sitemap e vedrai la quantità di 3xx che troverai.
  2. Se hai realizzato una migrazione o dei cambi nelle URL di recente, troverai sorprese tipo: 301 e 404 xD.
  3. Se ti piace molto giocare con i Noindex o stai usando un plugin per generare la tua Sitemap, sicuramente troverai delle URL con noindex che stai includendo nella Sitemap.
  4. Se ti piace molto l’uso dei “canonical”, sicuramente troverai sorprese sgradevoli nella tua te Sitemap.

2 USI AVANZATI DELLA SITEMAP

La Sitemap ha differenti usi. Qui ti spiegherò in quali situazioni la uso e il perché realizzo questo azioni:

  1. Accelerare la deindicizzazione di un gran numero di URL grazie alla Sitemap

Cominciamo con il primo scenario comune! Abbiamo una quantità di  URL innecessarie che vogliamo deindicizzare per qualsiasi motivo che sia (non voglio entrare nei dettagli, altrimenti questo post diventerebbe eterno, nei seguenti post discuteremo sul perché molte volte abbiamo bisogno di deindicizzare le URL). Immagina che sono centinaia o migliaia. Non puoi sperare che Google passi per ognuna a seconda della sua frequenza di monitoraggio.

  1. Per velocizzare questo processo di deindicizzazione di una gran quantità di URL, semplicemente dobbiamo generare una Sitemap includendo tutte le URL che abbiamo già con noindex e caricarle al Search Console.
  2. Una volta passato del tempo considerevole, semplicemente prendiamo tutte le URL e controlliamo che si siano deindicizzate usandoURL Profiler (questro strumento te lo spiegherò più avanti). Semplicemente inserisci tutte le URL e selezioni l’opzione “Google Indexation”.
  3. Una volta che siano state deindicizzate, eliminiamo la Sitemap dal Search Console.

Creare una Sitemap per eliminare URL più velocemente

Questo scenario appare in moltissimi e-commerce! Immagina di avere un e-commerce e che lavori a periodi con prodotti e di colpo devi eliminare diverse categorie e prodotti per vari motivi. Occhio, quando succede questo ci sono diverse opzioni:

  • Controllare che nessuna URL abbia collegamenti esterni che diano autorità.
  • Controllare il traffico organico di quelle URL, visto che se ho alcune URL con traffico non le eliminerei in nessun caso.
  • Controllare che non ci siano prodotti simili, visto che se ci fossero e avessimo traffico da quelle URL potremmo eseguire un 301.

OCCHIO: Qualcosa di molto comune nei commerci elettronici sono i reindirizzamenti ad altre sezioni del sito, nei punti anteriori ho commentato ciò che bisogna controllare prima di prendere decisioni. Il problema di fare reindirizzamenti nel senso comune e senza analizzare, è che genereranno codici 404 Soft e se continui con quella pratica il tuo Search Console ti riempirà di quelli.

  1. Se hai deciso che devi eliminare queste URL perché non hanno traffico né collegamenti esterni che apportino autorità, e perché quelle URL non esisteranno più, semplicemente devi fare in modo che quelle URL ritornino un codice 410.
  2. Realizzare una Sitemap con tutte le URL che rispondono 410.
  3. Una volta passato del tempo considerevole, semplicemente prendiamo tutte queste URL e controlliamo che si siano indicizzate usando URL Profiler. Semplicemente inserisci tutte le URL e selezioni l’opzione “Google Indexation”.
  4. Una volta che siano state deindicizzate, eliminiamo la Sitemap dal Search Console.

CONCLUSIONI

Come hai potuto vedere lungo l’articolo, la Sitemap ha diversi usi e si possono avere notevoli benefici. Al giorno d’oggi sono convinto del fatto che non viene sfruttata a dovere e per questo motivo ho deciso di mostrare per cosa la uso assieme ai miei compagni nella mia routine.

Se controlli la Sitemap ogni tot tempo e stai attento e usi gli aspetti avanzati che ti ho mostrato, sicuramente per te sarà uno strumento molto produttivo e, a seconda dei casi, ti aiuterà a migliorare il rastrellamento della tua web.

Ora mi piacerebbe sapere come usi la Sitemap per avere più idee su come usare questo file in modo più efficiente e sfruttarlo meglio. Hai coraggio di commentare i tuoi usi e impressioni?