Tutorial

Guida completa per la gestione dei contenuti duplicati in Magento

Anche se in Magento non vengono create pagine uguali, il sito ecommerce conterrà pagine con contenuti duplicati

Google non può capire che tutti gli indirizzi URL dei prodotti duplicati, o contenuti duplicati, di Magento hanno come target la stessa pagina. Gli utenti vedranno la versione più pertinente (secondo Google) dell’URL del tuo sito web, ma non quella che tu preferisci far vedere;
Per questo motivo, rischierai di perdere le visite del crawler, nel momento in cui i robot di Google scoprono i contenuti duplicati, non eseguiranno la scansione del tuo nuovo contenuto.
Per capire meglio, prova ad accedere alla console Google Webmaster per visualizzare gli avvisi relativi ai contenuti duplicati. Esamina le metriche del crawler (Scansione -> Statistiche di scansione) per vedere quante pagine sono già state scansionate, e indicizzate. Quindi confronta le statistiche con la quantità di pagine reale.

Se il numero di quelle pagine sottoposte a scansione e indicizzate è molte volte superiore a quello reale, continua a leggere perchè probabilmente hai problemi di contenuti duplicati.

I contenuti duplicati più comuni di Magento

In Magento si possono verificare due tipologie di pagine duplicate, parziali e totali. I duplicati parziali si verificano quando una parte minima del contenuto o il suo layout sono unici, ad esempio variazioni dello stesso prodotto. I duplicati totali si verificano quando il contenuto di due o più pagine è identico. L’esempio più comune di duplicati completi in Magento è lo stesso prodotto in diverse categorie.

Analizziamo più nel dettaglio i duplicati parziali:

1. Ordinamento dei prodotti

Una funzione molto comoda, presente in tutti gli shop online, è quella di ordinamento. Gli utenti possono ordinare i prodotti del negozio rispetto il volume di vendita, dai più recenti, rispetto il prezzo, ecc. Inoltre, i risultati di una ricerca, possono essere visualizzati in pagine di 10?, 20?, 50? prodotti. Tutto bello, ma queste opzioni di ordinamento creano indirizzi URL con caratteri diversi (?, =, |):

http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|desc
http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|asc
http://miosito.it/categoria/prodotto.htm?sortby=relevance|desc

Il problema emerge quando l’ordinamento delle pagine viene indicizzato e persino memorizzato nella cache da Google. Immagina quante pagine possono esistere! Migliaia! E i crawler di Google passano il tempo a indicizzarli mentre possono concentrare le loro risorse sull’indicizzazione di pagine più importanti del tuo sito: categorie, prodotti, ecc.

1.2. Come trovare le pagine di ordinamento del prodotto

Aprendo una qualsiasi pagina di categoria, o in un risultato di ricerca, avrai una serie di prodotti in griglia o lista. A questo punto puoi ordinarli, e vedere i parametri aggiunti all’URL dopo l’ordinamento (ad esempio, dir, sortby). Vai su Google e cerca il sito: miodominio.com inurl: dir

Molto probabilmente vedrai questo:

Al fine di visualizzare i risultati più pertinenti, sono state omesse alcune voci molto simili alle 9 già visualizzate.
Se vuoi, puoi ripetere la ricerca includendo i risultati omessi.

Basta fare clic sul link per includere i risultati omessi, e vedrai le pagine nel tuo negozio contenenti “dir” negli URL. Non è molto bello vedere queste pagine indicizzate.

1.3. Come rimuovere il prodotto che costruisce i duplicati
1.3.1. Mediante Strumenti di Webmaster di Google

Entra in Strumenti per i webmaster di Google scegli il tuo sito ecommerce e nel menu a sinistra seleziona Scansione -> Parametri URL. Qui vedrai i parametri che Google ha trovato negli URL del tuo negozio, e in che modo li sottopone a scansione. “Lascia decidere a Googlebot” è l’opzione predefinita.

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Ma quando si tratta di eseguire la scansione del tuo negozio Magento, sei tu, ma non Google, a decidere quali pagine devono essere indicizzate, giusto? Quindi se non l’hai deciso prima, è giunto il momento di farlo! Fai clic su “modifica”, seleziona “Sì” nel menu a discesa e quindi “Nessun URL”.

Puoi anche aggiungere parametri che non sono elencati in GWT e impostare le opzioni di scansione per Google. Ma fai attenzione e controlla due volte (o anche tre volte) prima di bloccare gli URL con questi parametri.

Devi essere paziente, ci vuole molto tempo prima che Google re-indicizza gli URL con i parametri, una volta che sono stati indicizzati. Se vuoi, puoi anche rimuoverli dall’indice manualmente tramite Indice Google -> Rimozione URL.

1.3.2. REL = CANONICAL

Puoi anche scegliere di utilizzare il parametro CANONICAL per le pagine di ordinamento nel tuo negozio Magento. In questo modo saranno accessibili agli utenti ma reindirizzeranno i crawler alle pagine senza parametri.

È necessario aggiungere questo codice alle pagine di ordinamento:

dove CategoriaURL è l’indirizzo della stessa pagina di categoria senza parametri. Ad esempio, le seguenti pagine:

  • http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|desc
  • http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|asc
  • http://miosito.it/categoria/prodotto.htm?sortby=relevance|desc

dovrebbe canonicalizzare questa pagina

  • http://miosito.it/categoria/prodotto.htm

Guido Pratt

Magento Specialist

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Articoli recenti

Veeam presenta il supporto più completo per il ransomware, dalla protezione alla risposta e al ripristino

Coveware by Veeam continuerà a fornire servizi di risposta agli incidenti di cyber-estorsione. Coveware offrirà funzionalità di forensics e remediation…

23 Aprile 2024

Rivoluzione Verde e Digitale: Come la Manutenzione Predittiva sta Trasformando il Settore Oil & Gas

La manutenzione predittiva sta rivoluzionando il settore dell'oil & gas, con un approccio innovativo e proattivo alla gestione degli impianti.…

22 Aprile 2024

L’autorità antitrust del Regno Unito lancia l’allarme BigTech su GenAI

La CMA del Regno Unito ha lanciato un avvertimento circa il comportamento delle Big Tech sul mercato dell’intelligenza artificiale. La…

18 Aprile 2024

Casa Green: rivoluzione energetica per un futuro sostenibile in Italia

Il Decreto "Case Green", formulato dall'Unione Europea per potenziare l'efficienza energetica degli edifici, ha concluso il suo iter legislativo con…

18 Aprile 2024