Nell’ambito SEO si sente spesso parlare del problema dei contenuti duplicati, mettendolo in relazione di causa-effetto con le cosiddette penalizzazioni assegnate da Google. Ma esistono veramente queste penalizzazioni? Sì, ma spesso questo accostamento viene utilizzato come capro espiatorio di altre cause di mancato posizionamento.

Definiamo prima di tutto in modo semplice il concetto di contenuto duplicato: si ha contenuto duplicato quando all’interno di uno stesso dominio (o anche tra domini diversi), gran parte dei testi combaciano sostanzialmente tra loro, ad esempio perché semplicemente si è copiato il testo di una pagina in un’altra.

Google, nel visualizzare i risultati, attua un processo di diversificazione. Per una determinata chiave di ricerca preleva e visualizza pagine con contenuti il più possibile diversi, evitando di pubblicare tra i primi risultati pagine con i medesimi contenuti, pur se appartenenti a domini diversi. In questi casi sceglierà di mostrare solo una delle pagine duplicate, “penalizzando” l’altra (o le altre).

Nel valutare gli effetti di una eventuale penalizzazione però bisogna distinguere le cause che hanno portato ai contenuti duplicati. La linea di demarcazione consiste nella volontà o meno di ingannare il motore di ricerca (e gli utenti di conseguenza).

Se pubblico un sito copiando di sana pianta i contenuti da un altro sito (il solito caso di copia/incolla di definizioni prese da Wikipedia, ad esempio) Google sceglierà i contenuti che ritiene originali, a danno di quelli copiati. Il motore di ricerca individua l’url originaria in cui il contenuto è comparso prima; di conseguenza il webmaster “furbetto” non avrà scampo e il suo sito sarà penalizzato (fino al caso estremo di rimozione dai risultati di ricerca).

Ma se contenuti duplicati vengono generati per motivi diversi, con scopi differenti dall’inganno? Può accadere che, all’interno dello stesso dominio, sia necessario pubblicare due volte lo stesso contenuto in due pagine diverse. Ci si troverebbe di fronte al problema della convivenza di due pagine pressoché uguali sul web. Pur non negando il rischio che il motore di ricerca possa penalizzare una delle pagine duplicate (Google sceglierà comunque di pubblicare solo una delle pagine, e non necessariamente corrisponderà alla scelta del webmaster), il problema non assume gran rilevanza perché in questo caso basterebbe indicare nella sitemap quale tra gli url sia il preferito (ovviamente l’altra pagina non sarà indicizzata).

Oppure può accadere che, in caso di ristrutturazione del sito (o di alcune pagine di esso), si ritenga valido il testo della versione vecchia e quindi si preferisca ricopiarlo nella nuova versione. Ci si troverebbe di fronte al caso di una duplicazione dei contenuti almeno per il periodo in cui Google, nonostante la pubblicazione del nuovo sito, indicizza ancora anche le vecchie pagine. Si può agire inserendo il redirect 301, che reindirizza gli spider alla nuova pagina, o intervenire contrassegnando gli url duplicati con il link rel=”canonical”.

Il problema della penalizzazione deve quindi essere preso seriamente in considerazione dal webmaster, allo scopo di porre in essere le necessarie azioni preventive atte a evitare il presentarsi del problema, o le necessarie azioni correttive se si presenta il problema. Resta comunque una questione rilevante alla quale però non bisogna assegnare il compito di giustificare eventuali mancanze nel processo di posizionamento del sito