¿Está mi página penalizada por contenido duplicado?

  • Sharebar

Una de las preocupaciones más habituales de los Webmasters que empiezan con SEO es  la penalización por contenido duplicado.

Aunque Google declara que no existe tal penalización (a no ser que estemos copiando contenido de otro autor) si qués es cierto que es malo para el SEO tener el contenido repartido por varias URL’s distintas.

¿Qué queremos decir por contenido duplicado?

Si tienes dos versiones de tu dominio: www.dominio.com y dominio.com pero Google no sabe que son la misma página, es muy posible que considere que son dos sitios distintos con el mismo contenido. Es lo que se conoce como el www/non-www issue.

Imagina que tenemos todas estas URL’s para una home:

  • www.top-rankin.com
  • top-rankin.com

Los “humanos” no vemos diferencia entre estas URL’s y asumimos que van a tener el mismo c0ntenido, pero para los motores de búsqueda cada una de estas URL’s podría tener un contenido distinto.

Más allá del mito de las penalizaciones, si no le indicamos al buscador que ambas URL’s son versiones de la misma página nos repatirá su influencia entre cuatro. Por no hablar del desastre que es para el Page Rank que nuestros inbound links se repartan entre las 2 versiones de la home.

Cómo saber si tengo contenido duplicado Indexado

Para saber si estamos sufriendo el “www/non-www issue“, aquí teneis un truco muy sencillo:

  1. Entra en Google y busca las pagina indexadas por “tudominio.com”. Esto se hace buscando en Google: “site:tudominio.com” como saber si tenemos contenido duplicado indexado
  2. Como resultado veremos todas las paginas que están en el índice de Google, tanto con las wwww  como sin ellas. Apuntamos el número de páginas, en el caso de Top-rankin: 103.
  3. Ahora buscamos las páginas indexadas por “site:www.dominio.com” y volvemos a apuntar el número de paginas indexadas ¿Es el mismo?como saber si tenemos contenido duplicado indexado
  4. Deberemos ver el mismo número de páginas indexadas que en la búsqueda anterior (en esta caso tenemos sólo 77). Si vemos un número inferior, es porque Google tiene páginas dobladas en su ínidice y en la version no-www está mostrando el contenido duplicado.

Como ves en top-tankin tenemos contenido duplicado (en casa de herrero cuchillo de palo). Ahora que sabemos que tenemos un problema, vamos a solucionarlo.

Como solucionar el contenido duplicado indexado

La mejor solución es modificar el .htaccess o el virtual host (si usas apache) para crear una redirección 301 (si, la famosa redirección permanente) para las peticiones que te entren por el dominio sin www.

También puedes usar el nuevo elemento / tag  Canonical en el que indicas la version “original” de una URL.

Pero si no eres técnico, crees que HTML es el acronimo de “hoy tenemos mucho lio” o simplemente no quieres empezar un tedioso proceso con sistemas de tu empresa o hosting, hay una manera aún más sencilla de resolver el www/non-www issue: Usar Google webmaster tools.

Solucion con Google Webmaster Tools (GWT)

Al configurar tu sitio en Web Master Tools puedes escoger el “dominio preferido” bajo Site Configuration > Settings

prefered domain google webmaster tools

Para poder dar este paso tendrás que “verificar” las dos versiones de la página bajo la misma cuenta de WMT con permisos de administrador: la version dominio.com y www.dominio.com (si, tendrás que validar el site 2 veces).

Otra práctica recomendable es mantener el Sitemap.xml de tu site con las URL’s canonicals (es decir, las originales).

Normalmente no será necesario que hagas nada más. Puedes sentarte a esperar que el Spider de Google Caffeine pase por tu site y actualice el índice.

Para terminar, si crees que tu sitio estaba penalizado (por algo grave) y quieres asegurarte de que te eliminen cualquier  rastro de castigo, puedes escribirles desde la opcion “reconsiderar mi estado” explicandoles el problema y la solución implementada. Tendrás una respuesta en un plazo de 2 a 4 semanas. Pero recuerda que para el caso de contenido duplicado “estandar” como es el www/non-www no es necesario.

reconsideracion de google en webmaster tools

Ya tengas un blog personal, una pequeña página de empresa o un site con un CMS caro, espero que este truco te sirva de ayuda.

, ,

7 Responses to ¿Está mi página penalizada por contenido duplicado?

  1. annageli 1 septiembre, 2010 at 9:19 #

    Post muy útil, de verdad! Como el blog.

    No estoy muy penalizada pero luego lo rectifico!

  2. Xavier Colomés 1 septiembre, 2010 at 9:35 #

    Muchas Gracias! ;)

  3. enric 1 septiembre, 2010 at 9:55 #

    Otro aplauso.

    ¡A tope!

    Gràcies pels teus consells.

Trackbacks/Pingbacks

  1. Search queries en Google Webmaster Tools | Top-Rankin - 10 octubre, 2010

    [...] más arriba. ¿Es un problema de Page Rank? ¿Está la Palabra clave al principio del título? ¿Está penalizada por contenido duplicado? Ya es cosa vuestra optimizar como buenamente podais, pero siempre se puede [...]

  2. Qué es Blekko y cómo funcionan los slashtags | Top-Rankin - 9 noviembre, 2010

    [...] algoritmo, muchísimos datos se pueden aplicar a Google, como por ejemplo la información sobre el contenido duplicado que es verdaderamente fantástica. Si nuestro sitio tiene contenido duplicado en Blekko, ya te [...]

  3. De Google, Nietzsche y Javier Casares: "Dios ha muerto" | Top-Rankin - 14 febrero, 2011

    [...] a evitar el engaño y la manipulación que en centrarse en generar un mejor y más justo algoritmo. Penalizaciones, canonicals, algoritmos para reconocer comentarios negativos…  Hasta hoy siempre ha salido victorioso, y [...]

  4. Google se mueve: Larry Page, Panda Update y +1 | Top-Rankin - 18 abril, 2011

    [...] lo que debería. Los chicos de Google se van a hinchar a recibir peticiones de reconsideración de penalizaciones en Webmaster [...]

Deja un comentario