Jul 2, 2010
Link canonical, evitando contenido duplicado
Cuando los crawlers (programas arañas o de extracción de contenido) pasa por nuestro sitio indexa el contenido de este y lo relaciona con la URL, para los motores de busqueda las urls son únicas, esto quiere decir que si dos contenidos o mas son iguales en distintas urls se toma como contenido duplicado y pierde relevancia.
Tambien existen casos donde podemos pasar ciertos parametros por get, cosa que los motores de busqueda tomarán como una URL distinta, esto es común si mandamos información de tracking o cierta información que no interfiere en el contenido.
Para evitar que nuestro contenido se tome como duplicado, hay una solución, el tag link rel=”canonical”.
Tomemos como ejemplo una página de un producto, en el que podemos llegar el buscador o el listado o por los productos relacioados, y queremos que una variable nos informe la procedencia, entonces tenemos estas 2 url:
http://pagina.com.ar/product.php?id=323&from=list
http://pagina.com.ar/product.php?id=323&from=related
Si bien la urls son diferentes, el contenido es el mismo, por lo que los bots de indexación lo tomarán como un contenido en 2 url distintas, duplicado. Si especificamos entonces (en el header):
<link rel="canonical" href="http://pagina.com.ar/product.php?id=323" />
De esa forma el motor de busqueda sabra que la verdadera ulr, y que aunque allas url distintas corresponden a la misma.
Tambien es recomendable hacer esto con los filtros de ordenamiento, por ejemplo si un listado se ordena “de mayor a menor”, es recomendable usar esta directiva ya que en ciertas partes puede tomarse como contenido duplicado, ej:
http://pagina.com.ar/listado.php?cat=12&order=mprice
Hay que tener en cuenta también que el uso de canonical todabía no es multi dominio, osea que no se puede referir a información en otro dominio, ni subdominio, eso está hasta el momento en discución por parte de Google.
No hay tips relacionados.

Ultimos comentarios