Canonicalización y contenido duplicado: decisiones técnicas en SEO

Capítulo 6

Tiempo estimado de lectura: 9 minutos

+ Ejercicio

Qué es la canonicalización y qué problema resuelve

La canonicalización es el conjunto de decisiones técnicas para indicar cuál es la URL “principal” (canónica) cuando existen varias URLs que muestran el mismo contenido o contenido muy similar. El objetivo es consolidar señales (enlaces, relevancia, métricas) en una sola URL y reducir el desperdicio de rastreo.

La señal más conocida es rel="canonical", un enlace en el <head> que sugiere a los motores de búsqueda cuál URL debe considerarse la versión preferida. Es una sugerencia fuerte, pero no una garantía: si el resto de señales contradicen el canonical, el buscador puede ignorarlo.

rel=canonical: propósito, funcionamiento y requisitos

Qué hace exactamente

  • Consolida señales de URLs duplicadas o casi duplicadas hacia una URL preferida.
  • Ayuda a evitar que múltiples variantes compitan entre sí en resultados.
  • Reduce la probabilidad de indexación de variantes “ruidosas” (parámetros, filtros, tracking).

Requisitos prácticos para que funcione bien

  • Debe apuntar a una URL accesible (200 OK) y estable.
  • Debe ser consistente: la misma variante debe canonicalizar siempre a la misma canónica.
  • Preferiblemente usar URL absoluta: https://example.com/ruta.
  • Autocanonical en la URL canónica (la canónica se apunta a sí misma) para evitar ambigüedades.
  • Evitar cadenas o bucles (A canonical a B, B canonical a A).
<link rel="canonical" href="https://example.com/producto/123">

Cuándo usar rel=canonical (casos típicos)

Variantes por parámetros de tracking (UTM y similares)

Si ?utm_source=, ?gclid= u otros parámetros no cambian el contenido, canonicaliza a la versión limpia.

  • https://example.com/categoria/zapatos?utm_source=newsletter → canonical a https://example.com/categoria/zapatos

Filtros y facetas que no aportan intención de búsqueda propia

En e-commerce, facetas como color, talla, ordenación o “solo en stock” suelen crear muchas combinaciones. Si no se pretende que indexen, se suele canonicalizar a la categoría base (o a una faceta principal definida).

  • /camisas?color=azul&talla=m → canonical a /camisas
  • /camisas?sort=price_asc → canonical a /camisas

Matiz: si ciertas facetas sí tienen demanda y se quieren posicionar (p. ej., “camisas azules”), entonces no deben canonicalizarse a la base; deben tratarse como páginas con intención distinta (ver sección “cuándo no”).

Continúa en nuestra aplicación.
  • Escuche el audio con la pantalla apagada.
  • Obtenga un certificado al finalizar.
  • ¡Más de 5000 cursos para que explores!
O continúa leyendo más abajo...
Download App

Descargar la aplicación

Variantes por paginación (con cuidado)

La paginación es un caso delicado. Canonicalizar todas las páginas paginadas a la primera puede provocar que se ignoren páginas profundas y que productos/artículos solo accesibles desde páginas 2+ pierdan descubrimiento o señales.

  • Si cada página paginada muestra un conjunto distinto de ítems, normalmente cada página debería tener su propia canónica (autocanonical) y una arquitectura de enlaces internos coherente.
  • Si existe una vista “Ver todo” (una sola URL con todo el listado) que es realmente equivalente y accesible, puede ser candidata a canónica, pero hay que validar rendimiento, rastreo y experiencia.

Contenido duplicado por impresión, vistas alternativas o plantillas

Ejemplos: versión “print”, parámetros de vista, o rutas alternativas que renderizan el mismo contenido.

  • /articulo/seo?view=print → canonical a /articulo/seo

Cuándo NO usar rel=canonical

Páginas con intención distinta

No canonicalices cuando la variante responde a una intención de búsqueda diferente o cuando el contenido cambia de forma sustancial.

  • Facetas con demanda real: /camisas?color=azul puede ser una landing válida si se optimiza como tal.
  • Versiones por país/idioma: no se resuelve con canonical; se gestiona con señales de internacionalización (y URLs distintas).
  • Contenido editorial similar pero no idéntico: dos guías parecidas pero con enfoque distinto no deben canonicalizarse entre sí.

Para “desindexar” contenido

rel=canonical no es un mecanismo de eliminación garantizada. Si necesitas impedir indexación, se usan señales de control de indexación (p. ej., meta robots), pero debes evitar combinaciones contradictorias (ver sección de interacción).

Relación entre canonical, 301, enlazado interno, sitemaps y meta robots

Canonical vs redirección 301

Usa 301 cuando la variante no debe existir como URL accesible para usuarios o cuando quieres unificar definitivamente una versión (p. ej., http→https, www→no-www, trailing slash). Usa canonical cuando necesitas que la variante siga siendo accesible (por ejemplo, parámetros de tracking que llegan desde campañas) pero quieres consolidar señales.

SituaciónPreferibleMotivo
http → https301Unificación técnica y de seguridad; evita duplicado estructural
www ↔ no-www301Una sola versión del host
Parámetros UTMCanonical (y opcionalmente limpieza)La URL con parámetros puede seguir llegando desde campañas
Trailing slash inconsistente301Normalización de ruta
Facetas no indexablesCanonical + control de rastreo/enlacesReducir duplicado y combinaciones

Canonical y enlazado interno

El enlazado interno debe apuntar preferentemente a la URL canónica. Si tu navegación enlaza masivamente a variantes (con parámetros, mayúsculas, sin slash), estás enviando señales contradictorias y multiplicando URLs rastreables.

  • Regla práctica: “si es canónica, es la que enlazo”.
  • Evita generar enlaces con parámetros de tracking en enlaces internos.

Canonical y sitemaps

En el sitemap deben aparecer las URLs canónicas, no las variantes. Incluir variantes en el sitemap suele aumentar la confusión y el rastreo innecesario.

Canonical y meta robots

Evita configuraciones contradictorias. Si una página tiene noindex y además canonicaliza a otra, el buscador puede decidir no transferir señales como esperas o ignorar una de las señales. Como norma operativa:

  • Si quieres consolidar señales: deja indexable la variante y usa canonical (o redirección).
  • Si quieres que no se indexe y no te importa consolidar: usa noindex y reduce su descubrimiento (enlaces internos), pero no dependas de canonical para “limpiar”.

Escenarios típicos de contenido duplicado (y cómo se manifiestan)

HTTP vs HTTPS

Dos versiones del mismo sitio accesibles por http:// y https:// crean duplicado masivo a nivel de dominio.

WWW vs no-WWW

https://www.example.com y https://example.com deben resolverse a una sola versión.

Trailing slash

/categoria vs /categoria/. Si ambas devuelven 200, son duplicados. Define una convención y aplícala.

Mayúsculas/minúsculas

/Producto vs /producto. En muchos servidores son rutas distintas. En SEO, suelen ser duplicados o cuasi duplicados. Normaliza a minúsculas.

Parámetros UTM y otros de tracking

Generan infinitas combinaciones que no cambian el contenido. Deben consolidarse.

Facetas y filtros

Combinaciones de filtros (color, talla, marca, precio, ordenación) pueden explotar el número de URLs. Requieren estrategia: qué facetas indexan, cuáles canonicalizan, cuáles se bloquean o se desincentivan desde enlaces internos.

Proceso práctico de resolución (paso a paso)

Paso 1: Define la URL “normalizada” (la regla de oro)

Antes de tocar canonicals, define una convención única:

  • Protocolo: siempre https
  • Host: con o sin www (elige uno)
  • Trailing slash: sí o no (elige uno por tipo de URL)
  • Minúsculas en rutas
  • Parámetros: lista permitida (p. ej., page) y lista a eliminar (p. ej., utm_*)

Documenta estas reglas para que backend, frontend, CDN/edge y analítica las respeten.

Paso 2: Implementa redirecciones en el borde (edge) para duplicados estructurales

Resuelve con 301 lo que sea “misma página, distinta forma” y no deba existir:

  • http → https
  • www ↔ no-www
  • Mayúsculas → minúsculas (si tu stack lo permite de forma segura)
  • Trailing slash según convención

Ejemplo conceptual (pseudo-reglas):

# 1) Forzar HTTPS y host canónico (edge/CDN o servidor)  http://example.com/*  -> 301 https://example.com/*  https://www.example.com/* -> 301 https://example.com/*  # 2) Normalizar trailing slash (según convención)  /categoria/ -> 301 /categoria  (o al revés)

Paso 3: Decide estrategia para parámetros (limpieza vs canonical)

Para parámetros de tracking, lo habitual es:

  • Conservarlos para analítica en la primera carga (si es necesario), pero evitar que se propaguen en enlaces internos.
  • Canonical a la URL sin parámetros.

Para parámetros funcionales (p. ej., ?page=2):

  • Si cambia el conjunto de ítems, usa autocanonical en cada página.
  • No canonicalices todo a la primera por defecto.

Paso 4: Canonicals consistentes en plantillas

Implementa el canonical desde el generador de URLs del framework, no “a mano”. Reglas:

  • Siempre generar canonical con la URL normalizada.
  • En páginas canónicas: autocanonical.
  • En variantes: canonical a la canónica correcta (sin UTM, sin ordenación, etc.).
// Ejemplo conceptual (Node/SSR) const canonical = normalizeUrl(request.url, { forceHttps: true, host: 'example.com', stripParams: ['utm_source','utm_medium','utm_campaign','gclid'], lowercasePath: true, trailingSlash: 'remove' }); renderHead({ canonical });

Paso 5: Limpieza de enlaces internos (la fuente más común de duplicados)

Audita y corrige:

  • Menús, breadcrumbs, listados, paginación: deben enlazar a URLs normalizadas.
  • Evita añadir UTM en enlaces internos.
  • Evita enlazar a rutas con mayúsculas o con slash inconsistente.
  • En facetas no indexables, considera usar enlaces que no generen nuevas URLs rastreables (o limita su exposición), y asegúrate de que la canónica sea la base.

Paso 6: Alinea sitemap y señales de descubrimiento

Incluye solo canónicas en el sitemap y asegúrate de que el enlazado interno principal también apunte a ellas. Si el sitemap lista una URL pero el canonical apunta a otra, estás creando una señal mixta.

Paso 7: Verificación con checklist técnico

  • La URL canónica devuelve 200 y no redirige (idealmente).
  • Las variantes redirigen (si aplica) o canonicalizan correctamente.
  • No hay canonicals a URLs con parámetros de tracking.
  • No hay canonicals a URLs bloqueadas o inaccesibles.
  • El enlazado interno coincide con la versión canónica.
  • El sitemap contiene solo URLs canónicas.

Escenarios de implementación: patrones recomendados

Patrón A: Duplicado estructural (resolver con 301 + autocanonical)

Ejemplo: http://www.example.com/Producto

  • 301 a https://example.com/producto
  • En https://example.com/producto: autocanonical a sí misma

Patrón B: Tracking (canonical a limpia, sin redirigir necesariamente)

Ejemplo: /categoria/zapatos?utm_source=ads

  • 200 OK (si necesitas conservar parámetros para medición)
  • Canonical a /categoria/zapatos
  • Enlaces internos apuntan a /categoria/zapatos sin UTM

Patrón C: Facetas (decidir indexables vs no indexables)

Divide facetas en dos grupos:

  • Indexables: tienen intención propia y contenido suficiente (texto, selección estable, enlaces internos). Autocanonical.
  • No indexables: canonical a la categoría base (o a una faceta principal), y limitar su proliferación desde enlaces internos.

Ahora responde el ejercicio sobre el contenido:

En un e-commerce, si una URL de categoría incluye parámetros de tracking que no cambian el contenido (por ejemplo, UTM) y esa variante debe seguir siendo accesible, ¿cuál es la decisión técnica más adecuada para consolidar señales SEO?

¡Tienes razón! Felicitaciones, ahora pasa a la página siguiente.

¡Tú error! Inténtalo de nuevo.

Cuando los parámetros de tracking no cambian el contenido pero la variante debe seguir accesible, se recomienda rel=canonical a la URL limpia y evitar que esos parámetros se generen en el enlazado interno, consolidando señales sin forzar redirección.

Siguiente capítulo

Estructura de URLs y arquitectura de información para SEO técnico

Arrow Right Icon
Portada de libro electrónico gratuitaSEO técnico esencial para desarrolladores web
40%

SEO técnico esencial para desarrolladores web

Nuevo curso

15 páginas

Descarga la aplicación para obtener una certificación gratuita y escuchar cursos en segundo plano, incluso con la pantalla apagada.