Ecommerce
Facetas ecommerce: filtrar sin crear miles de URLs basura
Filtros útiles, URLs limpias y una arquitectura ecommerce que no convierte Google en un trastero.
Las facetas ecommerce SEO sirven para que el usuario encuentre antes lo que quiere comprar, pero mal configuradas pueden convertir una tienda online en una fábrica de URLs casi infinitas: color, talla, marca, precio, ordenación, disponibilidad, rebajas, novedad, envío rápido… y, de pronto, una categoría limpia acaba multiplicada por miles de combinaciones que no tienen valor real para Google ni para el negocio.
El punto serio es este: no todos los filtros merecen una URL indexable. Una faceta útil para la navegación puede ser pésima como página orgánica. Google lleva años advirtiendo que las facetas basadas en parámetros pueden generar espacios de URL enormes, provocar exceso de rastreo y ralentizar el descubrimiento de páginas nuevas o importantes. Dicho en idioma tienda: el robot se queda mirando cajones llenos de calcetines repetidos mientras el escaparate bueno sigue sin barrer.
El filtro no es el enemigo; la URL basura sí
En ecommerce se ha instalado una confusión peligrosa: pensar que controlar facetas significa empeorar la experiencia del usuario. No. El usuario necesita filtros. De hecho, una tienda sin filtros es una especie de almacén con la luz fundida. El problema aparece cuando cada gesto del visitante se convierte en una URL rastreable, enlazada, indexable y combinable sin criterio.
Una categoría de zapatillas puede tener filtros de talla, color, marca, precio, uso, material, descuento, género, temporada y valoración. Cada faceta tiene sentido en pantalla. Nadie quiere revisar 1.200 productos a mano, como si estuviéramos en 2008 y el ecommerce fuese una tabla de Excel con botón de compra. Pero si cada combinación abre una URL distinta, Google puede encontrarse con miles de versiones parecidas: zapatillas negras, zapatillas negras talla 42, zapatillas negras talla 42 con descuento, zapatillas negras talla 42 con descuento ordenadas por precio ascendente, zapatillas negras talla 42 con descuento ordenadas por precio ascendente y envío 24 horas. Hay poesía en el caos, sí. Pero poca indexación rentable.
La navegación facetada tiene una doble naturaleza. Para el usuario es orientación. Para el rastreador puede ser ruido. Y el SEO técnico serio vive precisamente ahí, en esa frontera: permitir que la tienda sea cómoda sin dejar que el índice se llene de páginas delgadas, duplicadas o directamente absurdas.
Google recomienda minimizar URLs alternativas que devuelven el mismo contenido, evitar parámetros temporales como sesiones o valores efímeros y mantener coherencia entre enlaces internos, sitemaps y canonicals. También recuerda que los enlaces internos deberían apuntar a URLs canónicas, no a versiones contaminadas por filtros o parámetros de seguimiento.
La trampa de las combinaciones infinitas
Una faceta aislada puede tener sentido. Una combinación sin control, no tanto. Marca + categoría suele ser una candidata razonable: “zapatillas Nike”, “vestidos Zara”, “sofás Ikea”, si hablamos de patrones de búsqueda reales y páginas con suficiente surtido. Color + categoría también puede funcionar en algunos sectores: “vestidos rojos”, “azulejos blancos”, “sillas negras”. Pero cuando se añaden talla, ordenación, precio, disponibilidad, descuento y varias facetas simultáneas, la página empieza a parecerse a una habitación llena de espejos. Todo refleja algo, casi nada añade.
La cuestión no es si una URL existe, sino si merece existir para búsqueda orgánica. Una página indexable debería tener demanda, inventario suficiente, contenido diferencial, intención clara y estabilidad. Si la combinación cambia cada hora, si muestra tres productos, si depende de una promoción fugaz o si solo reorganiza la misma parrilla, lo más probable es que no tenga que competir en Google. Tiene que ayudar al usuario dentro de la tienda. Punto.
Aquí se ve una de las diferencias entre un ecommerce bien pensado y otro que simplemente instala un módulo de filtros y reza. El primero decide qué facetas forman parte de su arquitectura orgánica. El segundo deja que el CMS improvise. Y los CMS, cuando improvisan, suelen tener el gusto arquitectónico de una rotonda con siete salidas.
En WooCommerce, Prestashop, Shopify, Magento o desarrollos a medida, el patrón se repite con distintos disfraces. Parámetros con color, rutas de atributos, filtros AJAX que igualmente generan URLs, ordenaciones indexables, paginaciones mezcladas con facetas, etiquetas internas convertidas en landing pages por accidente. A veces el problema no se nota al principio. La tienda tiene pocas referencias, Google rastrea sin demasiada fricción y todo parece bajo control. Luego el catálogo crece. Llegan las variantes. Entran los filtros por disponibilidad, temporada, precio, envío, atributos personalizados. Y la web, que parecía ordenada, empieza a producir URLs basura como una impresora atascada.
Cuando una faceta merece página propia
La forma adulta de gestionar facetas ecommerce SEO consiste en separar navegación de posicionamiento. No todas las rutas del usuario son páginas SEO. Algunas son simples estados de interfaz. Otras, en cambio, sí pueden convertirse en landings orgánicas con sentido.
Una faceta merece página propia cuando responde a una búsqueda estable y reconocible. “Portátiles gaming”, “colchones viscoelásticos”, “zapatos de piel mujer”, “bicicletas eléctricas plegables”. Ahí hay intención, vocabulario de mercado y una expectativa de catálogo. El usuario no busca una combinación caprichosa; busca una familia concreta de productos. Esa página puede tener texto útil, enlazado interno, filtros secundarios, productos suficientes, datos estructurados cuando proceda y una canonical autorreferencial. Puede ser una puerta real.
Otra cosa es “portátiles gaming 16 GB RAM orden precio bajo stock inmediato 17 pulgadas oferta martes”. Eso no es una landing. Es un estado momentáneo del listado. Sirve para comprar, no para indexar.
La diferencia parece obvia hasta que se mira Search Console y aparecen miles de páginas “descubiertas”, “rastreadas actualmente sin indexar”, “alternativas con canonical adecuada” o directamente indexadas con parámetros que nadie invitó a la fiesta. Google retiró en 2022 la antigua herramienta de parámetros de URL de Search Console porque sus sistemas habían mejorado al interpretar qué parámetros eran útiles, pero la salida de esa herramienta no convirtió las facetas en un asunto mágico. Dejó más responsabilidad en la arquitectura, el enlazado, el robots.txt, las canonicals y la higiene técnica del sitio.
Canonical, noindex y robots.txt no hacen lo mismo
Aquí conviene bajar la voz y hablar claro, porque hay mucho folklore. Canonical, noindex y robots.txt no son tres nombres distintos para la misma medicina. Mezclarlos sin entenderlos produce tratamientos raros: una aspirina en el café, antibiótico para una torcedura y una tirita sobre el servidor.
La canonical sirve para indicar cuál es la versión preferida cuando existen páginas duplicadas o muy parecidas. Google la trata como una señal importante, no como una orden militar. Su documentación insiste en no usar robots.txt como método de canonicalización y en no usar noindex para forzar la elección de una canonical dentro de un mismo sitio. Para consolidar duplicados, la vía natural es rel canonical, bien implementada y coherente con enlaces internos y sitemap.
El noindex indica que una página no debe mostrarse en resultados. Pero tiene una condición que a veces se olvida: el rastreador debe poder acceder a la página para leer esa directiva. Si bloqueas una URL por robots.txt, Google no puede ver el meta robots de esa página. Es una obviedad técnica con consecuencias muy poco obvias cuando se intenta limpiar un índice hinchado.
El robots.txt sirve para impedir o limitar el rastreo de patrones de URL. En facetas masivas, Google recomienda usarlo para desautorizar el rastreo de URLs filtradas cuando no hay una razón clara para permitirlo, porque rastrear filtros sin valor consume recursos y puede desplazar la atención de URLs más útiles. También menciona los fragmentos de URL como una vía para filtros que no se quieren someter a rastreo normal, ya que Google Search generalmente no usa fragmentos para rastreo e indexación.
La secuencia importa. Si una URL de faceta ya está indexada y se quiere sacar del índice, bloquearla de golpe en robots.txt puede impedir que Google vea el noindex. Si una familia de URLs nunca debería rastrearse, bloquearla desde origen puede ahorrar visitas inútiles. Si dos URLs muestran esencialmente el mismo contenido, canonical puede consolidar señales, pero no necesariamente evita que Google rastree la versión secundaria. Cada herramienta tiene su carácter. Y, como ocurre con ciertas reuniones, conviene no invitar a todas a la vez.
El error de dejar que Google decida demasiado
Hay una frase cómoda que se escucha en muchos proyectos: “Google ya lo entiende”. A veces sí. Otras, simplemente aguanta el desastre con más paciencia que presupuesto. Un ecommerce pequeño puede sobrevivir con señales imperfectas porque su escala no le castiga. Un ecommerce grande no. Cuando hay cientos de categorías, miles de productos y decenas de atributos, una mala navegación facetada puede devorar rastreo, ensuciar informes, diluir señales internas y convertir cualquier auditoría en una excavación arqueológica.
La idea de que “más URLs es más SEO” pertenece a otra época. Más URLs solo es más SEO cuando esas URLs tienen valor diferencial. Si no, es inflación. Papel mojado. Crear miles de páginas filtradas esperando capturar long tail puede parecer tentador, sobre todo cuando alguien enseña una gráfica bonita y dice “oportunidad”. Pero Google no premia el inventario de combinaciones por sí mismo. Necesita páginas útiles, rastreables, consistentes y suficientemente distintas.
Además, la búsqueda ha cambiado. Las experiencias con IA, las respuestas enriquecidas y los sistemas de interpretación semántica empujan hacia una lectura más exigente de la estructura. Una tienda no solo compite por tener productos; compite por explicar bien sus familias, atributos, entidades, disponibilidad y relaciones. Las facetas pueden ayudar a esa comprensión si están gobernadas. Si no, se convierten en niebla.
El ecommerce moderno necesita una especie de urbanismo técnico. Calles principales, calles secundarias, zonas peatonales, accesos privados. No todo tiene que estar en el mapa turístico. Y no pasa nada.
Cómo se diseña una arquitectura de facetas que no intoxica el índice
La primera decisión es editorial, aunque parezca técnica: qué combinaciones merecen ser páginas orgánicas. Eso exige mirar demanda de búsqueda, margen de negocio, stock, estabilidad, competencia y calidad del resultado. Una categoría con diez productos no soporta veinte landings de filtro. Una con 8.000 referencias quizá sí permite familias, marcas, usos y atributos estratégicos. No por volumen bruto, sino por intención de búsqueda.
Las facetas indexables deberían tener una URL limpia o al menos persistente, una canonical autorreferencial, enlaces internos controlados y presencia en el sitemap solo cuando realmente son páginas que se quieren posicionar. También deberían ofrecer algo más que una parrilla clonada. Un texto breve pero útil, una ordenación lógica, filtros secundarios razonables, productos disponibles, breadcrumbs claros y una relación evidente con la categoría madre. No hace falta escribir una novela debajo de cada listado. Nadie compra una lavadora después de leer 1.800 palabras sobre el tambor. Pero sí conviene dar contexto cuando la página aspira a rankear.
Las facetas no indexables deberían comportarse como filtros de interfaz. Pueden existir para el usuario, pero no tienen por qué recibir enlaces HTML rastreables, ni aparecer en sitemap, ni generar canonicals contradictorias, ni abrir combinaciones infinitas. En muchos casos conviene impedir el rastreo de patrones concretos, sobre todo ordenaciones, filtros de precio, tallas, disponibilidad temporal, sesiones, parámetros de tracking y combinaciones múltiples sin demanda. Google recomienda evitar enlaces internos a parámetros temporales y usar URLs persistentes cuando realmente haya contenido que deba ser rastreado.
Hay un matiz importante: no todo filtro malo debe bloquearse igual. Una faceta de talla suele ser útil para comprar, pero rara vez para posicionar. Una faceta de marca puede ser una landing excelente. Una faceta de precio es peligrosa porque cambia, envejece mal y suele producir páginas pobres. Una ordenación por precio o popularidad casi nunca debería indexarse, porque no cambia el conjunto semántico, solo lo reordena. Una faceta de color depende del sector: en moda, decoración o cerámica puede tener sentido; en recambios industriales, quizá no.
El criterio sano es bastante terrenal: si un usuario podría buscar esa combinación en Google y quedar satisfecho aterrizando ahí, la página puede entrar en el debate. Si solo responde a una necesidad de refinamiento dentro de la tienda, que se quede dentro de la tienda.
El mapa de permisos, bloqueos y señales
Toda tienda con facetas debería tener un mapa de comportamiento. No un documento ceremonial que se guarda en una carpeta llamada “SEO técnico final definitivo v3”, sino una matriz viva que diga qué parámetros existen, qué hacen, si cambian el contenido, si son indexables, si se pueden combinar, si aparecen en enlaces, si van al sitemap, qué canonical llevan y si deben bloquearse en robots.txt.
Ese mapa evita muchas discusiones. Cuando marketing pide crear una landing para “vestidos verdes invitada boda”, se puede decidir si es una categoría editorial, una faceta indexable o una campaña temporal. Cuando desarrollo añade un nuevo filtro de “entrega mañana”, se define desde el principio que no debe indexarse. Cuando merchandising activa descuentos, se impide que el sitio genere medio millón de URLs nuevas con una alegría digna de feria patronal.
La gobernanza importa más que el plugin. Hay módulos buenos y módulos peligrosos en todas las plataformas. Pero incluso un módulo decente puede causar daños si nadie decide qué debe hacer. La tecnología ejecuta. El criterio manda.
Search Console no basta: hay que mirar logs y patrones reales
Search Console ayuda, pero no cuenta toda la película. Muestra muestras, estados, tendencias y advertencias. Sirve para detectar hinchazón del índice, URLs excluidas, páginas duplicadas, rastreo anómalo y canónicas elegidas por Google. Pero cuando las facetas se desmandan, el análisis de logs suele ser más revelador. Ahí aparece qué rastrea Googlebot de verdad, con qué frecuencia, en qué patrones, qué códigos de estado recibe y cuánto presupuesto se pierde en basura.
Un buen diagnóstico mira el porcentaje de hits de Googlebot que cae en parámetros, filtros, ordenaciones, paginaciones profundas, búsquedas internas, URLs con sesiones, versiones con mayúsculas, combinaciones repetidas y rutas que no deberían existir. También mira si las páginas importantes reciben atención suficiente: categorías estratégicas, productos rentables, novedades, URLs actualizadas, landings estacionales. Porque el problema no es solo que Google rastree lo inútil. Es que, mientras tanto, puede tardar más en descubrir o refrescar lo importante.
La arquitectura interna también deja huellas. Si los enlaces de filtros son enlaces normales hacia cada combinación, Google los puede seguir. Si el sitemap incluye URLs filtradas sin control, se está invitando al robot con alfombra roja. Si las canonicals apuntan a una URL limpia pero la navegación insiste en enlazar versiones parametrizadas, el sitio dice una cosa con la boca y otra con los pies. Y Google, que no es humano pero tampoco tonto, recibe señales mezcladas.
La paginación añade otra capa. Las páginas paginadas necesitan URLs únicas cuando muestran contenido distinto, pero no deberían mezclarse sin control con filtros que multiplican todo. Una categoría con paginación ya genera profundidad. Si cada página paginada además se combina con filtros irrelevantes, el rastreo se va por un desagüe bonito, moderno, responsive y carísimo.
La IA no arregla una arquitectura sucia
El auge de la IA en ecommerce está refinando la forma en que las tiendas entienden atributos, intención y búsqueda interna. Los filtros ya no son solo casillas rígidas; empiezan a mezclarse con búsqueda semántica, recomendaciones, asistentes conversacionales y sistemas que interpretan consultas como “zapatillas cómodas para caminar mucho en verano”. Esa evolución puede mejorar la experiencia. Pero no perdona una arquitectura SEO desordenada.
De hecho, la puede empeorar. Si cada interacción inteligente genera una URL nueva, cada reformulación de búsqueda abre una landing indexable y cada recomendación produce combinaciones rastreables, el problema se disfraza de innovación. Muy siglo XXI: una máquina brillante fabricando basura a escala.
La IA puede ayudar a detectar patrones con demanda, agrupar atributos, enriquecer categorías y decidir qué facetas tienen valor. Puede sugerir que “sofás cama pequeños” merece una página estable, mientras “sofás cama pequeños gris stock martes ordenados por descuento” no. Pero la decisión final sigue siendo arquitectónica. Y comercial. Y SEO. Todo junto, que es donde las cosas se vuelven interesantes.
Para Google, la pregunta de fondo no cambia: qué URL representa mejor una intención. Si una tienda tiene diez versiones de la misma familia de productos, con pequeñas variaciones de orden, parámetros o filtros, el buscador tendrá que elegir, ignorar, agrupar o directamente perder tiempo. Una arquitectura limpia le facilita el trabajo. Una arquitectura ruidosa le obliga a adivinar. Y dejar que Google adivine siempre ha sido una estrategia con demasiado incienso.
El escaparate que deja respirar al rastreador
Las facetas ecommerce SEO bien trabajadas no consisten en cerrar todos los filtros ni en indexarlo todo por si cae algo. Consisten en construir una tienda donde el usuario pueda refinar sin perderse y donde Google encuentre con claridad las páginas que merecen competir. Es menos vistoso que prometer “long tail infinito”, pero bastante más rentable.
Un ecommerce sano deja indexar las categorías fuertes, las subcategorías con intención, las combinaciones estables con demanda y las landings que aportan algo propio. Mantiene fuera del índice las ordenaciones, los filtros efímeros, las tallas sin valor orgánico, los precios cambiantes, las sesiones, los parámetros de seguimiento y las combinaciones que solo sirven para navegar. Usa canonical cuando toca consolidar, noindex cuando toca retirar de resultados y robots.txt cuando toca ahorrar rastreo desde la puerta. Sin misticismo. Sin superstición técnica.
La tienda perfecta no existe. Siempre habrá alguna URL rara, algún parámetro que se escapa, algún filtro que desarrollo activó un viernes por la tarde con esa valentía tan propia de los viernes por la tarde. Pero una arquitectura gobernada evita que esas pequeñas fugas se conviertan en una inundación. Y en ecommerce, donde cada categoría es un pasillo y cada producto una posible venta, el SEO no puede permitirse que Google pase media visita abriendo armarios vacíos.
-
IA y GEOComparativa de precios de plataforma IA: la factura real
-
IA y GEOCómo aparecer y medir tu presencia en ChatGPT de verdad
-
EcommercePara vender en Shopify hay que ser autónomo: respuesta legal
-
WebMejor CMS para SEO: la decisión que puede cambiar tu tráfico
-
SEODiferencia entre enlaces y señales SEO: qué influye de verdad en tu posicionamiento
-
GoogleCómo conectar TikTok Ads a Google Sheets: rápido y bien
-
SEONombre de marca personal como estrategia SEO: gana clics
-
ContenidosGeneración de contenido con IA para negocios: riesgo y valor
-
EcommerceCómo tener AliExpress conectado con Shopify sin fallos
-
IA y GEOComparación de Claude con otras IA: razonamiento y código
-
WebCómo añado los proyectos de Divi a Rank Math SEO sin fallos
-
SEO¿Cuál es elemento que tiene mayor relevancia para el SEO?