SEO
Búsqueda visual SEO: Pinterest, Lens y el clic invisible
Lens y Pinterest convierten imágenes en búsquedas, clics y compras que el SEO todavía mide a medias.
La búsqueda visual SEO ya no va de subir una imagen bonita, ponerle un alt decorativo y esperar que Google, Pinterest o cualquier asistente con ojos digitales hagan magia por cortesía. Va de preparar imágenes, páginas, datos de producto y contexto editorial para que una máquina entienda qué aparece en una foto, por qué importa, con qué intención se busca y a qué página debe conducir ese gesto mínimo: rodear un objeto en la pantalla, tocar un sofá en Pinterest, fotografiar unas zapatillas en la calle, subir una captura a Google Lens. Ahí está el cambio. La búsqueda ya no siempre empieza con una frase. A veces empieza con una textura, un color, una silueta, una mesa de madera bajo luz de tarde. Google Lens supera los 20.000 millones de búsquedas visuales mensuales, mientras Pinterest cerró 2025 con 619 millones de usuarios activos mensuales y más de 80.000 millones de búsquedas al mes en su plataforma. No es una rareza de laboratorio. Es tráfico con ropa de incógnito.
El problema para el SEO clásico es que una parte de ese viaje queda medio escondida. El usuario no escribe “lámpara de mesa estilo brutalista con pantalla beige”; ve una lámpara en una foto, toca, compara, guarda, pregunta, vuelve, quizá compra. El clic llega —cuando llega— mezclado entre Google Imágenes, Discover, resultados de producto, Pinterest, tráfico referido, sesiones directas y conversiones que parecen haber salido del aire, como humedad en una pared vieja. Ese es el clic invisible: no porque no exista, sino porque muchas veces nace antes de la keyword, fuera del cuadro de búsqueda, en una zona donde la analítica todavía mira con gafas de 2016. Search Console permite medir clics, impresiones y CTR en Search, News o Discover, y filtrar rendimiento de búsqueda por tipo, incluida imagen, pero incluso en imagen el informe muestra las páginas de destino, no necesariamente la URL exacta de la imagen buscada.
La búsqueda deja de escribirse y empieza a mirarse
Durante años, el SEO se construyó sobre una escena muy simple: alguien tiene una duda, abre Google, escribe palabras, recibe enlaces. Esa escena sigue viva, claro. No ha muerto nada; en internet rara vez mueren las cosas, simplemente se amontonan unas encima de otras como cables detrás de un escritorio. Pero la búsqueda por imagen ha añadido otra puerta. Google ha integrado Lens en experiencias como Circle to Search, ha llevado funciones de búsqueda visual a móviles y ha incorporado capacidades multimodales a AI Mode, donde el usuario puede subir o tomar una imagen y hacer preguntas sobre lo que aparece en ella. En esa experiencia, el sistema no solo detecta objetos; intenta leer la escena completa, la relación entre elementos, materiales, colores, formas y disposición.
Esto tiene una consecuencia incómoda para quien todavía reduce el SEO a “meter la keyword principal en el H1 y esperar sentado”. La máquina ya no solo empareja texto con texto. Empareja señales visuales, entidades, atributos, intención comercial, disponibilidad, contexto de página y reputación del sitio. Una imagen de un vestido rojo no compite únicamente con otras páginas que digan “vestido rojo”; compite con fotos donde el sistema reconoce corte, tejido, largo, tono, ocasión de uso, estilo de vida y, si hay datos suficientes, precio, marca, reseñas o variantes. La vieja palabra clave sigue siendo necesaria, pero ya no manda sola. Está en la mesa con otros invitados. Algunos ven mejor que ella.
En Google, esa transición se nota especialmente en ecommerce, moda, decoración, recetas, turismo, bricolaje, belleza, automoción, arte, gadgets y cualquier vertical donde el usuario no siempre sabe nombrar lo que desea. “Quiero esto, pero no sé cómo se llama” es una intención de búsqueda gigantesca. Antes terminaba en rodeos lingüísticos, búsquedas torpes y frustración. Ahora puede terminar en Lens, en Google Imágenes, en una ficha de Shopping o en Pinterest. Y ahí el SEO visual deja de ser un adorno para diseñadores y se convierte en infraestructura de captación.
Pinterest ya no juega a ser red social
Pinterest lleva tiempo intentando sacudirse la etiqueta de red social, y con razón. No se comporta como una plaza de comentarios, bronca y dopamina barata. Funciona más como un motor de descubrimiento visual con intención futura: gente que planifica una reforma, una boda, un viaje, un armario cápsula, una receta, un jardín o una compra que todavía no sabe formular. La compañía se define como una plataforma de búsqueda y descubrimiento visual, y sus últimos datos financieros encajan mejor con esa lectura que con la idea de “otro feed más”. En 2025 alcanzó esos 619 millones de usuarios activos mensuales y más de 80.000 millones de búsquedas mensuales, con la IA visual como una de sus líneas de innovación declaradas.
La diferencia es sutil, pero enorme. En una red social tradicional, el usuario suele consumir lo que aparece. En Pinterest, muchas veces busca sin tener todavía el nombre exacto. La propia plataforma ha difundido datos que apuntan a una percepción fuerte de sus resultados visuales frente a la búsqueda tradicional, con una parte relevante de usuarios empezando ahí sus búsquedas en lugar de hacerlo en buscadores clásicos. Hay que leer esos porcentajes con la prudencia debida, porque proceden de un entorno corporativo interesado, sí; pero también con una ceja levantada hacia el mercado. Cuando una plataforma de imágenes empieza a comportarse como buscador, el SEO no puede seguir tratándola como un tablón bonito para reciclar creatividades.
Pinterest ofrece una pista especialmente jugosa para marcas medianas, ecommerce nuevos y medios especializados: en sus formatos Top of Search, la compañía afirma que la mayoría de los resultados principales son no marcarios y que una parte muy relevante de los clics se concentra en los primeros resultados. Traducido a lenguaje de cierre de redacción: no todo está comprado por gigantes, no todo depende de que el usuario ya conozca la marca y no todo empieza por una query de último clic. En visual search, aparecer temprano en una categoría puede valer más que gritar el nombre de la marca cuando el usuario ya ha decidido.
El producto se reconoce antes que la marca
Hay una escena muy común: alguien ve un salón en Pinterest y no quiere “comprar un sofá” a secas. Quiere ese sofá, o algo que respire parecido. Quizá no sabe si es verde oliva, terciopelo, modular, de dos plazas, retro, parisino, mid-century o “como de apartamento caro donde nadie tiene cables a la vista”. Toca la imagen. Selecciona un objeto. Pinterest muestra productos visualmente similares y refina los resultados a medida que el usuario interactúa. Una búsqueda puede empezar como “sofá verde” y terminar en algo mucho más concreto, casi caprichoso, porque la imagen ayuda a afinar el gusto antes que el vocabulario.
Para el SEO, esto cambia la forma de pensar los assets. Una de esas fichas de producto con una única foto frontal sobre fondo blanco puede ser correcta para catálogo, pero pobre para descubrimiento. Una imagen de estilo de vida, bien iluminada, con contexto real, variantes visibles y coherencia estética, puede abrir búsquedas que no estaban escritas en ningún planificador de palabras clave. No se trata de abandonar la fotografía limpia de producto; sería una tontería. Se trata de entender que hay imágenes que sirven para identificar y otras que sirven para desear. La búsqueda visual necesita ambas. Una le dice a la máquina qué es. La otra le dice al usuario por qué podría importarle.
En moda, decoración, belleza o gastronomía, el matiz pesa como una piedra. Dos imágenes pueden mostrar el mismo producto y activar intenciones distintas: una zapatilla blanca en fondo neutro habla de inventario; la misma zapatilla en una calle húmeda, con vaqueros rectos y luz de escaparate, habla de estilo. Un robot no “siente” esa escena, pero sí puede leer patrones: colores, objetos cercanos, composición, similitud con otros contenidos guardados, interacción previa. Y el usuario, que sigue siendo humano aunque el embudo se haya llenado de siglas, reacciona a la imagen antes que a la ficha técnica.
Qué entiende una máquina cuando mira una imagen
Google lo dice de forma bastante clara en sus recomendaciones para imágenes: usa elementos HTML estándar para que los rastreadores encuentren y procesen las imágenes, puede localizar imágenes en el atributo src de un elemento img, pero no indexa imágenes cargadas como fondo CSS. También recomienda sitemaps de imagen cuando haga falta descubrir URLs que de otro modo quedarían escondidas, y recuerda la importancia de las imágenes responsive con srcset, picture y una URL de respaldo. Esto no suena sexy. Normal. La fontanería nunca lo parece hasta que revienta.
La búsqueda visual SEO empieza en esa fontanería: que la imagen exista para el crawler, que no esté bloqueada, que cargue rápido, que tenga un tamaño útil, que se declare bien, que no dependa de un carrusel torpe, que no viva sepultada en JavaScript innecesario, que el CDN no juegue al escondite con Googlebot. Después llega la semántica: nombre de archivo, texto alternativo, pie de foto, contenido cercano, título de la página, datos estructurados, enlaces internos, categoría, entidad principal y consistencia entre todo ello. Si una página habla de una mesa de comedor extensible en roble, pero la imagen se llama IMG_8421-final-ok.webp, el alt dice “mesa bonita” y el producto no tiene datos estructurados, la máquina puede entenderlo, sí. Pero la estamos obligando a hacer de detective con resaca.
Google también recuerda que el alt text es el atributo más importante para aportar metadatos descriptivos a una imagen, porque mejora la accesibilidad y ayuda al buscador a entender el tema junto con sus algoritmos de visión artificial y el contenido de la página. La parte fina está en “junto con”. El alt no trabaja solo. Un texto alternativo decente no arregla una página pobre, igual que una corbata no convierte en solvente una rueda de prensa desastrosa.
El alt no es poesía ni saco de keywords
El texto alternativo tiene una misión modesta y decisiva: describir la imagen con precisión útil. No es un poema de Instagram, ni un vertedero de keywords, ni un sitio para repetir “búsqueda visual SEO” como quien golpea una máquina expendedora. En una imagen de producto, un buen alt puede indicar marca, tipo de producto, color, material y uso visible si procede. En una imagen editorial, puede explicar la escena sin inventar. En una receta, puede nombrar el plato y algún rasgo visual relevante. En turismo, puede situar el lugar y el elemento principal. Corto, claro, humano. “Silla de comedor tapizada en bouclé blanco junto a mesa de roble” es mejor que “silla SEO decoración tendencia casa hogar comprar silla moderna barata”. Esto último no optimiza; delata.
La página que rodea la imagen debe oler al mismo tema. Un pie de foto sobrio, un H2 coherente, una descripción de producto completa, una ficha técnica limpia y datos de disponibilidad ayudan más que cien trucos de naming. En ecommerce, el marcado Product y Offer ya no es un lujo de tiendas grandes: los datos estructurados de producto pueden hacer que la información aparezca de forma más rica en resultados, incluidos Google Imágenes y Google Lens, con precio, disponibilidad, valoraciones, envío u otros detalles visibles en experiencias de búsqueda. Para páginas transaccionales, además, combinar datos estructurados y feed de Merchant Center amplía la elegibilidad y ayuda a verificar la información.
Aquí aparece una distinción práctica. Un medio puede trabajar la búsqueda visual desde imágenes originales, contexto editorial y marcado de artículo. Un ecommerce necesita, además, consistencia brutal entre ficha, feed, variantes, identificadores, imágenes principales, imágenes secundarias y disponibilidad. Una marca de decoración o moda debería cuidar también Pinterest como escaparate de intención temprana, no como basurero de creatividades cuadradas. Y una web B2B, aunque crea estar lejos de todo esto, haría bien en mirar sus diagramas, capturas, infografías y fotos de producto. La búsqueda visual también encuentra máquinas, herramientas, componentes, pantallas, planos, gráficos. No todo son vestidos vaporosos y sofás verdes.
El clic invisible se mide con instrumentos imperfectos
El mayor error es esperar que la búsqueda visual aparezca en analítica con una etiqueta fluorescente: “Hola, soy un clic de Lens nacido de una captura de pantalla a las 18:42”. La realidad es más aburrida. En Google Search Console, una parte puede verse en Search Results con tipo Imagen, otra en Discover si el sitio alcanza volumen suficiente, otra en resultados enriquecidos de producto, otra en tráfico orgánico normal. Pinterest se mirará desde Pinterest Analytics, desde referencias, desde UTMs cuando se hayan usado con cabeza y desde conversiones asistidas. GA4 puede ayudar, pero no hará milagros si la arquitectura de medición está montada con cinta aislante.
El clic invisible tampoco siempre acaba en clic. A veces la búsqueda visual resuelve dentro de la propia superficie: el usuario identifica un objeto, compara precios, guarda un pin, mira una valoración, pregunta otra cosa, vuelve mañana desde otro dispositivo. Ese comportamiento erosiona la obsesión por el último clic. No la elimina, porque los negocios pagan nóminas con ingresos, no con “awareness” envuelto en humo. Pero obliga a observar señales intermedias: impresiones de imagen, CTR en resultados visuales, guardados en Pinterest, clics salientes, rendimiento de páginas con imágenes grandes, mejora de fichas con datos estructurados, crecimiento de consultas long tail con atributos visuales, conversiones asistidas desde tráfico referido y aumento de sesiones móviles en URLs muy visuales.
Medir bien implica separar superficies, no mezclarlo todo en una sopa gris. Una página que sube en Google Imágenes pero no en web search puede estar ganando demanda visual. Una ficha de producto con más impresiones y bajo CTR quizá necesita una imagen menos genérica. Un pin que se guarda mucho pero no convierte puede estar captando inspiración temprana, no compra inmediata. Una caída en Google Discover puede estar relacionada con calidad visual, actualidad, interés del usuario o cambios de sistemas, no solo con el texto. Search Console muestra informes por Search, Discover y News, pero también hay que entender cómo se atribuyen los clics, qué propiedad se consulta y qué superficie está alimentando el dato. La lectura fina importa. Mucho.
Y luego está el sesgo del escritorio. Muchos análisis SEO se siguen haciendo desde pantallas grandes, con búsquedas escritas, extensiones instaladas y una calma que el usuario real no tiene. La búsqueda visual ocurre en móvil, entre interrupciones, con una mano, dentro de una app, en una tienda, en el sofá, viendo un vídeo, haciendo una captura. Es un gesto más parecido a señalar con el dedo que a redactar una consulta. Ese detalle cambia la intención. El usuario no pregunta “mejores lámparas de techo 2026 comparativa”; rodea una lámpara concreta y espera que el sistema entienda. Si la web no ha preparado su universo visual, otro ocupará esa respuesta.
WordPress, ecommerce y medios: donde se gana o se pierde
En WordPress, la búsqueda visual suele perderse por pequeños pecados acumulados. Imágenes destacadas demasiado pequeñas, og:image pobre, miniaturas recortadas sin sentido, nombres de archivo heredados de cámara, alt vacío o inflado, plugins de optimización que sustituyen URLs de forma confusa, lazy loading aplicado sin criterio a la imagen principal, temas que colocan héroes como fondos CSS, galerías que no exponen bien las imágenes, ausencia de schema o datos contradictorios. Nada espectacular. Solo una suma de “ya lo arreglaremos” que termina costando visibilidad.
Para Discover, Google recomienda imágenes relevantes, de alta calidad, especialmente grandes, con al menos 1.200 píxeles de ancho, alta resolución y formato preferente 16:9, además de permitir vistas previas grandes mediante max-image-preview:large o AMP. También desaconseja usar el logo como imagen principal o recurrir a títulos e imágenes engañosas para inflar el clic. Esto no es un capricho estético: en superficies visuales, una imagen mediocre reduce la oportunidad antes de que el titular pueda defenderse.
En un blog de marketing, tecnología o SEO, el reto es distinto al de una tienda de moda. No basta con poner la típica foto de portátil con gráficos azules y una mano flotando sobre hologramas, ese género visual que debería pagar impuesto. La búsqueda visual puede beneficiarse de capturas reales, diagramas claros, ejemplos de SERP, interfaces anotadas, comparativas visuales, ilustraciones originales e infografías propias. Pero deben ser legibles, indexables, con contexto. Una infografía subida como imagen única con todo el texto dentro puede ser atractiva para redes y pésima para SEO si la página no explica lo que contiene. La máquina quizá vea formas, pero el contenido semántico profundo debe estar también en HTML.
En ecommerce, el trabajo pide más disciplina. La imagen principal debe identificar el producto sin ambigüedad, pero las secundarias deberían cubrir uso real, escala, detalles, materiales, variantes y contexto. El feed de Merchant Center, el schema de producto, los datos de precio y disponibilidad, las reseñas, los identificadores y las imágenes deben contar la misma historia. Si el producto cambia de color, talla o acabado, esa variante necesita señales propias. Si la página promete “lino natural” y la imagen parece poliéster barato bajo luz de quirófano, el usuario lo nota. Y quizá la máquina también, a su manera seca y estadística.
Pinterest añade una capa editorial. No pide solo producto; premia inspiración, estilo, intención. Sus propias recomendaciones para búsqueda visual insisten en catálogos actualizados, información de calidad como marca, color, precio o tamaño, imágenes de estilo de vida y creatividades que permitan a sus sistemas comprender contextos y estéticas similares. La palabra “estética”, tan manoseada, aquí tiene valor técnico: agrupa señales visuales que ayudan a conectar deseo con inventario.
Cuando una imagen empieza a trabajar antes que el texto
La búsqueda visual SEO no sustituye al SEO tradicional. Lo ensancha. Añade una capa donde la fotografía, el diseño, la arquitectura técnica, los datos estructurados y la intención de búsqueda se mezclan como piezas de un escaparate que también es base de datos. Quien lo reduzca a “poner buenos alt” se quedará corto. Quien lo venda como una revolución mágica, también. La realidad está en medio, menos brillante y más rentable: imágenes rastreables, relevantes, grandes cuando toca, rápidas, originales, bien descritas, rodeadas de contenido útil y conectadas a datos fiables.
Pinterest y Lens han puesto sobre la mesa algo que el SEO llevaba años esquivando por comodidad: muchos usuarios no buscan como escriben los informes de keywords. Buscan con los ojos, con dudas vagas, con capturas torpes, con deseos que todavía no tienen nombre. El clic invisible nace ahí, en ese segundo anterior al lenguaje. Para ganarlo no hace falta adivinar el futuro; basta con dejar de tratar las imágenes como decoración. En 2026, una foto ya no acompaña al contenido. A veces lo encuentra, lo clasifica, lo vende y lo recuerda antes de que el texto haya abierto la boca.
-
IA y GEOComparativa de precios de plataforma IA: la factura real
-
EcommercePara vender en Shopify hay que ser autónomo: respuesta legal
-
IA y GEOCómo aparecer y medir tu presencia en ChatGPT de verdad
-
WebMejor CMS para SEO: la decisión que puede cambiar tu tráfico
-
GoogleCómo conectar TikTok Ads a Google Sheets: rápido y bien
-
SEODiferencia entre enlaces y señales SEO: qué influye de verdad en tu posicionamiento
-
SEONombre de marca personal como estrategia SEO: gana clics
-
ContenidosGeneración de contenido con IA para negocios: riesgo y valor
-
EcommerceCómo tener AliExpress conectado con Shopify sin fallos
-
IA y GEOComparación de Claude con otras IA: razonamiento y código
-
WebCómo añado los proyectos de Divi a Rank Math SEO sin fallos
-
SEO¿Cuál es elemento que tiene mayor relevancia para el SEO?