IA y GEO
OAI-SearchBot: el bot que decide si ChatGPT te encuentra
El bot de OpenAI que separa estar disponible para ChatGPT Search de quedar fuera de su radar.
OAI-SearchBot es el rastreador de OpenAI que permite que una web pueda ser descubierta, leída y mostrada dentro de las funciones de búsqueda de ChatGPT. En cristiano: si un sitio lo bloquea en robots.txt, en el firewall o en la CDN, puede seguir existiendo perfectamente para Google, Bing y el resto del barrio, pero quedar fuera de los resúmenes, fragmentos y respuestas de ChatGPT Search. No es magia. Es una puerta. Y muchas webs la tienen cerrada sin saberlo.
La parte delicada es que OAI-SearchBot no es GPTBot. OpenAI distingue entre el bot de búsqueda, usado para mostrar sitios en resultados de ChatGPT, y GPTBot, asociado al rastreo de contenido que podría usarse para mejorar o entrenar modelos generativos. Esa diferencia técnica parece pequeña, casi de notario con gafas, pero para SEO, GEO y marketing digital es una frontera bastante seria: se puede permitir OAI-SearchBot para aparecer en búsqueda y bloquear GPTBot para no participar en entrenamiento. Dos reglas distintas. Dos decisiones distintas. Y conviene no mezclarlas como quien junta cables en una regleta vieja.
El rastreador que separa aparecer de no aparecer
Durante años, el SEO técnico vivió cómodo con un mapa relativamente conocido: Googlebot rastrea, Google indexa, Search Console se enfada, el consultor mira logs y alguien culpa al plugin de caché. Fin del ritual. La entrada de ChatGPT Search cambia el decorado. Ya no basta con preguntarse si una página está indexada en Google; hay que saber si está accesible para sistemas que no funcionan como un buscador clásico, aunque se alimenten, en parte, de mecanismos parecidos.
OpenAI ha presentado OAI-SearchBot como el rastreador vinculado a la búsqueda de ChatGPT, y eso lo coloca en una zona nueva para los editores, los ecommerce, los SaaS y cualquier web que dependa de ser encontrada. Para que el contenido pueda aparecer en respuestas, resúmenes o snippets dentro de la experiencia de búsqueda conversacional, el sitio no debe bloquearlo. Parece obvio. No lo es tanto cuando se baja al barro de los archivos técnicos, las reglas de seguridad y las decisiones tomadas deprisa durante la fiebre contra los bots de IA.
El matiz no es menor: permitir OAI-SearchBot no garantiza ranking. Abrirle la puerta no compra presencia privilegiada, ni citas automáticas, ni una alfombra roja en ChatGPT. Solo evita una invisibilidad absurda. Es como abrir la persiana del local. Luego ya veremos si entra alguien, si mira el escaparate o si se va a la tienda de al lado porque tu contenido útil era menos útil de lo que decía el calendario editorial.
Aquí empieza la parte menos vistosa y más importante. Un sitio puede tener contenido magnífico, autoridad temática, datos estructurados impecables, enlaces internos bien cosidos y una arquitectura que huele a pan recién hecho. Pero si OAI-SearchBot no puede entrar, ChatGPT tendrá muchas menos opciones de entenderlo, citarlo o mostrarlo dentro de su experiencia de búsqueda. Y en 2026 eso ya no es una rareza futurista, sino una pieza más del ecosistema de descubrimiento.
La búsqueda conversacional no sustituye al SEO tradicional. De momento. Pero lo empuja hacia una capa nueva, más incómoda, donde la visibilidad ya no depende solo de estar en una SERP, sino de poder ser recuperado por sistemas que responden, resumen, comparan y filtran antes de que el usuario visite nada. El clic llega más tarde, si llega. La fuente tiene que ganarse primero el derecho a ser considerada.
No es GPTBot, y esta vez el matiz importa
La confusión viene de lejos. Durante la primera gran ola de rechazo a los rastreadores de IA, muchas empresas metieron todos los bots en el mismo saco: GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot, cualquier cosa que sonara a robot con hambre. Era comprensible. La web venía de años de scraping agresivo, contenidos reutilizados sin permiso, datasets opacos y una sensación bastante razonable de “mi trabajo lo están usando para fabricar una máquina que luego me compite”. Bonito no era.
Pero bloquear todo por reflejo tiene consecuencias. GPTBot y OAI-SearchBot no cumplen la misma función según la taxonomía pública de OpenAI. GPTBot se relaciona con contenido que puede usarse para hacer más útiles y seguros los modelos generativos, mientras que OAI-SearchBot está orientado a la búsqueda de ChatGPT. El webmaster puede permitir OAI-SearchBot para aparecer en resultados y, a la vez, bloquear GPTBot para indicar que su contenido no debe usarse en entrenamiento de modelos fundacionales.
Ese es el punto que muchas configuraciones heredadas no han digerido. En algunos robots.txt se ve una especie de barricada general contra la IA generativa, escrita en caliente, cuando la conversación pública iba a empujones. Meses después, el equipo de marketing pregunta por qué la marca no aparece en respuestas de ChatGPT cuando el usuario busca comparativas, recomendaciones, soluciones locales o información técnica. La respuesta, a veces, está en cuatro líneas perdidas al final del archivo.
El otro actor que conviene no mezclar es ChatGPT-User. OpenAI lo usa para ciertas acciones iniciadas por usuarios dentro de ChatGPT o de GPTs personalizados, pero no es el mismo agente que condiciona la presencia en búsqueda. Para gestionar la exclusión o apertura de Search, el agente relevante es OAI-SearchBot. La distinción suena burocrática, sí. Pero en SEO la burocracia técnica suele mandar más que la inspiración.
Un Disallow mal puesto no tiene épica, aunque pueda dejar una categoría entera fuera de un canal de descubrimiento. Una regla de WAF demasiado entusiasta no sale en una reunión creativa, pero puede tumbar la medición de referidos. Un bloqueo por user-agent copiado de una plantilla vieja no parece grave hasta que se mira el log y aparece el agujero. Y entonces ya no estamos hablando de teoría. Estamos hablando de visibilidad perdida.
Robots.txt, firewall y CDN: la puerta puede estar cerrada dos veces
El primer sitio que hay que mirar es el robots.txt, pero no el único. OAI-SearchBot necesita permiso lógico y permiso real. El permiso lógico está en el archivo de exclusión de robots; el permiso real está en la infraestructura: servidor, CDN, reglas de seguridad, protección anti-bots, listas blancas de IP, cabeceras raras y ese Cloudflare configurado una tarde con demasiada cafeína.
OpenAI publica la cadena del user-agent de OAI-SearchBot y mantiene rangos de IP para verificación. La idea, en términos prácticos, es sencilla: si la web quiere estar disponible para la búsqueda de ChatGPT, debe permitir el bot en robots.txt y no bloquear su acceso en capas posteriores. Porque una cosa es decir “pasa” en la puerta principal y otra muy distinta es soltar al vigilante de seguridad en el pasillo.
Una configuración básica para permitir el rastreo sería sencilla:
User-agent: OAI-SearchBot
Allow: /
Y una configuración compatible con una política de control más prudente podría permitir búsqueda y bloquear entrenamiento:
User-agent: OAI-SearchBot
Allow: /
User-agent: GPTBot
Disallow: /
La tentación es pensar que con eso basta. A veces sí. A veces no. El robots.txt aplica al host, protocolo y puerto donde se sirve el archivo, y debe estar ubicado en la raíz del sitio. Esto importa mucho en webs con subdominios, versiones www y no www, entornos internacionales, tiendas separadas por país o despliegues headless donde cada pieza vive en una esquina distinta del tejado.
Una web puede permitir OAI-SearchBot en la versión principal y bloquearlo, sin querer, en el blog. Puede abrir la portada y cerrar /categoria/, que justo contiene los contenidos transaccionales. Puede permitir el bot en origen y bloquearlo en la CDN por una regla anti-scraping genérica. Puede devolver un 403 solo a ciertos user-agents. Puede, en fin, hacerse invisible con una precisión casi artesanal.
Conviene recordar otro detalle práctico: los cambios en robots.txt no siempre se reflejan de forma instantánea en los sistemas de rastreo. No es una eternidad, pero tampoco un interruptor de luz. Antes de declarar victoria, tragedia o conspiración de Silicon Valley, hay que revisar logs, respuesta HTTP, cachés, reglas del firewall y comportamiento por subdominio. Poca poesía. Mucha verdad.
Qué cambia para SEO, GEO y ecommerce
El SEO técnico siempre ha tenido una parte de fontanería: rastreo, indexación, canonicals, renderizado, logs y estados HTTP. La llegada de OAI-SearchBot no elimina nada de eso; añade otra tubería. Y donde hay tuberías, hay fugas. La visibilidad en IA generativa no empieza en una teoría vaporosa sobre “ser citado por modelos”, sino en algo mucho más prosaico: que el sistema pueda leer la página correcta, con el contenido correcto, en el momento correcto.
Para un medio, esto afecta a noticias, explicadores, análisis y piezas evergreen. Para un ecommerce, toca fichas de producto, categorías, disponibilidad, precios, políticas de envío, imágenes, reseñas y datos estructurados. Para un SaaS, cae sobre páginas de solución, comparativas, documentación, casos de uso y landing pages. ChatGPT no “entiende” una empresa porque la empresa exista; la entiende cuando puede acceder a señales limpias, actualizadas y coherentes.
Esto obliga a revisar el concepto de contenido útil. En una búsqueda clásica, el usuario puede escanear diez resultados, abrir varias pestañas y comparar. En una respuesta conversacional, el sistema filtra primero. La web que aspira a ser mencionada necesita páginas menos infladas y más verificables: títulos claros, información actualizada, entidades bien definidas, autoría cuando proceda, datos que no se escondan tras scripts caprichosos y una arquitectura interna que no parezca un trastero después de una mudanza.
La GEO, o optimización para motores generativos, no debería venderse como el nuevo incienso del marketing. Mejor verla como una extensión seria del SEO: accesibilidad técnica, claridad semántica, reputación, consistencia de marca y contenido que responde sin marear. OAI-SearchBot no premia el teatro. Solo puede abrir la puerta. Lo que encuentre dentro ya es otro asunto.
En ecommerce, la consecuencia es especialmente visible. Una ficha pobre, con descripciones clonadas, sin stock claro, sin precio visible para bots, sin atributos consistentes y con medio contenido servido tarde por JavaScript, lo tiene complicado. No solo ante Googlebot. También ante sistemas que necesitan comprender rápido qué producto es, para quién sirve y por qué debería aparecer en una comparación. La paciencia de la máquina también tiene límites. Aunque no se queje en Slack.
El archivo pequeño que puede borrar una marca de ChatGPT
El robots.txt pesa poco y decide mucho. Ahí vive una paradoja preciosa, casi cruel. Las empresas gastan miles de euros en estrategia de contenidos, herramientas, dashboards, auditorías y consultores con nombres de metodología japonesa, pero luego una línea copiada de un hilo viejo puede dejar fuera al bot que necesitaban permitir. El SEO moderno sigue teniendo momentos de chapuza antigua. Eso lo hace humano.
El patrón recuerda a viejas discusiones con Google: impedir el rastreo no siempre borra una URL del universo, solo impide que el bot vea su contenido. En entornos de IA, ese matiz se vuelve más sensible porque el usuario no siempre distingue entre “no hay información”, “la fuente está bloqueada” y “el sistema ha preferido otra fuente”. El resultado visible puede ser el mismo: la marca no está. Y cuando no estás, el competidor parece más autorizado aunque solo haya tenido la puerta abierta.
También aparece aquí la vieja etiqueta noindex, tan pequeña y tan mal entendida. Bloquear el rastreo y pedir no indexar no son exactamente lo mismo. Si el bot no puede rastrear una página, quizá no pueda leer la instrucción que le dice qué hacer con ella. Y si una URL circula por enlaces externos, menciones o proveedores de datos, puede seguir existiendo como referencia desnuda, sin contenido aprovechable. El control fino exige más que un candado general.
Para un responsable técnico, la comprobación no debería quedarse en mirar el archivo desde el navegador. Hay que leer logs, verificar user-agent, comprobar IPs, revisar respuestas HTTP, probar subdominios, mirar reglas de WAF y confirmar que no se está sirviendo una versión distinta del robots.txt por caché, idioma, geografía o cabecera. Suena aburrido. Lo es. También es exactamente donde se pierden ingresos.
El error más frecuente no será bloquear OAI-SearchBot por convicción, sino hacerlo por arrastre. Una plantilla de seguridad bloquea “AI bots”. Un plugin añade reglas sin explicarlo bien. Una CDN etiqueta tráfico automatizado como sospechoso. Un equipo legal pidió cerrar todo durante la guerra del scraping y nadie volvió a mirar. El archivo se queda ahí, como una nota pegada en una puerta que ya no usa nadie, salvo que ahora esa puerta da a ChatGPT Search.
Medir ChatGPT ya no es una rareza
Otro cambio práctico: el tráfico que llega desde ChatGPT empieza a ser medible con más claridad. Los editores que permiten OAI-SearchBot pueden seguir el tráfico referido desde ChatGPT en herramientas de analítica web, siempre que la sesión llegue marcada y el usuario haga clic. Para cualquier equipo de medición, esa línea vale más que muchas predicciones con humo de escenario.
La medición, sin embargo, exige humildad. ChatGPT puede influir aunque no mande clics directos en cada interacción. Un usuario puede leer una recomendación, recordar una marca y buscarla después en Google. Puede comparar opciones dentro de la conversación y entrar más tarde por tráfico directo. Puede recibir una respuesta sin hacer clic, lo que deja valor editorial sin sesión registrada. El viaje se fragmenta, y la atribución vuelve a hacer lo que mejor sabe: mentir con educación.
Aun así, conviene separar señales. Una cosa es tráfico referido desde ChatGPT. Otra, presencia en respuestas. Otra, menciones de marca. Otra, aparición en resultados de producto. Otra, rendimiento de campañas si entran formatos publicitarios. OpenAI también identifica OAI-AdsBot, usado para revisar páginas vinculadas a anuncios, una pieza distinta de OAI-SearchBot, GPTBot y ChatGPT-User.
Esto dibuja un ecosistema más complejo: OAI-SearchBot para búsqueda, GPTBot para entrenamiento, ChatGPT-User para acciones iniciadas por usuarios y OAI-AdsBot para validación publicitaria. Cuatro nombres, cuatro funciones, cuatro riesgos distintos si se bloquean o se permiten sin criterio. El viejo “bloquea todos los bots de IA” empieza a sonar como apagar el cuadro eléctrico porque parpadea una bombilla.
La decisión editorial o empresarial no es universal. Un medio puede querer exposición en búsqueda conversacional pero no entrenamiento. Una marca puede abrir páginas comerciales y cerrar áreas privadas, facetas infinitas o buscadores internos. Un ecommerce puede permitir categorías y producto, pero proteger endpoints de carrito o APIs internas. La política buena no es abrir todo, sino saber qué se abre, para qué y con qué medición detrás.
La nueva frontera no grita, rastrea
OAI-SearchBot no convierte una web mediocre en referencia, no sustituye a Google, no arregla contenidos pobres ni inventa autoridad donde solo hay relleno. Tampoco es una palanca secreta para dominar ChatGPT. Es algo más seco y más decisivo: un requisito técnico de acceso a una capa de búsqueda que ya forma parte del comportamiento real de usuarios, compradores, periodistas, estudiantes, técnicos y directivos con prisa.
La visibilidad digital está entrando en una etapa menos fotogénica. No todo sucede en la portada de Google ni en el panel de Search Console. Parte de la batalla se libra en bots documentados, cabeceras, logs y ficheros que nadie mira hasta que algo se rompe. La web sigue siendo web, con sus puertas, sus pasillos y sus cerraduras. Solo que ahora algunos visitantes no llevan navegador visible, sino user-agent.
Para seoetico.com y para cualquier proyecto que viva de ser encontrado, el mensaje es incómodamente sencillo: bloquear OAI-SearchBot puede dejarte fuera de ChatGPT Search, mientras que permitirlo no garantiza nada salvo poder competir. Es una diferencia pequeña en apariencia, enorme en estrategia. En el SEO de 2026, no basta con publicar bien. También hay que asegurarse de que los nuevos intermediarios puedan entrar, leer y entender. El resto, como siempre, se gana página a página.
-
IA y GEOComparativa de precios de plataforma IA: la factura real
-
EcommercePara vender en Shopify hay que ser autónomo: respuesta legal
-
IA y GEOCómo aparecer y medir tu presencia en ChatGPT de verdad
-
WebMejor CMS para SEO: la decisión que puede cambiar tu tráfico
-
GoogleCómo conectar TikTok Ads a Google Sheets: rápido y bien
-
SEODiferencia entre enlaces y señales SEO: qué influye de verdad en tu posicionamiento
-
SEONombre de marca personal como estrategia SEO: gana clics
-
ContenidosGeneración de contenido con IA para negocios: riesgo y valor
-
EcommerceCómo tener AliExpress conectado con Shopify sin fallos
-
IA y GEOComparación de Claude con otras IA: razonamiento y código
-
WebCómo añado los proyectos de Divi a Rank Math SEO sin fallos
-
SEO¿Cuál es elemento que tiene mayor relevancia para el SEO?