Saltar al contenido
Diagrama de un archivo llms.txt conectado con iconos de ChatGPT, Claude y Perplexity
IASEOtecnología

llms.txt: cómo preparar tu web para que la IA te entienda de verdad

P Pedro Luis Cuevas Villarrubia

El otro día pregunté a ChatGPT por mi propia web. Me dijo algo vago sobre “una empresa de diseño web en Asturias”. Ni los precios, ni los servicios concretos, ni el teléfono. Básicamente, lo que Google sabía en 2010.

El problema no era ChatGPT. Era que mi web no estaba preparada para que la IA la entendiera. Eso cambió cuando implementé llms.txt.

Este es el segundo post de una serie sobre cómo la web evoluciona para comunicarse con la IA. En el anterior te conté cómo robots.txt y sitemap siguen siendo la base para Google. Ahora vamos un nivel más arriba: cómo hacer que los modelos de lenguaje te entiendan.

Qué es RAG y por qué te importa

RAG (Retrieval-Augmented Generation) es la técnica que usan ChatGPT, Claude y Perplexity para responder con información actual: en vez de inventar, buscan contenido real y lo usan como contexto.

El flujo es así:

  1. Alguien pregunta: “¿diseño web barato en Asturias?”
  2. El LLM busca en su índice (o en la web en tiempo real)
  3. Encuentra tu llms.txt o el contenido de tu web
  4. Genera una respuesta basada en tu contenido real

Si tu web no tiene contenido estructurado para IA, el modelo usa lo que encuentre — que puede ser tu competencia, una review antigua, o nada.

llms.txt: tu tarjeta de presentación para la IA

llms.txt es un archivo Markdown en la raíz de tu web (https://tudominio.es/llms.txt). Contiene un resumen estructurado de quién eres y qué ofreces.

Estructura básica

# Nombre de tu negocio

> Tu tagline o descripción en una línea

## Servicios

- **Servicio 1**: Descripción corta | Precio | URL
- **Servicio 2**: Descripción corta | Precio | URL

## Contacto

- Email: info@tudominio.es
- Teléfono: +34 XXX XX XX XX
- Web: https://tudominio.es

Mi llms.txt real

En asturwebs.es genero llms.txt automáticamente desde un Single Source of Truth en TypeScript. El resultado:

# AsturWebs — Socio Digital para Autónomos y PYMEs

> Diseño web profesional, hosting propio, SEO e IA desde Asturias

## Servicios

| Servicio | Desde | Detalle |
|----------|-------|---------|
| Asesoría digital | 95€/mes | Soporte continuo, consultas ilimitadas |
| Diseño web | 375€ + 95€/mes | A medida, Astro, rendimiento nativo |
...

Cuando un LLM lee esto, tiene todo lo que necesita para responder correctamente: servicios, precios, contacto, URL. No tiene que adivinar.

llms-full.txt: el contexto profundo

Si llms.txt es tu tarjeta de presentación, llms-full.txt es tu catálogo completo. Contiene el contenido de tus páginas principales en formato markdown limpio.

Lo uso para las 12 páginas clave: home, servicios, planes, portfolio, contacto, sobre mí. El LLM obtiene contexto completo sin parsear HTML, sin JavaScript, sin CSS.

ArchivoContenidoTamañoUso
llms.txtResumen + tabla de servicios~2 KBRespuestas rápidas
llms-full.txtContenido de 12 páginas~25 KBContexto profundo RAG

Red neuronal absorbiendo datos de una página web

Por qué markdown y no HTML

Los LLMs entienden HTML, pero no es eficiente. Una página HTML tiene:

  • Etiquetas de estructura (<div>, <section>, <article>)
  • Clases CSS, IDs, atributos data-*
  • Scripts inline, meta tags, JSON-LD
  • Navegación, footer, sidebar (contenido repetido)

Todo eso es ruido para un modelo de lenguaje. Markdown va directo al contenido:

## Servicios de diseño web

Diseño web profesional a medida desde 375€. Incluye hosting propio,
SSL, dominio y soporte técnico continuo.

Menos tokens = mejor comprensión = respuestas más precisas.

Tu web ya genera tráfico orgánico con Google, pero ¿apareces cuando alguien pregunta a ChatGPT o Perplexity? Puedo preparar tu web para que la IA te encuentre y te recomiende.

El ecosistema de discovery en 2026

Tu web necesita comunicarse con tres tipos de visitantes:

VisitanteQué leeQué necesita
Googlebotrobots.txt + sitemapSaber qué rastrear
LLM (ChatGPT, Claude)llms.txt + llms-full.txtContexto semántico
Agente IA autónomoagents.txt + openapi.jsonIdentidad + permisos + API

Ninguno reemplaza al otro. Son capas complementarias.

Discovery mesh: cómo se conectan todo

En mi web, todos estos archivos se referencian entre sí:

robots.txt ──→ Sitemap: sitemap-index.xml
           ──→ Agent-discovery: agents.txt
           ──→ LLM-context: llms.txt
           ──→ LLM-context-full: llms-full.txt

agents.txt ──→ Discovery: robots.txt, llms.txt, openapi.json
llms.txt   ──→ Referencia: agents.txt para uso con herramientas

Cualquier IA que llegue por cualquier archivo encuentra el resto. Es un mesh de descubrimiento — no dependes de que el bot sepa buscar un archivo específico.

Cómo implementar llms.txt hoy

  1. Crea llms.txt con tu resumen de negocio en markdown
  2. Opcional: crea llms-full.txt con el contenido de tus páginas principales
  3. Añade referencias en robots.txt: LLM-context: https://tudominio.es/llms.txt
  4. Sirvelo como text/plain con UTF-8 — algunos servidores no configuran el MIME type para .txt con markdown

Nota técnica: Astro genera mi llms.txt automáticamente en cada build desde un archivo TypeScript que también alimenta el chatbot y la API. Si cambio un precio, se actualiza en todos los sitios. Es lo que llaman Single Source of Truth.

¿Merece la pena?

Pregúntate esto: en 2026, ¿cuántos de tus clientes potenciales usan ChatGPT o Perplexity para buscar servicios? La respuesta es más de los que piensas. Y va a crecer.

Si tu web solo habla con Google, solo exists para la mitad de las búsquedas. Con llms.txt, existes para la otra mitad también.

En el siguiente post te cuento el siguiente paso: cómo agents.txt permite que los agentes IA no solo te lean, sino que interactúen con tu web.


¿Quieres que ChatGPT recomiende tu negocio?

Preparo tu web con llms.txt, agents.txt y OpenAPI para que la IA te encuentre, te entienda y te recomiende.

Cuéntame tu proyecto →
P

Pedro Luis Cuevas Villarrubia

Innovation Practitioner, WebMaster, SysAdmin & SEO · AI Agent Architect & Advanced Prompt Engineer

Hablar con Pedro

Preguntas frecuentes

¿Qué es llms.txt exactamente?

Es un archivo markdown en la raíz de tu web (/llms.txt) que proporciona un resumen estructurado de tu negocio para modelos de lenguaje. Lo usan ChatGPT, Claude, Perplexity y otros LLMs para entender quién eres y qué ofreces sin tener que parsear HTML.

¿Es llms.txt un estándar oficial?

No es un estándar formal como robots.txt. Es una convención propuesta por Jeremy Howard (Answer.ai) en 2024 que ha ganado adopción rápida. Funciona porque los LLMs ya están entrenados para buscarlo y usarlo.

¿Diferencia entre llms.txt y llms-full.txt?

llms.txt es un resumen compacto (servicios, precios, contacto). llms-full.txt contiene el contenido completo de tus páginas principales. El primero es para respuestas rápidas; el segundo para contexto profundo en RAG.

¿Puedo poner lo mismo en robots.txt y en llms.txt?

Cumplen funciones distintas. robots.txt controla el acceso (network level). llms.txt proporciona contexto semántico (contenido level). Son complementarios, no redundantes.

Artículos relacionados

¿Y si tu Socio Digital fuera Yo?

Pedro Luis Cuevas Villarrubia · Innovation Practitioner, WebMaster, SysAdmin & SEO · AI Agent Architect & Advanced Prompt Engineer

Hace dos décadas, tener una web era suficiente. Luego llegó el SEO, luego el móvil, luego las redes. Ahora la IA lo cambia todo a velocidad exponencial. No necesitas alguien que te haga la web. Necesitas alguien que conozca tu proyecto, que esté al día del avance tecnológico y que sepa aplicarlo a lo tuyo. Eso es un Socio Digital.

Asesoría Diseño Web SEO Hosting IA Mantenimiento
¿Queda sitio?