Descripción del sitio y del negocio
Quién eres, a qué te dedicas y a quién sirves. Breve, directo y sin jerga interna. El LLM necesita contexto para interpretar el resto.
llms.txt es un estándar emergente que permite a los modelos de lenguaje entender la estructura y el contenido de tu sitio de forma eficiente. Una pieza pequeña con impacto directo en cómo te representan los sistemas de IA.
Solicitar demoIgual que robots.txt le dice a los buscadores qué pueden rastrear, llms.txt le dice a los modelos de IA qué contiene tu sitio y qué es relevante entender.
Se trata de un archivo Markdown ubicado en la raíz de tu dominio (tudominio.com/llms.txt) que resume el propósito del sitio, lista las páginas más importantes con una descripción breve y ofrece el contexto que un LLM necesita para representar correctamente tu marca en una respuesta generativa.
El estándar fue propuesto por Jeremy Howard en 2024 y ha ganado adopción rápida porque resuelve un problema real: los LLMs no son buenos interpretando estructuras web complejas. llms.txt les da un atajo directo a lo que importa.
Cuando un sistema de IA con acceso a la web necesita entender tu empresa, tiene dos opciones: rastrear decenas de páginas e intentar sintetizarlas, o leer un único archivo que ya lo resume todo.
llms.txt no garantiza que el modelo te cite, pero sí reduce la fricción para que pueda entenderte. Y en un entorno donde la competencia por ser la referencia citada es alta, cualquier reducción de fricción importa.
Además, los sistemas de recuperación en tiempo real como Perplexity o los AI Overviews de Google rastrean activamente la web. Un llms.txt bien mantenido y actualizado aumenta la coherencia entre lo que publicas y lo que esos sistemas pueden recuperar cuando alguien pregunta por tu categoría.
No es una tarea de una sola vez. Como el contenido evoluciona, el llms.txt necesita mantenerse actualizado para seguir siendo útil.
Quién eres, a qué te dedicas y a quién sirves. Breve, directo y sin jerga interna. El LLM necesita contexto para interpretar el resto.
Las URLs más importantes de tu sitio, acompañadas de una línea que explique qué contiene cada una. No todas las páginas, solo las relevantes.
Si tienes documentación técnica, guías o recursos educativos, este es el lugar para señalarlos. Los LLMs priorizan contenido estructurado.
Una descripción concisa de lo que ofreces, diferente al copy de marketing. El objetivo es que el sistema entienda la utilidad real, no que se venda.
# Nombre de tu empresa
> Una frase que explica qué haces y para quién.
## Páginas principales
- [Inicio](https://tudominio.com/): Descripción breve de qué es el sitio.
- [Producto](https://tudominio.com/producto): Qué hace tu producto y a quién sirve.
- [Precios](https://tudominio.com/precios): Planes y opciones de contratación.
- [Blog](https://tudominio.com/blog): Artículos sobre la categoría.
## Documentación
- [Guía de inicio](https://tudominio.com/docs): Primeros pasos para nuevos usuarios.
## Información adicional
Para contenido completo del sitio: https://tudominio.com/llms-full.txt Generar un llms.txt es la parte fácil. Mantenerlo actualizado a medida que el sitio crece y evoluciona es lo que marca la diferencia. Sopa lo hace parte de la operación normal.
Si quieres que Sopa lo gestione como parte de tu sistema de visibilidad en IA, cuéntanos cómo está tu web ahora.
llms.txt es un archivo de texto plano que se coloca en la raíz de un sitio web (misma ubicación que robots.txt) y que ofrece a los sistemas de IA un resumen estructurado del sitio: qué es, qué páginas contiene y cómo está organizado. Fue propuesto por Jeremy Howard en 2024 como un estándar para facilitar que los LLMs entiendan un sitio web de forma eficiente.
No es un estándar oficial de ningún consorcio web todavía. Es una propuesta de la comunidad que ha ganado adopción rápida porque resuelve un problema real. Varios sistemas de IA ya lo tienen en cuenta, y su implementación no tiene coste ni riesgo, por lo que merece la pena adoptarlo.
robots.txt controla qué rastreadores pueden acceder a qué URLs. llms.txt no bloquea ni permite acceso: explica el contenido del sitio a los LLMs que sí tienen permiso de acceder. Son complementarios, no alternativos.
En la mayoría de casos no. El archivo es texto plano con formato Markdown. Lo que sí requiere tiempo es pensar bien qué incluir: qué páginas son prioritarias, cómo describir los productos y servicios, qué contexto necesita un LLM para entender tu negocio. Ahí está el trabajo real.
Sopa genera y mantiene el llms.txt como parte del sistema de GEO. Esto incluye el archivo base, el archivo llms-full.txt con contenido completo para rastreo, y las actualizaciones automáticas cuando se publica contenido nuevo. No es una tarea de una vez: es parte de la operación continua.