Indice — 19 percorsiWeb Agency · Milano

My  Web  Lab

Guida operativa · AI & Automazione

llms.txt: cos'è e perché ogni sito web dovrebbe averlo nel 2026

Il file llms.txt è il nuovo robots.txt per i modelli AI. Ecco come crearlo e perché migliora la tua visibilità su ChatGPT e Perplexity.

Tempo di lettura: 13 min

Blog redesign · AI & Automazione

llms.txt: cos'è e perché ogni sito web dovrebbe averlo nel 2026

Il file llms.txt è un documento Markdown posizionato nella root del sito (es. tuosito.com/llms.txt) che dichiara ai modelli AI come Claude, GPT-4o e Perplexity quali contenuti del sito sono affidabili, aggiornati e disponibili per l'indicizzazione. È lo standard informale proposto da Jeremy Howard (fast.ai) nel 2024 e sta diventando rapidamente una best practice per chiunque voglia ottimizzare la propria visibilità sui motori AI.

Perché è nato llms.txt

I modelli AI di nuova generazione navigano il web in tempo reale, ma si trovano davanti a siti con strutture HTML complesse, contenuti duplicati, pagine di carrello, aree riservate e PDF non indicizzabili. Il file llms.txt risolve questo problema dichiarando esplicitamente — in un formato che un LLM può leggere ed elaborare direttamente — quali pagine contengono le informazioni più rilevanti sull'azienda, i servizi e i contenuti. È una guida per i sistemi AI, non per i crawler tradizionali.

Il problema che llms.txt risolve è reale: anche un sito ben strutturato per la SEO può essere difficile da leggere per un modello AI che deve decidere in pochi secondi quali contenuti usare per rispondere a una domanda. Un sito e-commerce con 5.000 schede prodotto, 800 pagine categoria e un blog da 200 articoli presenta un'enorme superficie di contenuto. Senza una guida esplicita, il crawler AI sceglie in modo arbitrario. Con llms.txt, dichiari tu quale contenuto è quello chiave — e il modello lo usa come punto di partenza.

Come è strutturato un file llms.txt

Il formato è Markdown semplice. La struttura standard include: un titolo H1 con il nome del sito, una breve descrizione in un paragrafo (cosa fa il sito, per chi, dove), e una o più sezioni H2 con elenchi di link alle pagine principali — divisi per categoria (es. "Servizi", "Blog", "Chi siamo", "Contatti"). Ogni link può avere una breve descrizione in linea che aiuta il modello AI a capire cosa troverà in quella pagina senza doverla visitare.

Un esempio di struttura llms.txt per un'agenzia web potrebbe essere: `# My Web Lab - Agenzia web e AI Milano`. Seguito da un paragrafo descrittivo: "My Web Lab è un'agenzia web e AI di Milano specializzata in realizzazione siti web Next.js, sviluppo app, SEO e integrazione AI per PMI italiane". Poi le sezioni: `## Servizi` con link a /realizzazione-siti-web/, /agenzia-seo/, /ai-agency/ etc. E `## Blog` con link agli articoli più rilevanti. La semplicità è la caratteristica chiave: più il file è chiaro e lineare, meglio funziona.

llms.txt vs robots.txt: differenze fondamentali

Il robots.txt dice ai crawler cosa NON devono indicizzare; il llms.txt dice ai modelli AI cosa DEVONO prioritariamente leggere. Non sono in conflitto: robots.txt rimane necessario per il controllo dell'indicizzazione tradizionale, mentre llms.txt è un segnale positivo e informativo destinato specificamente ai sistemi AI. Un sito ben ottimizzato per la GEO — come quelli che costruiamo nella nostra AI agency — li avrà entrambi.

Una distinzione tecnica importante: robots.txt è uno standard riconosciuto e rispettato dal protocollo HTTP da decenni; llms.txt è ancora uno standard informale, non formalizzato da nessun ente tecnico. Questo significa che non tutti i crawler AI lo supportano esplicitamente, ma non significa che sia inutile: Perplexity lo supporta, Claude di Anthropic lo raccomanda, e la struttura Markdown è comunque leggibile da qualsiasi LLM che visiti quella URL. Nel peggiore dei casi, viene trattato come un contenuto Markdown informativo sul sito.

Esiste anche llms-full.txt: cosa contiene

Oltre al file llms.txt con i link, alcune implementazioni avanzate includono un file llms-full.txt che contiene i testi completi delle pagine principali direttamente nel file, in formato Markdown. Questo permette a un LLM di acquisire tutte le informazioni rilevanti sull'azienda in una singola lettura, senza navigare tra le pagine. È particolarmente utile per i siti con documentazione tecnica, cataloghi prodotti o guide dettagliate.

Il file llms-full.txt ha senso per siti con contenuti ad alta densità informativa che vale la pena rendere disponibili in un'unica lettura: documentazione tecnica di software, cataloghi prodotti con specifiche dettagliate, guide operative complete. Per un'agenzia web o di marketing, può includere i profili completi dei servizi, i case study principali e le FAQ più frequenti. La dimensione del file non è limitata da nessuno standard, ma mantenerlo sotto i 50-100KB è una buona pratica per la velocità di lettura.

Come creare llms.txt per il tuo sito: guida pratica

Primo: crea un file di testo chiamato llms.txt nella cartella pubblica del tuo sito. Secondo: scrivi un titolo H1 con il nome del sito e una descrizione di 2-3 frasi in Markdown. Terzo: aggiungi le sezioni con i link alle pagine più importanti, con una breve descrizione per ognuna. Quarto: pubblica il file e verifica che sia accessibile all'URL /llms.txt. Per i siti in Next.js, il file va nella cartella /public o generato dinamicamente con una route API. Quinto: aggiorna il file ogni volta che aggiungi contenuti significativi.

Un dettaglio tecnico importante: verifica che il server serva il file llms.txt con il content-type corretto (text/plain o text/markdown) e senza restrizioni di accesso nel robots.txt. Alcuni CMS e framework configurano le cartelle pubbliche in modo da bloccare l'accesso a file non HTML — assicurati che llms.txt sia effettivamente raggiungibile da un crawler esterno. Puoi testarlo facilmente visitando tuosito.com/llms.txt nel browser in modalità incognito.

Quali modelli AI leggono già llms.txt

Perplexity ha confermato il supporto esplicito al formato llms.txt nel suo crawler. Claude di Anthropic lo indica come best practice nella documentazione per sviluppatori. OpenAI non ha dichiarazioni ufficiali, ma il formato Markdown è nativo per GPT-4o quando legge pagine web. Gemini di Google si comporta in modo analogo. In tutti i casi, avere il file non fa mai danno: nel peggiore dei scenari, viene ignorato; nel migliore, migliora significativamente la qualità con cui un AI comprende e rappresenta il tuo sito.

Dalla nostra esperienza nei progetti della nostra AI agency, implementare llms.txt è spesso la prima ottimizzazione GEO che facciamo dopo un audit, perché è quella con il miglior rapporto tra tempo investito (2-4 ore) e impatto potenziale. Non è uno strumento magico che porta citazioni da zero, ma se il sito ha già contenuti di qualità, aiuta i modelli AI a trovarli e usarli correttamente.

Errori comuni nell'implementazione di llms.txt

I problemi più frequenti che vediamo nelle implementazioni: file troppo generici che non aggiungono informazioni rispetto a una semplice sitemap, file con link a pagine non indicizzabili (aree riservate, pagine noindex), file mai aggiornati dopo la pubblicazione iniziale, e file in formato HTML invece di Markdown puro. Un llms.txt aggiornato mensilmente con i nuovi articoli del blog e le pagine aggiornate vale molto di più di uno statico pubblicato una volta e dimenticato.

llms.txt e GEO: il collegamento strategico

Il file llms.txt è uno degli strumenti pratici della GEO (Generative Engine Optimization). Da solo non basta: serve in combinazione con contenuti answer-first, Schema markup aggiornato e un blog con contenuti specifici e autorevoli. Se vuoi capire come integrare llms.txt in una strategia GEO completa per la tua azienda, contattaci per una valutazione gratuita del tuo sito.

Il llms.txt è la mappa che stai consegnando ai modelli AI per navigare il tuo sito. Come tutte le mappe, è utile solo se chi la usa sa già cosa cercare — e se le strade che indica portano davvero a contenuti di valore. La combinazione di llms.txt con contenuti ben strutturati, dati verificabili e aggiornamenti frequenti è la formula che produce risultati GEO misurabili nel tempo. Nei siti web che costruiamo, llms.txt è parte standard del deliverable finale.

Articolo a cura diMy Web Lab — Agenzia Web Milano

Siamo un team di designer e sviluppatori specializzati in SEO, Next.js e crescita digitale per PMI italiane. Costruiamo siti che portano traffico reale e clienti reali.

Lavora con noi →

Risorse correlate

Tutte le guide →

Hai un progetto in mente?

Parliamone.

Contattaci ora