Il prompt engineering è la disciplina di scrivere istruzioni efficaci per i modelli AI (Claude, ChatGPT, Gemini, GPT-4o) per ottenere output di qualità, rilevanti e nel formato desiderato. Per il business, la differenza tra un prompt generico e un prompt ben costruito può significare la differenza tra un output che richiede 20 minuti di revisione e uno che è quasi pronto all'uso. Non è una competenza tecnica: è comunicazione precisa.
Il framework RCTF: Ruolo, Contesto, Task, Formato
Il framework più utile che usiamo nei progetti della nostra AI agency per costruire prompt efficaci è RCTF. Ruolo: "Sei un responsabile marketing senior di una PMI B2B italiana specializzata in software gestionale". Contesto: "Il nostro cliente target sono aziende manifatturiere con 20-100 dipendenti nel Nord Italia che non hanno ancora adottato software cloud". Task: "Scrivi una email di follow-up da inviare a un lead che ha scaricato il nostro whitepaper ma non ha ancora risposto alla proposta commerciale". Formato: "Email di 150-200 parole, tono professionale ma non freddo, oggetto accattivante, una sola CTA".
Quattro elementi, output radicalmente migliore. La logica è semplice: più contesto date al modello, meno deve indovinare. Un modello AI senza contesto produce output "medio" — quello che funziona per il caso più comune. Con contesto specifico, produce output calibrato per la tua specifica situazione. La ricerca di Anthropic sulle performance dei modelli mostra che i prompt con context adeguato producono output giudicati "utili" il 40-60% più spesso rispetto a prompt equivalenti senza context.
Il ruolo del sistema: impostare il modello correttamente
I modelli AI come Claude e GPT-4o hanno un concetto di "system prompt": un'istruzione iniziale che definisce il comportamento del modello per tutta la conversazione. Se usi l'API direttamente o strumenti come Claude.ai Projects, puoi definire un system prompt fisso per tutti i task del tuo caso d'uso. Un buon system prompt include: chi sei (azienda, settore, posizionamento), chi è il tuo pubblico, il tono di voce del brand, le cose che il modello non deve fare (es. "non inventare dati, se non sai qualcosa dillo esplicitamente"), e il formato standard degli output.
Il system prompt è l'investimento di prompt engineering con il miglior ROI per un'azienda: scritto una volta bene, si applica a migliaia di interazioni senza dover ripetere il contesto ogni volta. Nei progetti di sviluppo web app con interfacce AI integrate, il system prompt è parte del codice dell'applicazione — è il "carattere" permanente dell'assistente AI, che rimane coerente indipendentemente da cosa chiede l'utente. La progettazione del system prompt è una fase critica di qualsiasi progetto AI che seguiamo.
Few-shot prompting: insegnare con esempi
Il few-shot prompting è la tecnica di fornire al modello 2-3 esempi di input/output prima di presentare il task reale. È particolarmente efficace per task con un formato di output molto specifico (es. schede prodotto nel formato esatto del tuo catalogo, email con struttura precisa, report con template definito). Invece di descrivere come deve essere l'output, mostri com'è.
Un esempio pratico: invece di descrivere come voglio che sia formattata una scheda prodotto, includo nel prompt 2 esempi di schede prodotto ben fatte del mio catalogo. Il modello generalizza il pattern dagli esempi e lo applica al nuovo prodotto. I modelli recenti come Claude 3.5 e GPT-4o sono molto bravi a generalizzare il pattern dagli esempi forniti, anche da 2-3 soli esempi. Il few-shot prompting è particolarmente utile quando il formato richiesto è difficile da descrivere a parole ma facile da mostrare.
Chain-of-thought: far ragionare il modello step by step
Per task che richiedono ragionamento complesso (analisi di dati, valutazioni strategiche, problem solving) aggiungere "Ragiona passo per passo" o "Pensa ad alta voce prima di rispondere" migliora significativamente la qualità dell'output. Questa tecnica — chiamata chain-of-thought prompting — costringe il modello a esplicitare il proprio processo di ragionamento, il che riduce gli errori logici e le conclusioni affrettate.
Claude di Anthropic è particolarmente bravo in questo, grazie al training specifico sul ragionamento esplicito. La modalità "extended thinking" di Claude 3.7 porta questo al livello successivo: il modello ragiona internamente per un tempo più lungo prima di rispondere, producendo output di qualità significativamente superiore su task analitici complessi. Nei progetti dove usiamo Claude per analisi di contratti o valutazioni di business case, la differenza di qualità tra il modello con e senza chain-of-thought è sistematicamente evidente.
Gli errori più comuni nei prompt aziendali
Dalla nostra esperienza con i clienti che iniziano a usare AI nel flusso di lavoro, gli errori più frequenti nei prompt sono: prompt troppo vaghi ("scrivi un'email di marketing" → quale prodotto, target, obiettivo, tono?), aspettative di conoscenza implicita che il modello non ha (il modello non conosce la tua azienda se non glielo dici), richiedere troppo in un solo prompt (un prompt = un task), non specificare il formato dell'output, e non fornire vincoli (lunghezza, tono, cosa evitare).
Un errore specifico molto frequente nelle PMI: usare il modello AI come un motore di ricerca. Chiedere a Claude "qual è il fatturato di Azienda X nel 2025" è inutile — il modello non ha accesso a database aziendali e potrebbe allucinare numeri plausibili. Il modello AI è un generatore di testo che ragiona sul contesto che gli fornisci: funziona su testi, ragionamenti, trasformazioni di contenuto, generazione creativa e analisi di documenti che gli dai tu. Non è un database e non è un motore di ricerca.
Prompt library aziendale: come costruirla
Una prompt library è una raccolta di prompt testati e validati per i task ricorrenti dell'azienda: email di vendita, analisi competitor, riassunto di meeting, generazione di report, descrizioni prodotto, risposte tipo al customer service. Costruirla richiede 2-4 settimane di lavoro iniziale ma ripaga enormemente in termini di qualità e consistenza degli output.
La struttura che consigliamo: file condiviso (Notion, Confluence, Google Docs) con una scheda per ogni prompt, organizzato per reparto/funzione, con versione del prompt, esempi di output atteso e note di utilizzo. Ogni prompt dovrebbe avere un proprietario — la persona che lo aggiorna quando le esigenze cambiano. Nei progetti di sviluppo software integriamo la prompt library direttamente nell'interfaccia degli strumenti AI aziendali: l'utente seleziona il tipo di task da un menu e il prompt corretto viene iniettato automaticamente.
Prompt sicuri: come evitare output problematici
In contesto aziendale, i prompt devono essere progettati non solo per la qualità dell'output, ma anche per la sicurezza. Istruzioni esplicite sul cosa non fare (es. "non inventare dati", "non condividere informazioni di altri clienti", "non fare affermazioni legali o mediche") riducono il rischio di output problematici. Questo è particolarmente importante per chatbot rivolti agli utenti finali, dove un prompt mal progettato può produrre output che danneggiano l'immagine del brand o creano problemi legali.
Come misurare la qualità di un prompt
Un prompt è buono se: produce output utile senza richiedere revisione estesa (test su 5-10 esempi), è consistente tra run diverse (stesso prompt, output di qualità simile), è comprensibile da altri colleghi che non lo hanno scritto (documentazione implicita), e scala — funziona anche su varianti del caso d'uso originale.
Il testing sistematico dei prompt è la parte più trascurata del prompt engineering aziendale: la maggior parte delle persone scrive un prompt, lo usa una volta e lo dimentica. Testarlo su 5 casi diversi prima di metterlo in produzione cambia tutto. Noi costruiamo sempre un "test set" di almeno 10 esempi rappresentativi prima di finalizzare un prompt che andrà in un sistema di produzione — è 2-3 ore di lavoro che evita problemi in produzione. Contattaci per un workshop di prompt engineering per il tuo team.




