Quando il gestore è una macchina che perde un terzo del capitale

L’esperimento Alpha Arena ha messo alla prova otto tra i più sofisticati modelli di intelligenza artificiale al mondo, tra cui Claude, ChatGPT, Gemini e Grok.

A ciascuno sono stati affidati 10.000 dollari e un mandato molto semplice: comprare e vendere titoli tecnologici americani per due settimane.

Il risultato è stato tutt’altro che brillante: il portafoglio aggregato ha perso circa un terzo del capitale. Su 32 prove complessive, solo 6 si sono chiuse in profitto.

Il dato è importante perché ridimensiona una narrativa molto diffusa: l’idea che basti collegare un modello di intelligenza artificiale ai mercati per ottenere automaticamente decisioni di investimento migliori.

La realtà è molto più complessa.

Il problema non è solo la perdita

Il dato più interessante di Alpha Arena non è soltanto la perdita media, ma la forte dispersione dei comportamenti.

A parità di istruzioni, alcuni modelli hanno operato poco, altri in modo estremamente aggressivo.

Grok, ad esempio, ha effettuato 158 operazioni in due settimane. Il modello di Alibaba ne ha effettuate 1.418.

In un fondo regolamentato, una differenza simile aprirebbe immediatamente un’analisi interna sul processo decisionale. In Alpha Arena, invece, è emersa come una caratteristica naturale dei modelli.

Questo significa che, anche quando ricevono lo stesso prompt, i modelli possono sviluppare comportamenti molto diversi.

E questo è un problema enorme quando si parla di gestione del denaro.

Le “personalità” dei modelli

Un altro elemento emerso è che i modelli sembrano avere vere e proprie inclinazioni operative.

Claude ha mostrato una tendenza verso le posizioni lunghe.

Gemini è stato più disponibile a prendere posizioni ribassiste.

Il modello di Alibaba ha assunto rischi elevati, anche con leva finanziaria.

Questo ci dice una cosa importante: i modelli non sono strumenti neutri.

Possono sviluppare bias, preferenze e comportamenti ricorrenti. Per questo, se utilizzati in ambito finanziario, devono essere gestiti e controllati come si farebbe con un analista umano.

Non basta chiedere loro cosa fare.

Bisogna verificare come ragionano, quali dati usano, quali errori ripetono e quali inclinazioni stanno sviluppando.

AI nel trading: tre cose molto diverse

Quando si parla di intelligenza artificiale applicata al trading, spesso si confondono tre approcci completamente diversi.

Il primo è quello dei fondi quantitativi.

In questo caso vengono costruiti modelli specifici, alimentati da dati di mercato, serie storiche, segnali statistici e infrastrutture dedicate. Il modello nasce per analizzare numeri finanziari e cercare relazioni nei dati.

È un mondo molto diverso dal semplice utilizzo di un chatbot.

Il secondo approccio è chiedere direttamente a ChatGPT, Gemini o Claude cosa comprare.

Questo è il modello più fragile.

Un grande modello linguistico è stato addestrato principalmente per comprendere e produrre testo. Può parlare molto bene di mercati, ma questo non significa che sappia prevederli.

Saper spiegare i mercati non equivale a saperli battere.

È come chiedere a un commentatore sportivo di scendere in campo al posto del centravanti. Può conoscere benissimo il gioco, ma quando deve giocare davvero la partita, il risultato cambia.

Il terzo approccio è il più interessante: usare l’intelligenza artificiale come supporto all’analisi.

In questo caso il modello viene collegato a dati strutturati, documenti finanziari, bilanci, trimestrali, trascrizioni, stime di consenso e dati macroeconomici.

Il suo ruolo non è decidere cosa comprare, ma aiutare l’analista a leggere più velocemente, sintetizzare informazioni e individuare elementi rilevanti.

Qui l’AI non è il gestore del portafoglio.

È un analista junior potenziato.

Il grande equivoco: se tutti possono usare lo stesso strumento, dov’è il vantaggio?

C’è poi un problema strutturale.

ChatGPT e gli altri grandi modelli linguistici sono accessibili a centinaia di milioni di utenti.

Se davvero bastasse chiedere “quali titoli saliranno?” per ottenere una risposta profittevole, saremmo davanti al più grande arbitraggio della storia finanziaria.

Ma un arbitraggio disponibile a tutti non può durare.

Nel breve periodo, i mercati sono un gioco competitivo: non tutti possono battere il benchmark contemporaneamente.

Un’informazione accessibile a tutti, ripetibile da tutti e sfruttabile da tutti non può generare rendimento extra per tutti.

Questo è il punto che spesso il marketing sull’intelligenza artificiale applicata agli investimenti tende a dimenticare.

L’AI può sembrare competente, ma non sempre prudente

Un altro aspetto delicato riguarda la natura stessa dei modelli linguistici.

Questi strumenti non nascono per massimizzare il rendimento di un portafoglio. Nascono per produrre risposte coerenti, utili e coinvolgenti.

Il problema è che, in finanza, spesso il miglior consiglio non è il più coinvolgente.

A volte il miglior consiglio è non fare nulla.

Non vendere nel panico.

Non inseguire il titolo del momento.

Non modificare una strategia di lungo periodo per un evento di breve termine.

Ma una risposta del tipo “mantieni la calma, rispetta il piano e non agire emotivamente” è meno accattivante di una lista di titoli, settori o strategie operative.

Ed è qui che nasce il rischio: il modello può sembrare molto convincente, ma non necessariamente sta dando il consiglio più prudente.

Il vero rischio: milioni di investitori con le stesse risposte

Il tema più interessante non è solo capire se i modelli linguistici sappiano prevedere i mercati.

La domanda più importante è un’altra: cosa succede se milioni di investitori fanno la stessa domanda agli stessi modelli?

Il rischio è che molte persone ricevano risposte simili e si muovano nella stessa direzione.

Comprano gli stessi titoli.

Vendono gli stessi strumenti.

Aumentano l’esposizione agli stessi settori.

Riducono il rischio nello stesso momento.

A quel punto l’intelligenza artificiale non avrebbe più bisogno di prevedere il mercato.

Potrebbe diventare essa stessa un fattore di mercato.

Se abbastanza investitori ricevono la stessa indicazione e agiscono nello stesso modo, la previsione può auto-avverarsi per semplice pressione di acquisto o di vendita.

Un consenso generato dalla statistica linguistica

I principali modelli sono addestrati su grandi quantità di dati simili: articoli, analisi, report, contenuti pubblici, commenti e testi presenti online.

Questo può portarli a convergere verso risposte molto simili.

Il meccanismo è semplice.

I dati di partenza sono simili.

Le domande degli utenti sono simili.

I modelli cercano risposte coerenti.

Le risposte tendono a concentrarsi sugli stessi nomi, sugli stessi temi e sulle stesse narrative.

Il risultato può essere un consenso generato non necessariamente da un’analisi fondamentale superiore, ma dalla ripetizione statistica del linguaggio.

Non un consenso vero.

Un consenso linguistico.

E nei mercati finanziari, anche questo può avere conseguenze.

L’AI come amplificatore dei movimenti di mercato

Il rischio vale sia al rialzo sia al ribasso.

Se milioni di utenti chiedono cosa comprare e ricevono risposte simili, possono spingere gli stessi titoli verso l’alto.

Ma se milioni di utenti chiedono cosa fare durante una fase di panico e ricevono suggerimenti simili di vendita o riduzione del rischio, il movimento può amplificarsi.

In questo caso i modelli linguistici diventerebbero strumenti pro-ciclici.

Spingono ad aumentare il rischio quando il mercato sale.

Spingono a ridurlo quando il mercato scende.

Rafforzano il movimento già in corso.

E rendono più fragile la liquidità nei momenti critici.

Il rischio non è quindi solo che l’AI sbagli previsione.

Il rischio è che, attraverso risposte correlate, contribuisca essa stessa a creare movimenti di mercato più violenti.

Cosa può fare davvero l’intelligenza artificiale in finanza

Questo non significa che l’intelligenza artificiale sia inutile negli investimenti.

Al contrario, può essere uno strumento molto potente.

Può aiutare a leggere documenti complessi.

Può sintetizzare bilanci e trimestrali.

Può confrontare trascrizioni societarie.

Può analizzare grandi volumi di testo.

Può individuare cambiamenti nel linguaggio del management.

Può supportare l’analista nella raccolta e organizzazione delle informazioni.

Il punto è che il suo ruolo corretto non è sostituire il processo di investimento.

È potenziarlo.

La differenza è fondamentale.

Un modello linguistico può aiutare un professionista a lavorare meglio, ma non può sostituire metodo, esperienza, controllo del rischio e responsabilità fiduciaria.

Cosa non può fare oggi

Oggi i grandi modelli linguistici generalisti non sono adatti a gestire autonomamente un portafoglio.

I limiti principali sono evidenti:

operano troppo spesso;

dimensionano male le posizioni;

mostrano comportamenti incoerenti;

sviluppano bias ricorrenti;

hanno difficoltà nel controllo del rischio;

non hanno un vantaggio informativo stabile;

possono assecondare l’utente invece di proteggerlo;

confondono capacità narrativa e capacità predittiva.

Per questo, affidare loro direttamente decisioni di allocazione del capitale è ancora incompatibile con un serio dovere fiduciario.

Conclusione

L’esperimento Alpha Arena ci ricorda una lezione semplice ma fondamentale: saper parlare di mercati non significa saperli battere.

I grandi modelli linguistici possono essere strumenti utili, anche molto utili, nel lavoro di analisi.

Ma non sono gestori di portafoglio.

Possono leggere, sintetizzare, confrontare e velocizzare il lavoro umano.

Non possono sostituire il giudizio, la responsabilità e il processo decisionale di chi gestisce capitale.

Il vero tema dei prossimi anni non sarà soltanto capire se l’intelligenza artificiale saprà prevedere i mercati.

Sarà capire quanto le risposte dell’intelligenza artificiale potranno influenzare i comportamenti degli investitori.

Perché quando milioni di persone chiedono alla stessa macchina cosa comprare o cosa vendere, quella macchina non sta più solo osservando il mercato.

Sta iniziando a farne parte.

Glossario

Modello linguistico
Sistema di intelligenza artificiale addestrato per comprendere e generare testo. Può essere molto utile per analisi e sintesi, ma non nasce per prevedere i prezzi finanziari.

Alpha Arena
Esperimento pubblico in cui diversi modelli di intelligenza artificiale sono stati messi alla prova nella compravendita di titoli tecnologici americani.

Fondo quantitativo
Fondo che utilizza dati, modelli matematici e algoritmi per prendere decisioni di investimento.

Benchmark
Indice di riferimento usato per confrontare la performance di un portafoglio. Ad esempio, l’S&P 500 per il mercato azionario americano.

Bias
Inclinazione o distorsione ricorrente nel processo decisionale. Può riguardare sia le persone sia i modelli di intelligenza artificiale.

Pro-ciclicità
Tendenza ad amplificare un movimento già in corso, comprando quando il mercato sale e vendendo quando scende.

Consenso di mercato
Insieme delle aspettative prevalenti tra investitori, analisti e operatori finanziari.

Dovere fiduciario
Responsabilità di agire nell’interesse del cliente, con prudenza, competenza e controllo del rischio.

Sotto-performance
Risultato inferiore rispetto a un indice o parametro di riferimento.

Trappola di liquidità
Situazione in cui molti investitori si muovono nella stessa direzione, rendendo difficile comprare o vendere senza influenzare pesantemente i prezzi.