MLEvolve: l’IA impara a fare l’ingegnere… e in 12 ore batte tutti

Avete presente quel momento, alle 3 di notte, in cui state testando l’ennesimo modello di machine learning e vorreste un collega che non si addormenti sulla tastiera?

Uno che non dimentichi cosa avete provato mezz’ora fa, che non ricominci ogni volta da capo come se nulla fosse?

Ecco: quel collega ora esiste. Si chiama MLEvolve, arriva da un dream team che mette insieme Sun Yat-sen University, Tsinghua, Mila (Québec) e Zhejiang University, e non chiede nemmeno il caffè.

by Roosteram – 6 Giugno 2006

Questo gruppo di tredici ricercatori ha progettato un’intelligenza artificiale capace di fare da sola l’ingegnere del machine learning. Non solo: lo fa meglio di noi umani e in metà del tempo.

I tre difetti degli apprendisti storditi

Per capire perché MLEvolve sia una svolta, bisogna partire dai problemi che affliggono i sistemi automatici attuali. Il primo è l’isolamento: ogni ramo di ricerca esplora il problema per conto suo, senza mai scambiarsi informazioni con gli altri rami. Se sul ramo A salta fuori un’idea geniale per pulire i dati, sul ramo B nessuno lo viene mai a sapere. Il secondo difetto è la mancanza di memoria: a ogni tentativo il sistema si comporta come se quello precedente non fosse mai esistito, senza accumulare esperienza. Il terzo, forse il più subdolo, è la confusione tra strategia e tattica, tra il decidere cosa modificare e il come scriverlo in codice. Il risultato è una tendenza compulsiva a riscrivere tutto da capo a ogni iterazione, con l’eleganza di un elefante in una cristalleria.

Il grafo che impara dai vicini

La prima mossa geniale di MLEvolve riguarda la struttura stessa della ricerca. I metodi tradizionali usano un albero: si parte da una soluzione iniziale, si generano varianti – i rami – e ogni ramo procede indipendentemente. MLEvolve trasforma l’albero in un grafo, aggiungendo dei collegamenti di riferimento che permettono a rami diversi di scambiarsi le buone idee. È come passare da dieci ricercatori che lavorano in stanze insonorizzate a dieci colleghi che si parlano davanti alla macchinetta del caffè.

Ma non finisce qui. Il sistema non esplora sempre allo stesso modo: all’inizio, quando non sa ancora dove sia la ciccia, si lancia a ventaglio mantenendo attivi circa 4,8 rami in media. Man mano che emergono soluzioni promettenti, stringe il cerchio e concentra le risorse solo sulle strade migliori, scendendo a circa 2,8 rami. Insomma, impara da solo quando è il momento di esplorare e quando è il momento di sfruttare.

Una memoria che non si fa la psicanalisi

Il secondo problema – l’amnesia – viene risolto con un’architettura a due livelli. Il primo è una conoscenza statica di partenza, una specie di manuale che contiene modelli pre-validati per vari tipi di compiti: classificazione di immagini, linguaggio naturale, dati tabulari. Quando MLEvolve affronta un problema nuovo, non parte dal buio totale, ma consulta questo librone. Il secondo livello è la vera novità: una memoria globale dinamica che si popola automaticamente durante la ricerca. Ogni esperienza, trionfale o disastrosa che sia, viene archiviata senza bisogno di un altro modello che “rifletta” su di essa con costi aggiuntivi. Prima di prendere una decisione, l’agente interroga questa memoria e recupera le esperienze simili. È come avere un taccuino che si scrive da solo e che, al momento giusto, si apre sulla pagina che ti serve.

Separare il “cosa” dal “come”

Il terzo pilastro è la separazione netta tra pianificazione strategica e generazione di codice. La prima decide “cosa” modificare, per esempio «cambiamo l’ottimizzatore» o «aggiungiamo un layer di normalizzazione». La seconda decide “come” farlo, scegliendo tra tre modalità: riscrittura completa per cambiamenti radicali, modifica a passi graduali per raffinamenti progressivi, o modifiche chirurgiche per correggere un pezzetto specifico senza toccare il resto. Niente più riscritture distruttive. È come se un architetto disegnasse lo spostamento di una parete senza abbattere l’intero palazzo.

I numeri che parlano chiaro

Quando i ricercatori hanno sottoposto MLEvolve al banco di prova standard MLE-Bench, il sistema ha ottenuto un tasso medio di medaglie del 65,3%, superando tutti i metodi esistenti. Fin qui, niente di sorprendente: un nuovo metodo spesso batte i vecchi. La notizia vera è che questo risultato è arrivato in sole 12 ore, esattamente la metà del tempo concesso agli altri approcci. Più bravo e più veloce, come un ricercatore part-time che batte quelli full-time.

Per testare la generalizzazione, il team ha applicato MLEvolve a compiti completamente diversi, come l’ottimizzazione di algoritmi matematici puri, dove non c’entra nulla il machine learning. Il confronto era con AlphaEvolve, un sistema specializzato proprio in quel dominio. Anche lì MLEvolve ha vinto, dimostrando che la sua architettura non è un vestito su misura per un unico problema, ma un approccio generale alla scoperta automatica di algoritmi.

E quindi, il caffè alle 3 di notte non serve più

Il team guidato da Shangheng Du chiude il paper guardando avanti: sperimentazione scientifica automatizzata, scoperta di algoritmi cross-disciplinari, flussi di ricerca autonomi. Stiamo costruendo agenti che non si limitano a eseguire compiti, ma che imparano a migliorare continuamente con l’esperienza accumulata. La vera lezione di MLEvolve è che il salto di qualità nell’intelligenza artificiale non sta solo nella potenza bruta dei modelli linguistici, ma nell’architettura che li orchestra. Un sistema che sa esplorare senza disperdersi, ricordare senza sovraccaricarsi e pianificare senza confondersi. Proprio come farebbe un bravo ingegnere umano. Solo che questo, alle 3 di notte, continua a lavorare senza bisogno di caffè. E vince lo stesso.

Fonti:

Titolo: MLEvolve: A Self-Evolving Multi-Agent Framework for End-to-End Machine Learning Algorithm Discovery
Autori: Shangheng Du, Zhiqiang Xie, Tong Mu, Yao Fu, Cheng Wang, Jia Liu, Jian Tang, Yong Yu, Wei Chen, Li Zhang, Jian Li, Zibin Zheng, Liang Lin
Istituzioni: Sun Yat-sen University (Cina), Tsinghua University, University of Montreal (Mila – Québec AI Institute), Zhejiang University e altri centri internazionali
Pubblicato su arXiv il 6 giugno 2026 (arXiv:2606.06473)

https://arxiv.org/abs/2606.06473

https://doi.org/10.48550/arXiv.2606.06473

MLEvolve: l’IA impara a fare l’ingegnere… e in 12 ore batte tutti

I tre difetti degli apprendisti storditi

Il grafo che impara dai vicini

Una memoria che non si fa la psicanalisi

Separare il “cosa” dal “come”

I numeri che parlano chiaro

E quindi, il caffè alle 3 di notte non serve più

suggeriti

GHOST IN THE SHELL: l’evoluzione della IA secondo Harari

Sanzioni, oligarchi e arbitraggio: geopolitica algoritmica

OSINT 2 – Strumenti Hardware e Software

Latest Articles

Magnoni e qubit: il tallone d’Achille sono i materiali, non la fisica

I Muse e l’arte di spaccare il rock (e 140 chitarre)

La moda dei “report estetici” con l’IA

L’Imprevedibilità di un Chicco di Riso

Karma Chameleon, versione 2.0: vinile, vintage e un po’ di IA