spot_img

La vera Open AI è cinese e impara da sola: DeepSeek R1

Mentre i propositi di Altman e Musk riguardo a Open AI, che di “open” ha ben poco, rimangono largamente disattesi, la vera rivoluzione nell’ambito dell’intelligenza artificiale open source arriva dalla Cina. Si tratta di DeepSeek R1, un’IA che impara in modo autonomo e rappresenta un significativo passo avanti nel settore.

Fondata da Liang Wenfeng, imprenditore cinese nato nel 1985 nella provincia di Guangdong (considerata la nuova Silicon Valley cinese), DeepSeek si distingue per il suo approccio innovativo e accessibile.

L’annuncio della R1 è stato fatto il giorno dell’insediamento di Trump alla Casa Bianca, un evento simbolico che ha coinciso con un’ondata di reazioni nei mercati finanziari, mettendo in discussione il primato delle big tech statunitensi. La R1 è un esempio di efficienza: offre prestazioni eccellenti utilizzando hardware di alta qualità, sebbene non di ultimissima generazione, dimostrando che è possibile raggiungere risultati di alto livello nonostante le restrizioni imposte dall’embargo tecnologico statunitense.

Prestazioni superiori e costi ridotti
I benchmark di DeepSeek R1 hanno attirato l’attenzione globale. I test evidenziano capacità matematiche nettamente superiori rispetto a ChatGPT-4, il modello più avanzato di Open AI, mentre le altre prestazioni sono comparabili, se non migliori, a costi significativamente inferiori.

Il segreto di questa efficienza risiede nell’architettura software, che utilizza algoritmi e modelli di apprendimento strutturati in modo innovativo. Un approccio simile a quello dei software open-source, come le distribuzioni Linux, che garantiscono ottime prestazioni anche su hardware meno recente.

Open-source, accessibile ed economica
DeepSeek R1 promette non solo di essere all’avanguardia, ma anche un progetto per tutti. Il codice è open-source, l’accesso è attualmente gratuito e gli investimenti richiesti per il suo sviluppo sono stati significativamente inferiori rispetto a quelli di Open AI. Secondo alcuni rumors, riportati anche da testate giornalistiche autorevoli, il costo del progetto è stato stimato tra le 20 e le 50 volte inferiore rispetto a quello delle rivali made in USA. Sebbene questi dati siano stati messi in discussione, anche ipotizzando un risparmio del 50%, si tratta di un risultato straordinario che dimostra come sia possibile ottenere prestazioni eccellenti ottimizzando al massimo le risorse disponibili.

High-Flyer: il colosso dietro DeepSeek
Dietro DeepSeek e il suo fondatore Liang Wenfeng c’è High-Flyer, un’azienda valutata 7 miliardi di dollari (dati ottobre 2024) e specializzata in intelligenze artificiali per analisi predittive nel trading e nei mercati finanziari. Il team di High-Flyer è composto da un gruppo multidisciplinare di esperti, tra cui matematici, fisici, informatici e specialisti di mercati finanziari, il che spiega le eccellenti performance della R1 in ambito matematico e statistico. Come si evince dai dati, non si tratta di una startup da garage nata da giovani squattrinati.

Nel 2020, High-Flyer ha investito circa 1 miliardo di yuan per costruire Fire-Flyer, un supercomputer dotato di 10.000 GPU Nvidia A100. Nel 2023, l’azienda ha annunciato la creazione di DeepSeek, un nuovo organismo di ricerca dedicato all’esplorazione dell’intelligenza artificiale generale.

Innovazioni chiave di DeepSeek R1
DeepSeek R1 introduce diverse innovazioni che ne definiscono l’eccellenza:

  1. Memoria selettiva:
    • Filtraggio delle informazioni: R1 seleziona e memorizza solo i dati rilevanti per il compito specifico, eliminando quelli ridondanti o non essenziali.Assegnazione di priorità: le informazioni vengono conservate in base alla loro importanza e frequenza d’uso, scartando quelle temporanee.Adattamento contestuale: i dati vengono aggiornati in tempo reale per mantenere coerenza e accuratezza.
    Questo approccio consente a R1 di utilizzare solo il 5% della memoria rispetto ad altre IA, garantendo prestazioni ottimali anche su hardware non di ultima generazione.
  2. Mixture of Experts (MoE):
    R1 utilizza algoritmi specializzati per ogni settore, attivando solo gli esperti competenti per il compito richiesto. Ad esempio, per un quesito medico, vengono coinvolti solo gli algoritmi di medicina, farmacologia ed epidemiologia, senza interpellare inutilmente esperti di altri campi.
  3. Apprendimento per distillazione:
    DeepSeek R1 ha sfruttato la tecnica della distillazione della conoscenza, trasferendo le competenze di un modello più grande (il “modello insegnante”) a uno più piccolo (il “modello studente”). A differenza di altre IA, R1 non è stata limitata da eccessive restrizioni, ma è stata lasciata libera di apprendere in modo equilibrato, riducendo il rischio di “allucinazioni” computazionali.


Con DeepSeek R1, la Cina non sta solo sfidando il dominio tecnologico degli USA: sta ridefinendo le regole del gioco. Questa IA non è solo più efficiente e accessibile, ma rappresenta un passo avanti verso una pedagogia computazionale”, in cui le macchine imparano in modo autonomo ed equilibrato, aprendo scenari inediti per il futuro dell’intelligenza artificiale.

Dopo i termini Primate Digitale e Umanità Generativa Italo Red arricchisce il proprio vocabolario con il termine ‘pedagogia computazionale’.

by Roosteram

“P.S.: Chissà se l’esperienza nei mercati finanziari degli esperti di High-Flyer sia stata utile per destabilizzare gli investitori delle Big Tech statunitensi.” 

suggeriti

- Advertisement -spot_img

Latest Articles

INFORMATIVA  cookie policy 
Su questo sito utilizziamo strumenti di
prime o terze parti che memorizzano
piccoli file (cookie) sul tuo dispositivo.
I cookie sono normalmente utilizzati
per consentire il corretto funzionamento
del sito (cookie tecnici),

UTILIZZIAMO SOLO COOKEI TECNICI ESSENZIALI

ATTENZIONE!
SE DISABILITI i cookie NON POTRAI:
visualizzare
filmati di YOUTUBE, ANIMAZIONI
ed altre FUNZIONI.