spot_img

Due cinesi dominano il mercato globale: le IA DeepSeek e Qwen

Se maggio è stato dedicato dai cristiani alla Madonna, dagli antichi Greci alla dea Artemide e dai latini a Flora, dal 2025, gennaio potrebbe essere ricordato come il mese delle Intelligenze Artificiali cinesi, potenziali divinità delle tecnoreligioni emergenti.

Dopo il lancio di DeepSeek, un altro colosso tecnologico fa il suo ingresso nel panorama dell’intelligenza artificiale evoluta con la sua creatura: Qwen. Entrambe le intelligenze artificiali citate non sono nuove, ma è solo ora, con il rilascio delle versioni più avanzate, che vengono presentate al mondo in tutto il loro splendore.
Mentre il nome DeepSeek è di immediata comprensione, quello della nuova arrivata è più criptico: Qwen è infatti la contrazione di Tongyi Qianwen, che tradotto significa: “Comprendere l’universo attraverso mille domande”. Dietro tanta saggezza asiatica c’è Alibaba Group, che nel 2024 ha registrato un fatturato di 941.168 miliardi di yen (pari a circa 130,35 miliardi di dollari).

A gestire la nuova Intelligenza Artificiale è Alibaba Cloud, il braccio tecnologico del colosso cinese che controlla anche piattaforme come AliExpress. Da sempre votata a supportare le aziende di tutto il mondo, Alibaba favorisce i rapporti commerciali con la Cina, movimentando una mole impressionante di materie prime e prodotti finiti. Già nel marzo 2013 The Economist gli dedicò la copertina e un articolo intitolato “The Alibaba Phenomenon”.

Qwen ha una parte accessibile a tutti…
La parte dedicata al pubblico, accessibile gratuitamente, è disponibile all’indirizzo https://chat.qwenlm.ai/. Qui troverete tutte le versioni di Qwen 2.5, tra cui Qwen 2.5 Plus, Qwen 2.5 Max, Qwen2.5-14B-Instruct-1M, QVQ-72B-Preview e Qwen2.5-VL-72B-Instruct. Potrete decidere quale versione si adatta meglio alle vostre esigenze e impostarla come predefinita*.
La punta dell’iceberg è un’interfaccia che vi permette di creare codici, artefatti digitali, testi, foto e video.

(*)Al momento in cui scriviamo vi sono diversi malfunzionamenti, forse dovuti all’elevato numero di visitatori.

… e una destinata alle aziende
Il vero punto di forza di questa intelligenza artificiale non è l’interfaccia accessibile a tutti, ma la gestione flessibile dell’intero ecosistema, che sarà adattabile a qualsiasi azienda esistente al mondo, sia essa dedicata alla fornitura di beni o servizi (questa versione, presumibilmente, sarà a pagamento).
Qwen 2.5 sarà personalizzabile per imprese di ogni dimensione e settore, offrendo soluzioni tecnologiche avanzate per ogni fase del processo: ideazione, produzione, gestione e commercializzazione.

Facciamo un esempio: avete un’azienda automobilistica? Qwen 2.5 vi aiuterà a progettare o adattare i capannoni per i robot di produzione, a modificare robot già in commercio per integrarli nel vostro ciclo produttivo e a creare algoritmi specializzati per istruire e gestire i robot, tutto alla velocità di un click. Ma non finisce qui: Qwen 2.5 vi troverà i fornitori di materie prime al miglior prezzo, vi creerà un software gestionale personalizzato per l’amministrazione aziendale e del personale, individuerà il vostro mercato di riferimento anticipando le tendenze attraverso modelli predittivi e ottimizzerà la produzione in base alla domanda. Inoltre, vi aiuterà a creare punti vendita fisici e piattaforme e-commerce, gestendo anche i pezzi di ricambio e i servizi post-vendita.

Tutto questo sarà disponibile per ogni realtà aziendale, dalla piccola e media impresa alla multinazionale.

Architettura e funzionamento:
la prima versione beta di Qwen, basata sul modello LLM Llama sviluppato da Meta, è stata rilasciata nell’aprile 2023.
Nel giugno 2024 Alibaba ha lanciato Qwen 2 e a settembre ha reso open source alcuni dei suoi modelli. Qwen, come DeepSeek, utilizza un mix di algoritmi avanzati, dimostrando prestazioni eccellenti in ambito matematico e statistico.
Nel luglio 2024 Qwen è stato classificato come il miglior modello di lingua cinese in alcuni benchmark, posizionandosi al terzo posto a livello mondiale, dietro ai modelli di punta di Anthropic e OpenAI.
È importante chiarire che queste intelligenze artificiali non utilizzano un “mix di esperti” (Mixture of Experts, MoE) nel senso classico del termine. Ecco i perché:

Architettura Densa
 sia DeepSeek che Qwen si basano su un modello di tipo dense Transformer, in cui tutti i parametri (i pesi della rete) vengono attivati per ogni input, sebbene in modo differenziato, grazie ai meccanismi di attenzione. Non ci sono “esperti” separati o sottoreti specializzate a cui le domande vengono indirizzate.

Differenza con il MoE
Alcuni modelli moderni, come certi LLM avanzati (ad esempio GPT-4 o modelli open-source come Mixtral), utilizzano effettivamente una Mixture of Experts, dove solo un sottoinsieme di “esperti” (blocchi di parametri) viene attivato per ogni input. Tuttavia, questa non è l’architettura standard di GPT-3.5 o delle versioni precedenti.

La conoscenza è distribuita in modo olistico in tutta la rete.
Quando ricevono una domanda, l’intero modello partecipa alla generazione della risposta, ma i meccanismi di attenzione selezionano dinamicamente quali parti della rete sono più rilevanti per il contesto.
Non c’è una “selezione manuale” di esperti, ma un’attivazione automatica di pattern appresi.
Esempio pratico:
Se chiedi una ricetta, i neuroni associati a parole come “ingredienti”, “cottura” o “temperatura” si attiveranno maggiormente, mentre una domanda sulla meccanica quantistica attiverà percorsi legati a concetti fisici e matematici. Tutto avviene in modo fluido, senza “interruttori” espliciti.

Un nuovo capitolo nella corsa tecnologica
Il lancio ufficiale di queste intelligenze artificiali rappresenta non solo un passo avanti significativo nella corsa tecnologica cinese, ma anche un elemento di destabilizzazione per i mercati tecnologici mondiali. Mentre DeepSeek punta a essere uno strumento versatile per sviluppatori e ricercatori, Qwen si propone come un alleato strategico per le grandi aziende, con un focus su automazione, analisi dati e ottimizzazione dei processi.

Caratteristiche comuni
Entrambe sono open source e possono funzionare anche su hardware non di ultimissima generazione. Immaginate quali straordinarie performance potrebbero offrire sui futuri computer quantistici. Inoltre, sono in grado di “imparare” e “correggersi autonomamente”, sfruttando il loro ecosistema interno.

Come funzionano l’auto-apprendimento e l’auto-correzione
Apprendimento continuo: utilizzano algoritmi di machine learning basati su grandi quantità di dati. Più dati ricevono, più “imparano” a riconoscere pattern, rispondere in modo accurato e migliorare le prestazioni.
Essere open source e gratuiti rappresenta un vantaggio significativo, specialmente nella fase di lancio, poiché permette di raccogliere dati e feedback da un’ampia gamma di utenti.

  • Feedback e correzione
    quando un utente fornisce feedback (es. “La risposta è sbagliata” o “Non è quello che cercavo”), il sistema registra queste informazioni e le usa per aggiustare il modello.
    Ad esempio, se l’IA sbaglia una risposta, il feedback aiuta a evitare lo stesso errore in futuro.
    DeepSeek ha un ecosistema integrato che gli permette di analizzare i propri errori e ottimizzare i processi. Questo include:
  • auto-valutazione
    confronta le risposte con dati affidabili per verificare l’accuratezza.
  • aggiornamenti automatici
    integra nuovi dati e migliora i modelli senza intervento umano diretto.
  • Adattamento dinamico
    possono adattarsi a nuovi contesti o domande, grazie a meccanismi come l’attenzione dinamica (che “focalizza” le parti più rilevanti dei dati) e l’apprendimento transfer (usare conoscenze pregresse per risolvere nuovi problemi).
    Esempio pratico
    Se viene chiesta una traduzione e il risultato è errato, il feedback negativo dell’utente aiuta a migliorare le traduzioni future. Allo stesso modo, l’IA può correggere errori nei suoi algoritmi di analisi dati o ottimizzazione dei processi. In sintesi, come è successo per GPT, l’apprendimento continua attraverso l’interazione in rete.

Pedagogia computazionale.
L’auto-apprendimento e l’auto-correzione del modello cinese di IA stanno delineando il futuro della Pedagogia computazionale.
Magari presto, come ipotizza Mario Caligiuri in un articolo comparso su Wired, questo sarà il modo di formare la nuova “Umanità Generativa”: incrementando il quoziente intellettivo umano attraverso un’istruzione “distillata” da insegnanti artificiali, con o senza interfacce neurali.


La collaborazione tra uomo e IA è ampiamente auspicata dal manifesto dell’Umanità Generativa di ItaloRed, che riportiamo in calce.


In generale, possiamo quindi concludere che l’intelligenza artificiale cinese, con modelli come DeepSeek e Tongyi Qianwen, sta ridefinendo l’innovazione tecnologica globale e, nello specifico, che Qwen 2.5 rappresenta una forte accelerazione nell’automazione aziendale e nell’analisi dei dati.

by Roosteram

Fonti:
I sistemi di funzionamento delle AI sono tratti da quanto dichiarato nei documenti ufficiali rilasciati dalle case produttrici

https://financialit.net/news/cloud/alibaba-cloud-named-leader-public-cloud-platforms-report
https://www.businesstimes.com.sg/companies-markets/telcos-media-tech/alibaba-unveils-big-cloud-price-cuts-as-ai-rivalry-deepens

https://www.vpsbenchmarks.com/compare/alibaba_vs_lightsail

https://www.economist.com/leaders/2013/03/23/the-alibaba-phenomenon

https://www.wired.it/article/intelligenza-artificiale-algoritmi-educativi-scuola

suggeriti

- Advertisement -spot_img

Latest Articles

INFORMATIVA  cookie policy 
Su questo sito utilizziamo strumenti di
prime o terze parti che memorizzano
piccoli file (cookie) sul tuo dispositivo.
I cookie sono normalmente utilizzati
per consentire il corretto funzionamento
del sito (cookie tecnici),

UTILIZZIAMO SOLO COOKEI TECNICI ESSENZIALI

ATTENZIONE!
SE DISABILITI i cookie NON POTRAI:
visualizzare
filmati di YOUTUBE, ANIMAZIONI
ed altre FUNZIONI.