A quanto pare, la startup cinese di intelligenza artificiale DeepSeek ha deciso di scuotere il tavolo da gioco, e lo ha fatto con una mossa tanto silenziosa quanto dirompente. Martedì scorso, senza troppi squilli di tromba, ha reso disponibile su Hugging Face il suo ultimo gioiello: un modello da 685 miliardi di parametri che, nei fatti, lancia una sfida diretta ai giganti americani dell’IA come OpenAI e Anthropic.
Il modello, battezzato DeepSeek V3.1, non è solo una questione di potenza bruta. La vera notizia, quella che dovrebbe farci riflettere, è che è stato rilasciato in modalità open-source. Una mossa che, al di là dei tecnicismi, ridisegna la mappa della competizione tecnologica globale, sottraendola, almeno in parte, alle logiche proprietarie e alle tensioni geopolitiche che dominano il settore.
Nel giro di poche ore, la comunità di sviluppatori e ricercatori se n’è accorta, e i primi test hanno iniziato a circolare. I risultati? Sorprendenti. I punteggi ottenuti su benchmark prestigiosi, come l’Aider per la programmazione, non solo tengono testa ma a volte superano quelli di sistemi proprietari blasonati. E tutto questo, con un modello accessibile a chiunque abbia le risorse computazionali per scaricarlo.
In questo articolo
- La sfida open-source alla Silicon Valley
- Un’architettura ibrida che fa la differenza
- La mossa cinese sullo scacchiere geopolitico dell’IA
- Oltre l’hype: i conti con la realtà e le criticità nascoste
- Il lato oscuro del “bene pubblico”: lavoro e sfruttamento nell’era dell’IA
- Un nuovo paradigma o un’illusione ben costruita?
La sfida open-source alla Silicon Valley
Il rilascio di DeepSeek V3.1 non è un semplice aggiornamento tecnologico. È un segnale forte e chiaro di un cambio di paradigma nello sviluppo e nella distribuzione dei sistemi di intelligenza artificiale più avanzati. Mentre le aziende americane blindano i loro modelli di punta dietro API costose e restrizioni d’uso, vedendoli come proprietà intellettuale da monetizzare, DeepSeek ha scelto una via radicalmente diversa, che riflette un approccio strategico più ampio della Cina.
Poche settimane dopo la presentazione in pompa magna di GPT-5 di OpenAI e Claude 4 di Anthropic, DeepSeek ha dimostrato che è possibile raggiungere prestazioni simili, se non superiori in alcuni ambiti, e offrirle al mondo. Questo attacco non è solo tecnologico, ma colpisce al cuore il modello di business su cui si fonda la leadership americana nel settore.
Su Aider, un benchmark che misura le capacità di programmazione, DeepSeek V3.1 ha ottenuto un punteggio del 71.6%, posizionandosi ai vertici della classifica e sfidando direttamente i concorrenti. L’aspetto forse più impressionante è il rapporto costo-efficacia: secondo le prime analisi della community, il modello cinese offre questi risultati a una frazione del costo operativo dei rivali, un fattore che potrebbe renderlo estremamente attraente per le aziende.
Un’architettura ibrida che fa la differenza
Ma come fa DeepSeek V3.1 a raggiungere queste prestazioni? Il segreto, a quanto pare, risiede in quella che l’azienda definisce una “architettura ibrida”. A differenza dei tentativi passati di combinare diverse specializzazioni, che spesso producevano modelli mediocri in tutto, V3.1 sembra integrare in modo efficace capacità di conversazione, ragionamento e programmazione in un unico sistema coerente.
Il modello è in grado di processare fino a 128.000 token di contesto (l’equivalente di un libro di circa 400 pagine) mantenendo una velocità di risposta notevole. Inoltre, i ricercatori hanno scoperto la presenza di “token speciali” che abilitano capacità di ricerca web in tempo reale e processi di ragionamento interni, risolvendo di fatto alcuni dei problemi che avevano afflitto i precedenti modelli ibridi.
Questo non è solo un dettaglio per addetti ai lavori. Significa che il modello può attingere a informazioni aggiornate e “pensare” in modo più complesso prima di rispondere, il tutto senza i ritardi che spesso caratterizzano i sistemi basati sul ragionamento puro. Per le imprese che gestiscono migliaia di interazioni AI al giorno, la differenza in termini di costi e prestazioni potrebbe tradursi in milioni di dollari di risparmi.
La mossa cinese sullo scacchiere geopolitico dell’IA
La strategia open-source di DeepSeek e di altre “sei tigri” dell’IA cinese, come le definisce qualcuno, è una mossa calcolata. Pechino ha elaborato una strategia nazionale che considera lo sviluppo dell’IA una questione di sicurezza nazionale e sopravvivenza economica. Invece di bloccare i modelli, ne incoraggia la diffusione per accelerare l’innovazione interna ed erodere il predominio tecnologico statunitense. È una forma di soft power tecnologico: perché pagare per un’API americana quando si può avere un modello altrettanto potente, personalizzabile e senza restrizioni?
Questa “democratizzazione” dell’IA, tuttavia, non è priva di implicazioni. Permette a chiunque, inclusi attori statali e non, di accedere a tecnologie potentissime, con tutti i rischi che ne conseguono. Esempi recenti, come lo sviluppo di potenziali strumenti militari cinesi basati sul modello Llama di Meta, dimostrano che queste preoccupazioni sono tutt’altro che infondate.
Oltre l’hype: i conti con la realtà e le criticità nascoste
Certo, la narrazione è affascinante. Ma come ogni giornalista sa, è necessario guardare oltre la facciata. DeepSeek, nonostante si presenti come una “piccola startup indipendente”, ha legami significativi con entità statali e militari cinesi, come evidenziato da diversi report. Queste connessioni sollevano seri interrogativi sulla privacy dei dati e sulla potenziale manipolazione dell’informazione.
Un’indagine del Congresso USA ha rivelato che l’infrastruttura di DeepSeek è collegata a China Mobile, una compagnia di telecomunicazioni statale inserita nella lista nera dal governo americano. Ciò significa che i dati degli utenti potrebbero essere accessibili alle autorità di Pechino, un rischio non trascurabile. Inoltre, come altri modelli cinesi, anche quello di DeepSeek mostra una forte tendenza a censurare argomenti politicamente sensibili per il Partito Comunista Cinese, funzionando di fatto come un braccio della propaganda di stato.
Il lato oscuro del “bene pubblico”: lavoro e sfruttamento nell’era dell’IA
C’è un altro aspetto, forse il più importante dal mio punto di vista, che la retorica dell’open-source come “bene pubblico” tende a oscurare: il lavoro umano che sta dietro a queste macchine. Che un modello sia open-source o proprietario, il suo sviluppo si basa su un’enorme catena di valore che spesso include il lavoro precario e sottopagato dei cosiddetti “data labeler”.
Come ha rivelato un’inchiesta di TIME, persino giganti come OpenAI hanno fatto ricorso a lavoratori keniani, pagati meno di 2 dollari l’ora, per “ripulire” i dati di addestramento di ChatGPT da contenuti tossici. Questo fenomeno, una sorta di “colonialismo digitale”, concentra ricchezza e potere in cima alla piramide, principalmente nel Nord globale, sfruttando il lavoro invisibile e spesso psicologicamente dannoso di persone nel Sud del mondo. L’open-source non cambia questa dinamica di fondo; anzi, potrebbe persino aggravarla, creando l’illusione di un’economia del dono che in realtà si poggia su fondamenta di sfruttamento.
Un nuovo paradigma o un’illusione ben costruita?
Insomma, il caso DeepSeek V3.1 è emblematico. Da un lato, rappresenta un’innegabile conquista tecnologica e una scossa al monopolio occidentale. Dall’altro, è un perfetto esempio di come l’intelligenza artificiale, anche quando si veste con gli abiti “democratici” dell’open-source, possa diventare uno strumento per concentrare ricchezza e potere, sfruttando competenze dal basso e sollevando questioni etiche e geopolitiche enormi.
La vera sfida non è solo tecnica, ma politica e sociale. La corsa all’IA non riguarda più solo chi costruisce il sistema più potente, ma chi riesce a renderlo più accessibile e a dettarne le regole. E in questa gara, la “scarsità artificiale” imposta dai modelli proprietari potrebbe rivelarsi un’arma a doppio taglio. DeepSeek ha dimostrato che il re è nudo. Ora sta a noi decidere se ammirare i vestiti nuovi o notare che, dietro il luccichio della tecnologia, si nascondono le solite, vecchie dinamiche di potere.
