Social Media e Cultura DigitaleTecnologia e MediaTecnologia e Società

L’effetto “DeepSeek”: l’Open Source sta ridefinendo l’Intelligenza Artificiale

È arrivato quell’evento che era inevitabile: il mercato tecnologico globale è stato scosso dalla pubblicazione in open source[1] del modello di IA “DeepSeek” da parte di DeepSeek Technologies, sovvenzionata del fondo speculativo cinese High-Flyer. Ciò ha provocato un’onda d’urto rilevante nei mercati finanziari americani. Un’ottima occasione per mettere in prospettiva tutto quello che finora avevamo intuito, anche a livello mainstream, riguardo all’accessibilità al mercato.

L’open source nell’IA non sfida solo i paradigmi esistenti, ma offre opportunità importanti per tutto il settore. In che senso? Pensa all’open source come a una grande cucina condivisa, dove chiunque possa entrare e contribuire alla ricetta. Invece di dover comprare un ristorante intero (che sarebbe come investire milioni in infrastrutture IA), gli sviluppatori possono semplicemente “prendere in prestito” gli strumenti esistenti e magari aggiungere i loro ingredienti o anche solo usarli per i propri scopi.

Un approccio che sta davvero scuotendo il mercato tradizionale: proseguendo nella metafora, è come se, accanto ai “grandi ristoranti di lusso” (tipo OpenAI[2] e Google) ora spuntino cucine collaborative che preparino piatti altrettanto buoni. LLaMA[3] di Meta e DeepSeek sono esempi perfetti: hanno dimostrato come non servano per forza porte chiuse e ricette segrete per creare qualcosa di eccellente.

Rimane il problema di chi paga il gas e l’elettricità, ovvero i costi di computazione. La buona notizia è che piattaforme quali Hugging Face[4] cercano di risolvere l’incombenza, funzionando come un “grande ristorante condiviso pieno di risorse”, dove tutti possano apprendere dai successi altrui.

Perché, quindi, una grande azienda quale una startup cinese decide di adottare questa strategia di pubblicazione? Per capirlo, dobbiamo guardare all’approccio comune nella Silicon Valley. Esiste una strategia chiamata “Commoditize Your Complement” (“Mercificate il vostro complemento”), che consiste nel rendere gratuito un prodotto che complementa il proprio business principale per indebolire i concorrenti. Meta, che guadagna ad esempio grazie alle piattaforme social, può permettersi di rilasciare gratuitamente LLaMA perché ciò non costituisce il suo core business e così facendo danneggia seriamente OpenAI, che invece vende modelli simili.

È per tale regione che la decisione di DeepSeek Technologies di lanciare DeepSeek in modalità “open” ha sconvolto il mercato azionario: ha causato, infatti, un crollo delle azioni di NVIDIA[5] ed altre aziende del medesimo comparto tecnologico. Le valutazioni, basate sull’idea che solo le grandi aziende potessero sostenere i costi dell’IA, si sono “sgretolate” nel momento in cui DeepSeek ha dimostrato in modo palese che risultati eccellenti si possano ottenere anche mediante investimenti significativamente più contenuti.

Ma come si è fatto a capire che la nuova soluzione avesse prestazioni migliori? Grazie agli strumenti di valutazione, detti “evals[6], che misurano l’efficacia dei modelli tramite liste di controllo per verificarne precisione e affidabilità. Google, ad esempio, ha sviluppato i FACTS[7].

Il segreto sta nel creare un “ground truth“, un insieme di dati preparati a mano considerati come verità di riferimento: il processo, pur complesso, permette di confrontare le risposte del modello con un metro di paragone, verificando se siano corrette. Ma il “ground truth” non è certo universale: riflette i valori e la cultura di chi lo crea, variando quindi sensibilmente tra Europa, Stati Uniti e Cina. Obiettivamente, non è una questione di “malizia”, ma di prospettive culturali diverse.

È altresì evidente come la questione abbia attirato l’attenzione anche in virtù della sua origine cinese, anche se non si tratta esclusivamente di un problema legato alla Cina. La situazione è ben più complessa allorché i giganti tecnologici, già in azione per rispondere alla mossa di Pechino, abbiano sviluppato infrastrutture volte a far fronte ad una domanda crescente, elemento cruciale per la loro stessa sopravvivenza.

Pensate al progetto Stargate[8] di OpenAI e SoftBank: una collaborazione da ben 100 miliardi di dollari solo come investimento iniziale, basata sull’idea di costruire data center od altre infrastrutture atte a sviluppare l’IA negli Stati Uniti. I soldi sono già stati investiti e non possono essere ritirati: si spingerà sul progetto giustificandolo con la narrativa “altrimenti la Cina ci supera!”. Ma c’è anche la necessità delle aziende statunitensi di mantenere la leadership nel settore.

La Cina diventa così un argomento utile a giustificare simili spese mentre ci si impegna per tentare di mantenere l’egemonia in un campo in così rapida evoluzione ma da un innegabile valenza strategica oltre che commerciale.


Note:

[1] Open source si riferisce a software il cui codice sorgente è reso disponibile al pubblico per essere visualizzato, modificato e distribuito liberamente da chiunque: un approccio che promuove la collaborazione e lo sviluppo collettivo, permettendo agli utenti di migliorare il software ed adattarlo alle proprie esigenze.

[2] Fondata nel dicembre 2015, OpenAI è un’organizzazione di ricerca sull’IA avente l’obiettivo di “promuovere e sviluppare intelligenza artificiale amichevole in modo tale a beneficiarne sia l’umanità nel suo complesso”.

[3] LLaMA (Language Model Meta AI) è un modello di IA sviluppato da Meta Platforms, Inc., che elabora e genera testo basandosi su un vasto dataset (insieme) di informazioni preesistenti. Utilizzato principalmente per comprendere e rispondere a domande, riassumere testi e generare contenuti creativi, il modello si basa su tecnologie di apprendimento profondo al fine di analizzare e produrre linguaggio naturale in modo coerente e contestualizzato.

[4] Hugging Face è una società ad impronta fortemente tecnologica che si concentra sull’IA, in particolare sullo sviluppo di tecnologie di elaborazione del linguaggio naturale. È nota per la sua libreria open sourceTransformers“, che fornisce modelli pre-addestrati atti a svolgere vari compiti, quali traduzione automatica,  sintesi testuale e comprensione del testo.

[5] NVIDIA è un’azienda leader nel settore dei semiconduttori, nota soprattutto per la produzione di GPU (unità di elaborazione grafica). Nel contesto dell’IA, NVIDIA gioca un ruolo cruciale nello sviluppo e nella fornitura di hardware e piattaforme software che accelerano il calcolo per l’apprendimento automatico e le applicazioni di deep learning (apprendimento profondo). Le sue tecnologie sono ampiamente utilizzate per l’elaborazione di grandi quantità di dati e per eseguire complessi algoritmi di IA, il che ha reso fino ad oggi l’azienda una componente essenziale nell’ecosistema tecnologico dell’IA.

[6] Per “evals” (abbreviazione di “evaluations“), nel contesto di sistemi di IA, si intende l’insieme dei processi utilizzati per valutare le prestazioni, l’efficacia e l’affidabilità di un modello di IA. I processi in oggetto possono includere test, validazione e revisione continua al fine di assicurare che il modello di IA risponda agli standard desiderati e funzioni correttamente nell’ambiente di applicazione previsto.

[7] FACTS di Google è un ambiente di valutazione della conformità progettato per misurare e migliorare la qualità dei modelli di machine learning (ovvero apprendere dai dati e migliorare automaticamente le proprie prestazioni) in termini di equità, affidabilità, sicurezza e trasparenza. Lo strumento consente agli sviluppatori di identificare e mitigare potenziali bias (preconcetti) nei dati e nelle previsioni dei modelli, garantendo così che le applicazioni siano più “giuste ed affidabili” per tutti gli utenti.

[8] Il progetto Stargate è un’iniziativa congiunta di OpenAI e SoftBank, finalizzata allo sviluppo ed all’implementazione di tecnologie avanzate di IA: mira ad esplorare e sfruttare le capacità dell’IA per affrontare sfide globali significative, promuovendo allo stesso tempo innovazioni che possano essere utilizzate in vari settori industriali e sociali.


Per approfondire, il video completo sul canale YouTube dell’autore:

  • Programmatore che si interroga sull'impatto della tecnologia nelle relazioni umane e sull'interazione uomo-macchina.
    Si interessa particolarmente di come le innovazioni tecnologiche debbano supportare e migliorare la vita delle categorie sociali più vulnerabili, più che il contrario.
    Host del podcast "Occhio al Mondo", dove parla in modo accessibile di tecnologia e web.
    "Sono il tizio che parla di cose di computer su internet"

    Visualizza tutti gli articoli
Ti è piaciuto questo articolo? Apprezzi i contenuti di "Caput Mundi"? Allora sostienici!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *