DeepSeek, una giovane startup cinese specializzata in intelligenza artificiale, ha rapidamente attirato l'attenzione della Silicon Valley, suscitando sorpresa e preoccupazione. Fondata poco più di un anno fa, l'azienda ha presentato modelli di intelligenza artificiale capaci di competere con i migliori chatbot esistenti, ma con costi di sviluppo significativamente inferiori. Il successo di DeepSeek potrebbe sfidare la convinzione diffusa secondo cui il progresso nell'intelligenza artificiale richiederà risorse computazionali ed energetiche sempre maggiori.
Il 27 gennaio, le principali aziende tecnologiche globali hanno registrato un forte calo in borsa, mentre cresceva l’entusiasmo per le innovazioni di DeepSeek. Gli investitori hanno iniziato a valutare le possibili conseguenze per le aziende rivali negli Stati Uniti e per i fornitori di hardware AI, come Nvidia Corp.
Fondata nel 2023 da Liang Wenfeng, ex leader del fondo speculativo quantitativo High-Flyer basato sull’intelligenza artificiale, DeepSeek sviluppa modelli AI open source, permettendo alla comunità di sviluppatori di esaminarli e migliorarli. La sua app mobile, rilasciata a gennaio, ha rapidamente scalato le classifiche di download per iPhone negli Stati Uniti.
Rispetto ad altri chatbot, come ChatGPT di OpenAI, DeepSeek si distingue per la capacità di spiegare il proprio processo di ragionamento prima di fornire una risposta. L’azienda sostiene che la sua versione R1 sia all’altezza dell’ultima iterazione di ChatGPT. Inoltre, DeepSeek offre licenze a sviluppatori e aziende a un costo inferiore rispetto a quello richiesto da OpenAI per un accesso simile.
Liang Wenfeng è nato nella provincia cinese del Guangdong nel 1985. Ha conseguito laurea e master in ingegneria elettronica e informatica presso la Zhejiang University e non ha mai studiato o lavorato fuori dalla Cina continentale.
Ha avviato DeepSeek con un capitale iniziale di 10 milioni di yuan (circa 1,4 milioni di dollari), secondo i dati del database aziendale Tianyancha.
Secondo Liang, il principale ostacolo alla crescita di DeepSeek non è la mancanza di fondi, ma le restrizioni imposte dagli Stati Uniti sull’accesso ai chip di ultima generazione. In un’intervista con il media cinese 36kr, ha sottolineato che molti dei suoi migliori ricercatori sono neolaureati delle università più prestigiose della Cina e ha evidenziato la necessità di costruire un ecosistema tecnologico nazionale simile a quello sviluppato attorno a Nvidia e ai suoi processori IA.
Liang ha dichiarato: “Più investimenti non significano necessariamente più innovazione. Se fosse così, le grandi aziende monopolizzerebbero tutte le innovazioni”.
Sebbene sia stato paragonato a Sam Altman, il CEO di OpenAI, Liang mantiene un profilo decisamente più riservato e raramente appare in pubblico.
Secondo DeepSeek, il modello R1 raggiunge o supera le prestazioni di rivali consolidati in vari test di riferimento, tra cui AIME 2024 per la matematica, MMLU per la conoscenza generale e AlpacaEval 2.0 per la valutazione delle risposte. Inoltre, si posiziona tra i migliori modelli nella classifica Chatbot Arena, affiliata all’Università di Berkeley.
Sebbene l'azienda non abbia rivelato dettagli precisi sui costi di sviluppo, sembra che l’addestramento dei suoi modelli sia notevolmente meno oneroso rispetto alle soluzioni proposte da OpenAI o Meta Platforms Inc. Questa efficienza mette in discussione la necessità di ingenti investimenti in hardware AI avanzato, come gli acceleratori prodotti da Nvidia. Inoltre, evidenzia i limiti delle restrizioni statunitensi sulle esportazioni di semiconduttori avanzati verso la Cina, che avrebbero dovuto frenare lo sviluppo di tecnologie come quella di DeepSeek.
L'azienda di intelligenza artificiale è stata sotto osservazione fin dal lancio del suo primo modello nel 2023. Tuttavia, è stato a novembre che ha suscitato grande interesse presentando DeepSeek R1, un modello progettato per simulare il ragionamento umano. Questa tecnologia ha dato vita al chatbot di DeepSeek, che ha rapidamente guadagnato popolarità come alternativa più economica a OpenAI. L'investitore Marc Andreessen lo ha descritto come “il momento Sputnik dell’IA”.
Secondo la società di analisi App Figures, entro il 25 gennaio l’app mobile di DeepSeek era stata scaricata 1,6 milioni di volte, conquistando il primo posto negli store di iPhone in Australia, Canada, Cina, Singapore, Stati Uniti e Regno Unito.
Da quando ChatGPT ha scatenato la corsa globale all’intelligenza artificiale, gli investitori hanno puntato sull’idea che i progressi nel settore avrebbero richiesto chip sempre più avanzati, come quelli prodotti da Nvidia.
L’avanzamento di DeepSeek, però, dimostra che è possibile ottenere prestazioni di alto livello con hardware meno sofisticato e a costi più contenuti. Questo ha scatenato un’ondata di vendite sulle azioni di Nvidia, che il 27 gennaio hanno perso il 17%, cancellando 589 miliardi di dollari di capitalizzazione di mercato, un record storico. Anche ASML Holding NV, produttrice di macchinari per semiconduttori, e altre aziende legate all’hardware per l’IA hanno subito un calo significativo.
L’ascesa di DeepSeek mette in discussione le ingenti spese sostenute da giganti come Meta e Microsoft, che quest’anno hanno pianificato investimenti per oltre 65 miliardi di dollari, in gran parte destinati all’infrastruttura IA. Tuttavia, mentre le azioni di Meta e Microsoft hanno aperto in ribasso, il titolo Meta è riuscito a recuperare nel corso della giornata, chiudendo in positivo. Nel frattempo, le aziende cinesi legate a DeepSeek, come Iflytek Co., hanno visto i loro titoli salire.
Alcuni analisti ritengono che l’innovazione di DeepSeek potrebbe beneficiare l’intero settore, spingendo OpenAI e altri player statunitensi a ridurre i prezzi e accelerando così l’adozione di soluzioni di intelligenza artificiale.
L’intelligenza artificiale è un campo cruciale nella rivalità tecnologica tra Stati Uniti e Cina. Washington ha imposto restrizioni all’export di componenti avanzati, come le unità di elaborazione grafica di fascia alta, nel tentativo di limitare i progressi della Cina nel settore.
I successi di DeepSeek suggeriscono che gli ingegneri cinesi abbiano trovato soluzioni alternative, migliorando l’efficienza dei loro modelli nonostante le limitazioni sui chip avanzati. Tuttavia, resta incerto fino a che punto DeepSeek abbia avuto accesso a hardware di ultima generazione per l’addestramento dei suoi modelli.
Nel frattempo, sviluppatori di tutto il mondo stanno sperimentando il software di DeepSeek, contribuendo alla creazione di nuovi strumenti basati su questa tecnologia. Questo potrebbe portare a un miglioramento dell’efficienza dei modelli IA anche per le aziende statunitensi e accelerare la diffusione di algoritmi di ragionamento avanzato.
L’innovazione di DeepSeek potrebbe anche spingere i regolatori a stabilire normative più precise su come e per quali scopi questi modelli possano essere utilizzati.
Un’altra questione riguarda la sicurezza dei dati: l’app di DeepSeek raccoglie una grande quantità di informazioni e le archivia su server cinesi, sollevando dubbi sulla privacy e sulla protezione dei dati dei cittadini statunitensi. Tuttavia, il fatto che i modelli di DeepSeek siano open source apre la possibilità che gli sviluppatori americani possano eseguire il software senza interagire con i server cinesi.
Le principali aziende tecnologiche cinesi, tra cui Alibaba, Baidu e Tencent, stanno investendo ingenti risorse per acquisire hardware avanzato e ampliare la loro base di utenti nel settore IA. Accanto alla startup 01.AI di Kai-Fu Lee, DeepSeek si distingue per il suo approccio open source, volto ad attirare rapidamente un vasto numero di sviluppatori prima di elaborare strategie di monetizzazione.
L’accessibilità dei modelli di DeepSeek ha già contribuito a ridurre i costi per gli sviluppatori IA in Cina. I principali attori del settore sono impegnati in una guerra dei prezzi, che negli ultimi 18 mesi ha portato a una serie di ribassi successivi.
Come molti modelli IA cinesi, DeepSeek applica una forma di autocensura su argomenti considerati delicati dal governo. Ad esempio, evita di rispondere a domande sulle proteste di Piazza Tienanmen del 1989 o su scenari geopolitici controversi, come una possibile invasione di Taiwan.
Nei test, il chatbot di DeepSeek fornisce risposte dettagliate su figure politiche come il primo ministro indiano Narendra Modi, ma evita di fare lo stesso per il presidente cinese Xi Jinping.
Inoltre, l’improvvisa popolarità dell’app potrebbe mettere alla prova la sua infrastruttura cloud. Il 27 gennaio, DeepSeek ha subito un’interruzione significativa e dovrà affrontare ulteriori sfide per gestire il crescente volume di utenti e richieste.
Immagine di copertina: Depositphotos.com