Così il DeepSeek cinese ha buggerato l’America

Effettua la tua ricerca

More results...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Filter by Categories
#finsubito

Contributi e agevolazioni

per le imprese

 




Ultim’ora news 28 gennaio ore 20

Sconto crediti fiscali

Finanziamenti e contributi

 


Singapore – Prendete un team di giovani ingegneri cinesi, assunti da un capo che disprezza l’esperienza. Aggiungete alcune scorciatoie di programmazione intelligenti e una scappatoia nelle regole americane che ha permesso loro di ottenere chip avanzati.

Questa è la formula con cui la cinese DeepSeek ha sconvolto il mondo con i suoi programmi di intelligenza artificiale.

Secondo il pensiero convenzionale, lo sviluppo di un’intelligenza artificiale all’avanguardia richiedeva una miriade di chip costosi e all’avanguardia, e le aziende cinesi avrebbero avuto difficoltà a competere perché non erano in grado di procurarsi tali chip. DeepSeek ha sfidato queste previsioni con un’intraprendenza che ha portato a un bagno di sangue da 1.000 miliardi di dollari a Wall Street lunedì 26 e sta spingendo la Silicon Valley a ripensare il proprio approccio sul tema.

L’azienda cinese ha anche dato una sveglia a Washington, secondo il presidente Trump, la cui amministrazione deciderà nei prossimi mesi cosa fare delle politiche dell’era Biden che limitano l’accesso della Cina ai migliori chip per l’AI.

L’hub tecnologico di Hangzhou

Il leader di DeepSeek, Liang Wenfeng, ha costruito la sua azienda nell’hub tecnologico di Hangzhou, la stessa città dove ha sede il gigante tecnologico Alibaba. L’azienda di AI è nata da un hedge fund co-fondato da Liang che utilizza l’AI per trovare operazioni redditizie sui mercati finanziari.

In un’intervista rilasciata a una pubblicazione cinese nel 2023, Liang ha dichiarato che la maggior parte delle posizioni tecniche erano occupate da neolaureati o da persone con uno o due anni di esperienza.

L’esperienza, ha detto, è un potenziale ostacolo. «Quando si fa qualcosa, le persone esperte ti dicono senza esitazione che dovresti farlo in questo modo, ma le persone inesperte devono ripetutamente esplorare e pensare seriamente a come farlo, per poi trovare una soluzione che si adatti alla situazione attuale», ha detto Liang.

Quello che hanno escogitato è ora oggetto di studio da parte delle migliori e più brillanti menti della Silicon Valley.

Carta di credito con fido

Procedura celere

 

La tattica di DeepSeek

Fino a poco tempo fa, i pionieristici modelli di intelligenza artificiale che sono alla base di programmi come ChatGPT di OpenAI venivano addestrati su una vasta raccolta di testi, immagini e altri dati. Impiegavano algoritmi specializzati per trovare schemi che un chatbot potesse utilizzare per tenere una conversazione.

La tattica di DeepSeek è stata quella di ridurre l’elaborazione dei dati necessari per addestrare i modelli, utilizzando alcune invenzioni proprie e tecniche adottate da aziende cinesi di AI con vincoli simili.

Immaginate le prime versioni di ChatGPT come un bibliotecario che ha letto tutti i libri della biblioteca, spiega Lennart Heim, ricercatore di IA presso il think tank Rand. Quando gli viene posta una domanda, fornisce una risposta basata sui molti libri che ha letto.

Questo processo richiede tempo e denaro. Per leggere quei libri occorrono chip per computer che consumano molta elettricità.

DeepSeek ha adottato un altro approccio. Il suo bibliotecario non ha letto tutti i libri, ma è addestrato a cercare il libro giusto per la risposta dopo che gli è stata posta una domanda.

A questo si aggiunge un’altra tecnica, chiamata “miscela di esperti”. Piuttosto che cercare di trovare un bibliotecario in grado di rispondere a domande su qualsiasi argomento, DeepSeek e altri sviluppatori di intelligenza artificiale fanno qualcosa di simile al delegare le domande a una serie di esperti in campi specifici, come la narrativa, i periodici e la cucina. Ogni esperto ha bisogno di meno formazione, alleggerendo la richiesta ai chip di fare tutto in una volta.

L’approccio di DeepSeek richiede meno tempo e potenza prima che la domanda venga posta, ma ne richiede di più durante la risposta. Tutto sommato, secondo Heim, le scorciatoie di DeepSeek consentono di addestrare l’intelligenza artificiale a una frazione del costo dei modelli concorrenti.

Finanziamo agevolati

Contributi per le imprese

 

Gli ingegneri cinesi hanno trovato soluzioni creative

«L’ingegneria è fatta di vincoli», ha scritto l’ex amministratore delegato di Intel Pat Gelsinger su X. «Gli ingegneri cinesi avevano risorse limitate e hanno dovuto trovare soluzioni creative».

L’ingegno spiega solo in parte il successo di DeepSeek.

L’altra parte è la difficile introduzione dei controlli sulle esportazioni statunitensi in Cina, che ha dato a DeepSeek una finestra di opportunità per acquistare potenti chip americani.

Nel 2022 l’amministrazione Biden ha introdotto controlli sui chip esportati in Cina. Le aziende statunitensi che volevano vendere alla Cina dovevano innanzitutto limitare una funzione dei chip chiamata larghezza di banda di interconnessione (interconnect bandwidth) , che si riferisce alla velocità di trasferimento dei dati.

In risposta, Nvidia, leader mondiale nella progettazione di chip per l’intelligenza artificiale, ha allora ideato un nuovo prodotto per la Cina che rispettava questo parametro, ma lo compensava mantenendo alte le prestazioni in altri modi. Il risultato è stato un chip che, secondo alcuni analisti, era quasi altrettanto potente del miglior chip di Nvidia dell’epoca.

I funzionari statunitensi si sono sfogati in pubblico e in privato, dicendo che Nvidia non aveva infranto la legge, ma ne avesse violato lo spirito. Il governo sperava che i leader del settore collaborassero alla definizione di controlli efficaci sulle esportazioni di tecnologie in rapida evoluzione, ha dichiarato un ex funzionario dell’amministrazione Biden.

Cessione crediti fiscali

procedure celeri

 

Un portavoce di Nvidia ha dichiarato lunedì che «DeepSeek è un eccellente progresso dell’AI» che ha dimostrato una tecnica innovativa di AI utilizzando una potenza di calcolo “pienamente conforme ai controlli sulle esportazioni”.

Un anno dopo i controlli iniziali, il governo ha inasprito le regole. Tuttavia, ciò ha lasciato uno spazio di circa un anno a DeepSeek per acquistare il potente chip di Nvidia per il mercato cinese, chiamato H800. In un documento di ricerca pubblicato a dicembre, DeepSeek ha dichiarato di aver utilizzato 2.048 di questi chip per addestrare uno dei suoi modelli di intelligenza artificiale.

Da quando le regole sono state riviste nel 2023, Nvidia ha progettato un nuovo chip conforme al controllo delle esportazioni per la Cina, molto meno potente dell’H800.

Alcuni leader americani dell’industria dell’AI sono scettici sul fatto che DeepSeek abbia rivelato tutti i suoi segreti. Secondo loro, i ricercatori cinesi potrebbero aver fatto scorta di chip Nvidia all’avanguardia prima delle restrizioni imposte dagli Stati Uniti, o aver utilizzato soluzioni alternative come l’accesso alla potenza di calcolo di Nvidia da Paesi al di fuori degli Stati Uniti e della Cina. Negli ultimi giorni l’amministrazione Biden ha implementato nuove regole per risolvere questi punti deboli.

DeepSeek non ha risposto alle richieste di commento.


(Translated from the original version by Milano Finanza Editorial Staff)

MF+MIFI + The Wall Street Journal

Finanziamenti e agevolazioni

Agricoltura

 



Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link