Informazione civica | “OpenAI non è un dio e non può restare sempre davanti con ChatGPT”

Effettua la tua ricerca

More results...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Filter by Categories
#finsubito

Contributi e agevolazioni

per le imprese

 


Il pensiero di Liang Wenfeng e del suo DeepSeek.

Discutere oggi del modello di profitto dell’intelligenza artificiale è come discutere di General Electric o Coca-Cola quando Ma Huateng, fondatore di Tencent, iniziò la sua attività. È come affrontare la prossima battaglia con le strategie dei generali delle guerre del secolo scorso.

Carta di credito con fido

Procedura celere

 

Nel panorama globale dell’intelligenza artificiale, dominato da OpenAI, Google e Meta e pochi altri è emersa in questi giorni a noi occidentali una voce nuova: quella di Liang Wenfeng, fondatore di DeepSeek. Un nome che, fino a poco tempo fa, era sconosciuto ai più, ma che oggi rappresenta una delle realtà più interessanti nel campo delle AI generative e nella AGI (Artificial General Intelligence). La sua storia non è solo quella di un imprenditore di successo, ma di un visionario, almeno per ora,  che ha scelto di sfidare lo status quo, puntando su innovazione, open source e una visione a lungo termine. Al di là delle censure politiche del suo DeepSeek, come quella su  piazza Tienanmen  e le altre che deve fare per continuare a ricercare e sviluppare. 

Liang Wenfeng non è un imprenditore tradizionale. Laureato in intelligenza artificiale all’Università di Zhejiang, ha sempre creduto che l’AI avrebbe cambiato il mondo, anche quando, nel 2008, questa idea era considerata utopistica. Dopo la laurea, invece di seguire il percorso convenzionale di molti suoi colleghi, si è ritirato in una casa in affitto a Chengdu, dedicandosi a progetti ambiziosi e accettando fallimenti e frustrazioni come parte del processo. La sua tenacia lo ha portato a fondare High-Flyer, un fondo quantitativo che ha sfruttato l’intelligenza artificiale per lavorare nel settore finanziario e di trading.

Nel 2019 quindi, ha lanciato DeepSeek, un’organizzazione indipendente focalizzata sulla creazione di modelli di intelligenza artificiale avanzati. Il suo obiettivo? Non replicare ChatGPT, ma spingersi oltre, verso l’AGI, un’intelligenza artificiale in grado di eguagliare (e forse superare) quella umana. “Non vogliamo solo seguire le orme degli altri. Vogliamo esplorare i misteri dell’intelligenza artificiale generale”, ha dichiarato durante un’intervista.

Nel lungo termine, la barriera d’accesso per l’uso di modelli di grandi dimensioni si abbasserà sempre di più, consentendo anche alle startup di entrare nel settore in qualsiasi momento nei prossimi 20 anni. La nostra posizione dice è altrettanto chiara: non ci occupiamo di integrazione verticale o applicazioni, ma esclusivamente di ricerca ed esplorazione.

Attualmente, ricorda, stiamo considerando l’idea di condividere pubblicamente la maggior parte dei risultati del nostro lavoro di formazione, in modo che possano essere utilizzati per la commercializzazione e permettano l’accesso a modelli di grandi dimensioni a basso costo. L’obiettivo è evitare che la tecnologia rimanga monopolizzata nelle mani di poche persone o aziende.

In realtà, la sua azienda High-Flyer è stata a lungo un gigante nascosto dell’intelligenza artificiale: fondata nel 2015, ha costruito il supercomputer “Firefly I” con un investimento totale di 200 milioni yuan, con 1.100 GPU. 2 anni dopo, l’investimento nel supercomputer “Firefly II” è aumentato a 1 miliardo di yuan, dotato di circa 10.000 schede grafiche NVIDIA A100.

Mentre molte aziende cinesi faticavano a procurarsi GPU ad alte prestazioni per addestrare modelli di grandi dimensioni, DeepSeek aveva già accumulato 10.000 chip NVIDIA A100, grazie a una visione anticipatrice. “Nel 2021, quando abbiamo investito nella costruzione del supercomputer Firefly II, molti non capivano perché. Ma per noi era chiaro: il futuro dell’AI richiede una potenza di calcolo enorme”, ha spiegato Liang.

Un pensiero  lungimirante o forse dettato dalla necessità ma che ha permesso a DeepSeek di posizionarsi come uno dei pochi player di AI in grado di competere a livello globale. Per Liang, il vero valore non risiede nell’hardware, ma nella cultura aziendale e nella libertà di innovazione. “L’innovazione non può essere orchestrata o insegnata. Nasce dalla curiosità e dalla libertà di sperimentare”, ha sottolineato. GPU e ricercatori sono liberi e non hanno bisogno di verticalità quando progettano.

Finanziamenti personali e aziendali

Prestiti immediati

 

Uno degli aspetti più nuovi  di DeepSeek è il suo approccio alle risorse umane. A differenza di molte aziende che cercano talenti già affermati nei laboratori di giganti come OpenAI o Facebook AI Research, Liang crede nel potenziale dei giovani ricercatori. “Se guardiamo al lungo termine, l’esperienza non è così importante. Contano di più le capacità di base, la creatività e la passione”, ha spiegato.

DeepSeek non ha KPI tradizionali né gerarchie rigide. I ricercatori hanno la libertà di esplorare idee senza pressioni immediate di commercializzazione. “Abbiamo creato un ambiente in cui le persone possono sbagliare, imparare e crescere. Questo è il modo in cui nasce l’innovazione”, ha aggiunto Liang.

In un mercato dominato da modelli closed-source, DeepSeek ha scelto una strada diversa: l’open source. Con il lancio nel maggio 2024  di DeepSeek-V2, un modello che offre un rapporto prezzo-prestazioni senza precedenti (1 yuan per milione di token, circa un settimo del costo di GPT-4 Turbo), l’azienda ha dimostrato che l’innovazione può essere accessibile a tutti. “Crediamo che l’intelligenza artificiale debba essere conveniente e democratica. Non vogliamo monopolizzare la tecnologia”, ha affermato Liang.

Nel 2024 i costi di elettricità e manutenzione sono stati in realtà molto contenuti, rappresentando solo circa l’1% del costo annuale dell’hardware. C’è poi il costo del lavoro, che è trascurabile, ma lo consideriamo, un investimento per il futuro, essendo la risorsa più preziosa per l’azienda. Selezioniamo persone con un approccio semplice e curioso, attratte dall’opportunità di dedicarsi alla ricerca.

Questa filosofia si riflette anche nell’approccio alla ricerca. DeepSeek non si concentra su applicazioni verticali o prodotti consumer, ma esclusivamente su innovazioni tecnologiche. “Il nostro obiettivo è contribuire all’ecosistema globale dell’AI, non semplicemente sfruttare le opportunità commerciali”, ha spiegato. Una scelta che, sebbene rischiosa, ha già portato a risultati straordinari, come l’architettura MLA (Multi-Latent Attention), che riduce i costi di elaborazione e migliora l’efficienza dei modelli, rispetto ai modelli Tranformer MHL di Open Ai e altri. Un esempio pratico semplice, ma chiedo aiuto ai tecnologi esperti, potrebbe essere che immaginiamo di usare un modello per analizzare un testo lungo (ad esempio, un articolo). MHA analizzerebbe ogni parola rispetto a tutte le altre (relazioni globali), costruendo enormi matrici e consumando molte risorse. MLA, invece: riassumerebbe sezioni del testo in rappresentazioni più semplici (latenti), come piccoli gruppi di significati o frasi chiave. Calcolerebbe dunque l’attenzione solo tra questi riassunti, ignorando i dettagli meno utili. Per approfondimenti su MLA 

Mentre OpenAI è spesso visto come il leader indiscusso nel campo dell’AI, Liang Wenfeng non interessa questa competizione. “OpenAI non è un dio e non può restare sempre in testa”, dice. Per lui, il vero divario tra Cina e Stati Uniti non è tecnologico, ma culturale. “Negli ultimi anni, la Cina ha enfatizzato il guadagno a breve termine, trascurando l’innovazione. Ma questo sta cambiando”.

Nel 2024 Liang Wenfeng si distingue ancora. Le scelte di DeepSeek si distinguono nettamente dalle altre. Finora, tra le sette principali startup cinesi, è l’unica ad aver abbandonato l’approccio “modelli e applicazioni”, concentrandosi esclusivamente sulla ricerca e sulla tecnologia, senza sviluppare prodotti per il consumatore finale. È anche l’unica a non aver puntato pienamente sulla commercializzazione, scegliendo con decisione la via dell’open source, senza neppure ricorrere alla raccolta di capitali.  

Finanziamenti personali e aziendali

Prestiti immediati

 

Crediamo dice che, con lo sviluppo dell’economia, la Cina debba gradualmente diventare un contributore attivo, piuttosto che un semplice fruitore. Negli ultimi 30 anni, durante l’ondata dell’IT, il nostro coinvolgimento nella vera innovazione tecnologica è stato limitato. Abbiamo dato per scontata la Legge di Moore, come se fosse un fenomeno naturale: ogni 18 mesi, le prestazioni di hardware e software sembravano raddoppiare senza alcuno sforzo da parte nostra.

Lo stesso atteggiamento lo abbiamo avuto verso le leggi dello scaling nell’intelligenza artificiale, considerandole come un progresso automatico e inevitabile. In realtà, si tratta di un processo guidato da generazioni di comunità tecnologiche, per lo più dominate dall’Occidente. Noi, invece, siamo rimasti in disparte, ignorandolo perché non abbiamo mai partecipato attivamente a questo percorso di innovazione.

DeepSeek V2 ha sorpreso la Silicon Valley perché rappresenta un’innovazione che negli Stati Uniti è quasi quotidiana, ma la sorpresa è stata l’origine: una startup cinese che si è inserita nel loro stesso meccanismo, contribuendo all’innovazione. Dopotutto, molte aziende cinesi sono abituate a seguire piuttosto che a innovare.

DeepSeek rappresenta una nuova generazione di aziende cinesi che non si accontentano di essere follower. “Vogliamo essere all’avanguardia della tecnologia, non solo sfruttare le innovazioni degli altri”, ricorda Liang. Una visione che si riflette nella decisione di DeepSeek di non passare al closed-source, nonostante il trend contrario di molte aziende, tra cui OpenAI e Mistral.

Per Liang Wenfeng, l’innovazione non è solo una questione tecnologica, ma anche spirituale. “È come camminare per 50 chilometri: il corpo è esausto, ma lo spirito è soddisfatto”, ha detto. Questa filosofia si riflette nella cultura aziendale di DeepSeek, dove la ricerca è guidata dalla curiosità e dalla passione, non dalla pressione dei risultati immediati.

“L’innovazione richiede fede. Credere che sia possibile fare qualcosa di rivoluzionario, anche quando tutti intorno a te dubitano”, ricorda Liang in un’intervista del 2024. Una mentalità che lo ha portato a sfidare le convenzioni e a perseguire obiettivi apparentemente impossibili.

Contributi e agevolazioni

per le imprese

 

Per Liang Wenfeng, come per molti sviluppatori della AI la AGI non è un sogno lontano, ma una meta raggiungibile nel corso della sua vita. “Potrebbero volerci 2, 5 o 10 anni, ma ci arriveremo”.  La tabella di marcia di DeepSeek si basa su tre pilastri: matematica e codice, multimodalità e linguaggio naturale. “La matematica e il codice sono un banco di prova naturale per l’AGI, mentre la multimodalità è essenziale per interagire con il mondo reale”, ha spiegato in un convegno lo scorso anno.

Mentre molte aziende si affrettano a monetizzare le loro tecnologie, DeepSeek guarda al futuro con una prospettiva diversa. “Non abbiamo piani di finanziamento a breve termine. Il nostro obiettivo è costruire un ecosistema in cui la tecnologia sia condivisa e accessibile a tutti”, ha dichiarato Liang. Una visione che ricorda gli ideali di OpenAI nei suoi primi giorni, ma con una differenza fondamentale: DeepSeek non ha intenzione di abbandonare l’open source. Non lo aveva nemmeno OpenAI e poi sappiamo come è andata a finire.

“L’open source è più di una scelta commerciale; è un comportamento culturale. Vogliamo contribuire alla comunità tecnologica globale, non solo competere con essa”, ha spiegato. Una filosofia che, sebbene rischiosa, potrebbe rappresentare il futuro dell’intelligenza artificiale.

La riflessione di Wenfeng su come rendere profit la AI piuttosto che adottare schemi passati è flessibile e distrugge il passato. Tutte le migliori pratiche per la commercializzazione della AI provengono dalla generazione precedente e potrebbero non essere valide per il futuro. Discutere oggi del modello di profitto dell’intelligenza artificiale è come discutere di General Electric o Coca-Cola quando Ma Huateng, fondatore di Tencent, iniziò la sua attività. È come affrontare la prossima battaglia con le strategie dei generali delle guerre del secolo scorso.

Immagine in evidenza dall’account X di Liang Wenfeng

 

Sconto crediti fiscali

Finanziamenti e contributi

 



Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link