Meta svela il suo primo chip AI personalizzato
I circuiti sono dotati di software ottimizzato per eseguire PyTorch e sottolineano il compito di fornire raccomandazioni.
Meta giovedì ha presentato il suo primo chip, MTIA, che a suo dire è stato ottimizzato per eseguire motori di raccomandazione e beneficia della stretta partecipazione con gli sviluppatori PyTorch dell'azienda.
Meta, proprietario di Facebook, WhatsApp e Instagram, giovedì ha presentato il suo primo chip per computer progettato su misura appositamente per l'elaborazione di programmi di intelligenza artificiale, chiamato Meta Training and Inference Accelerator, o "MTIA".
Il chip, costituito da una rete di blocchi di circuiti che operano in parallelo, esegue un software che ottimizza i programmi utilizzando il framework di sviluppo open source PyTorch di Meta.
Meta descrive il chip come ottimizzato per un particolare tipo di programma di intelligenza artificiale: i modelli di raccomandazione del deep learning. Si tratta di programmi in grado di osservare uno schema di attività, come il clic sui post su un social network, e prevedere materiale correlato, possibilmente rilevante, da consigliare all'utente.
Il chip è la prima versione di quella che Meta definisce una famiglia di chip e ha affermato che è stata avviata nel 2020. Non è stato offerto alcun dettaglio su quando arriveranno i futuri modelli del chip.
Meta segue altre gigantesche aziende tecnologiche che hanno sviluppato i propri chip per l'intelligenza artificiale oltre a utilizzare i chip GPU standard di Nvidia che sono arrivati a dominare il campo. Microsoft, Google e Amazon hanno presentato diversi chip personalizzati negli ultimi anni per gestire diversi aspetti dei programmi di intelligenza artificiale.
L'annuncio di Meta faceva parte di un'ampia presentazione giovedì in cui diversi dirigenti di Meta hanno discusso di come stanno rafforzando le capacità informatiche di Meta per l'intelligenza artificiale.
Oltre al chip MTIA, la società ha discusso di un "data center di prossima generazione" che sta costruendo e che "sarà un design ottimizzato per l'intelligenza artificiale, supporterà hardware AI raffreddato a liquido e una rete AI ad alte prestazioni che collegherà migliaia di chip AI per cluster di formazione AI su scala data center."
Meta ha anche rivelato un chip personalizzato per la codifica video, chiamato Meta Scalable Video Processor. Il chip è progettato per comprimere e decomprimere in modo più efficiente i video e codificarli in più formati diversi per il caricamento e la visualizzazione da parte degli utenti di Facebook. Meta ha affermato che il chip MSVP "può offrire prestazioni di transcodifica di picco di 4K a 15 fps con la configurazione di massima qualità con flussi 1 ingresso e 5 uscite e può scalare fino a 4K a 60 fps con la configurazione di qualità standard".
Piuttosto che fare affidamento sulle GPU Nvidia o sulle CPU Intel, Meta ha affermato, "con un occhio ai futuri casi d'uso legati all'intelligenza artificiale, crediamo che l'hardware dedicato sia la soluzione migliore in termini di potenza di calcolo ed efficienza" per i video. L’azienda ha notato che le persone trascorrono metà del loro tempo su Facebook guardando video, con oltre quattro miliardi di visualizzazioni di video al giorno.
Meta ha accennato per anni allo sviluppo di un chip, come quando il suo capo scienziato dell’intelligenza artificiale, Yann LeCun, è stato intervistato da ZDNET nel 2019 sull’argomento. L'azienda ha mantenuto il silenzio sui dettagli di questi sforzi anche mentre i suoi colleghi lanciavano un chip dopo l'altro e mentre startup come Cerebras Systems, Graphcore e SambaNova Systems emergevano per sfidare Nvidia con chip esotici focalizzati sull'intelligenza artificiale.
Il MTIA ha aspetti simili ai chip delle startup. Nel cuore del chip, una rete di sessantaquattro cosiddetti elementi del processore, disposti in una griglia di otto per otto, riecheggia molti progetti di chip IA che adottano quello che viene chiamato "array sistolico", dove i dati possono spostarsi attraverso gli elementi alla massima velocità.
Il chip MTIA è alquanto insolito perché è costruito per gestire entrambe le due fasi principali dei programmi di intelligenza artificiale, ovvero l'addestramento e l'inferenza. L'addestramento è la fase in cui la rete neurale di un programma di intelligenza artificiale viene perfezionata fino a quando non funziona come previsto. L'inferenza è l'uso effettivo della rete neurale per fare previsioni in risposta alle richieste dell'utente. Di solito, le due fasi hanno requisiti molto diversi in termini di elaborazione del computer e sono gestite da progetti di chip distinti.
Il chip MTIA, ha affermato Meta, può essere fino a tre volte più efficiente delle GPU in termini di numero di operazioni in virgola mobile al secondo per ogni watt di energia consumata. Tuttavia, quando il chip viene utilizzato con reti neurali più complesse, rallenta rispetto alle GPU, ha affermato Meta, indicando che è necessario più lavoro sulle versioni future del chip per gestire attività complesse.
La presentazione di Meta da parte dei suoi ingegneri giovedì ha sottolineato come MTIA tragga vantaggio dalla "co-progettazione" hardware-software, in cui gli ingegneri hardware scambiano idee in un dialogo costante con gli sviluppatori PyTorch dell'azienda.
Oltre a scrivere il codice da eseguire sul chip in PyTorch o C++, gli sviluppatori possono scrivere in un linguaggio dedicato sviluppato per il chip chiamato KNYFE. Il linguaggio KNYFE "prende una breve descrizione di alto livello di un operatore ML come input e genera codice kernel C++ ottimizzato di basso livello che è l'implementazione di questo operatore per MTIA", ha affermato Meta.
Meta ha discusso di come ha integrato più chip MTIA nei computer server sulla base del progetto Open Compute di cui Meta ha contribuito a essere pioniere.
Maggiori dettagli sul MTIA sono forniti in un post sul blog di Meta.
Gli ingegneri di Meta presenteranno un documento sul chip alla conferenza International Symposium on Computer Architecture che si terrà a Orlando, in Florida, a giugno, intitolato "MTIA: First Generation Silicon Targeting Meta's Recommendation System".