Meta lancia i nuovi modelli Llama 4 Herd AI

Meta lancia i nuovi modelli Llama 4 Herd AI

Meta ha annunciato oggi l’uscita dei suoi nuovi modelli AI, soprannominata il branco Llama 4. La compagnia ha introdotto due modelli di punta, Llama 4 Scout e Llama 4 Maverick, insieme a un’anteprima del colosso Llama 4.

Llama 4 Scout, un modello di parametri attivo da 17 miliardi con 16 esperti, è progettato per adattarsi a una singola GPU Nvidia H100 usando la quantizzazione INT4. Meta afferma che supera tutti i precedenti modelli Llama e concorrenti di dimensioni simili come Gemma 3, Gemini 2.0 Flash-Lite e Mistral 3.1 su benchmark ampiamente riportati. Vanta una finestra di contesto leader del settore di 10 milioni di token, consentendo compiti come il riepilogo e il ragionamento multi-documento su grandi basi di codice.

Meta lancia i nuovi modelli Llama 4 Herd AI

Llama 4 Maverick, con anche 17 miliardi di parametri attivi ma con 128 esperti e 400 miliardi di parametri totali, è progettato per prestazioni multimodali di alto livello. Meta afferma che supera GPT-4O e Gemini 2.0 Flash su diversi parametri di riferimento, ottenendo i risultati paragonabili al profondo V3 molto più grande nel ragionamento e nella codifica. Nonostante la sua scala, funziona su un singolo host Nvidia H100. Una versione sperimentale di chat di Maverick ha ottenuto un punteggio ELO di 1417 su LMarena.

Alimentare questi modelli è Llama 4 Behemoth, un modello di insegnante di parametri attivo di 288 miliardi con 16 esperti e quasi due trilioni di parametri totali. Sebbene sia ancora in formazione, Meta riporta che supera GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro su benchmark incentrati sullo STEM come Math-500 e GPQA Diamond. Behemoth svolge un ruolo chiave nella distillazione della conoscenza a Scout e Maverick, sebbene non sia ancora disponibile per il rilascio pubblico.

Sia Scout che Maverick impiegano un’architettura MIXT OF-ESPERTS (MOE), una prima per la serie Llama, attivando solo un sottoinsieme di parametri totali per token per migliorare l’efficienza. Scout ha 109 miliardi di parametri totali, mentre Maverick si bilancia a 400 miliardi. I modelli offrono multimodalità nativa con la prima fusione di token di testo e visione, supportati da un codificatore di visione basato su MetaClip potenziato.

Gli sviluppatori possono scaricare Llama 4 Scout e Maverick a partire da oggi, 5 aprile 2025, da Llama.com e abbracci. Meta sta inoltre implementando l’accesso tramite partner nei prossimi giorni. Gli utenti possono provare Meta AI alimentati da Llama 4 su WhatsApp, Messenger, Instagram Direct e il sito Web Meta.AI. Maggiori dettagli, tra cui approfondimenti tecnici e piani futuri per il modello di behemoth, saranno condivisi a Llamacon il 29 aprile.

Premi il link qui sotto per l’annuncio completo …

Per saperne di più

Meta lancia i nuovi modelli Llama 4 Herd AI