Openai introduce nuovi modelli di ragionamento O3 e O4-Mini
Openi ha appena lasciato cadere due nuovi modelli AI, O3 e O4-Mini, l’ultimo nella sua serie O costruita per pensare più duramente prima di rispondere. Questi sono i modelli più intelligenti che l’azienda ha rilasciato finora, in grado di attingere al toolkit completo di Chatgpt per gestire tutto, dalle ricerche Web all’analisi delle immagini.
Openi O3 è il nostro modello di ragionamento più potente che spinge la frontiera attraverso la codifica, la matematica, la scienza, la percezione visiva e altro ancora. Imposta un nuovo SOTA su parametri di riferimento tra cui code forze, panca SWE (senza costruire un impalcatura specifica del modello) e MMMU. È ideale per query complesse che richiedono analisi multiforme e le cui risposte potrebbero non essere immediatamente evidenti. Si comporta in modo particolarmente forte in attività visive come l’analisi di immagini, grafici e grafica. Nelle valutazioni di esperti esterni, O3 commette il 20 % in meno di errori principali rispetto a OpenII O1 su attività difficili e reali, in particolare eccellendo in aree come la programmazione, il business/la consulenza e l’ideazione creativa. I primi tester hanno messo in evidenza il suo rigore analitico come partner di pensiero e hanno sottolineato la sua capacità di generare e valutare criticamente nuove ipotesi, in particolare nei contesti di biologia, matematica e ingegneria.
Openai o4-mini è un modello più piccolo ottimizzato per un ragionamento rapido ed economico: ottiene prestazioni notevoli per le sue dimensioni e costi, in particolare in matematica, codifica e attività visive. È il modello di riferimento per le migliori prestazioni su AIME 2024 e 2025. Nelle valutazioni di esperti, supera anche il suo predecessore, O3-Mini, su attività non steli e domini come la scienza dei dati. Grazie alla sua efficienza, O4-Mini supporta limiti di utilizzo significativamente più elevati di O3, rendendolo una forte opzione ad alto volume e ad alto rendimento per domande che beneficiano del ragionamento.
Openai afferma che i valutatori di esperti esterni hanno valutato entrambi i modelli come dimostrazione di istruzioni migliorate e risposte più utili e verificabili rispetto ai loro predecessori, grazie alla migliore intelligenza e all’inclusione di fonti web. Rispetto alle precedenti iterazioni dei suoi modelli di ragionamento, questi due modelli dovrebbero sentirsi più naturali e conversazionali, soprattutto perché fanno riferimento alla memoria e alle conversazioni passate per rendere le risposte più personalizzate e pertinenti.
Disponibilità
Gli utenti di Chatgpt Plus, Pro e Team vedranno O3, O4-Mini e O4-Mini-High nel selettore del modello a partire da oggi, sostituendo O1, O3-Mini e O3-Mini-High. Gli utenti di Chatgpt Enterprise ed EDU avranno accesso in una settimana. Gli utenti gratuiti possono provare O4-Mini selezionando “Think” nel compositore prima di inviare la propria domanda. I limiti di tasso su tutti i piani rimangono invariati dal precedente insieme di modelli.
Openi prevede di rilasciare Openi O3 -PRO in poche settimane con il supporto per lo strumento completo. Per ora, gli utenti Pro possono ancora accedere a O1 -PRO.
Sia O3 che O4-Mini sono anche disponibili per gli sviluppatori oggi tramite l’API di completamento della chat e le risposte API (alcuni sviluppatori dovranno verificare le loro organizzazioni (si apre in una nuova finestra) per accedere a questi modelli). Le risposte API supporta i riepiloghi di ragionamento, la capacità di preservare i token di ragionamento attorno alle richieste di funzionalità per prestazioni migliori e supporterà presto strumenti integrati come la ricerca Web, la ricerca di file e l’interprete di codice nel ragionamento del modello.
Maggiori dettagli e parametri di riferimento nell’annuncio completo collegato di seguito …