OpenAI ha addestrato i suoi nuovi modelli di intelligenza artificiale o1 a pensare prima di parlare: come accedervi
OpenAI ha appena lanciato la sua nuova serie o1, che a suo dire eccelle nel ragionamento avanzato. Ecco in cosa differisce da GPT-4o e cos'altro sappiamo finora.
Se hai utilizzato ChatGPT, sai che il chatbot restituisce risposte incredibilmente rapidamente, impiegando pochi secondi per elaborare anche query complesse. Sebbene la velocità sia un chiaro vantaggio, può anche significare che il chatbot si è affrettato a generare una risposta. Questi nuovi modelli OpenAI sono specializzati nell’affrontare questo problema.
OpenAI ha presentato giovedì OpenAI o1, una nuova serie di modelli progettati per funzionare con problemi scientifici, di codifica e matematici più complessi dedicando più tempo a pensare prima di rispondere, secondo il post sul blog.
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
— OpenAI (@OpenAI) September 12, 2024
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
OpenAI afferma di aver addestrato i modelli a pensare prima di rispondere, come fanno gli esseri umani, perfezionando il loro processo di pensiero e consentendo loro di provare diverse strategie e identificare i propri errori.
Questo approccio ha dato i suoi frutti, con il modello o1 che eccelle in matematica e programmazione, ottenendo un punteggio dell'83% nell'esame di qualificazione delle Olimpiadi Internazionali di Matematica (IMO). Per fare un confronto, GPT-4o ha risolto correttamente solo il 13% dei problemi. Il CEO di Open AI, Sam Altman, ha evidenziato alcuni dei risultati dei benchmark in un post su X, riportato di seguito.
here is o1, a series of our most capable and aligned models yet:https://t.co/yzZGNN8HvD
— Sam Altman (@sama) September 12, 2024
o1 is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it. pic.twitter.com/Qs1HoSDOz1
I risultati hanno senso, dato che un modo popolare per fare in modo che ChatGPT produca risposte di qualità superiore, soprattutto con prompt che richiedono un ragionamento avanzato, è richiedergli di rileggere il prompt. Quando si rielabora la richiesta originale, in genere trova l'errore e restituisce la risposta corretta.
Poiché o1 è uno dei primi modelli, manca delle funzionalità chiave di ChatGPT, come la navigazione in Internet e l'accettazione dei caricamenti multimediali. Di conseguenza, a breve termine, GPT-4o potrebbe essere il modello migliore per i casi comuni, mentre o1 sarà un’opzione migliore per risolvere problemi scientifici, di codifica e matematici complessi.
OpenAI ha anche lanciato o1-mini, che costa l'80% in meno rispetto a o1-preview. Ciò lo rende un’alternativa più economica e veloce per gli sviluppatori. OpenAI condivide nel post del blog che o1-mini è particolarmente efficace nella codifica.
Gli utenti di ChatGPT Plus e Team possono accedere ai modelli o1-preview e o1-mini dall'interruttore di selezione del modello sul lato sinistro della pagina ChatGPT, con limiti di frequenza settimanali di 30 messaggi per o1-preview e 50 per o1-mini. Altman ha confermato che il lancio era attivo per tutti gli utenti di ChatGPT Plus/team.
I modelli sono disponibili anche per gli sviluppatori che si qualificano per il livello di utilizzo API 5 nell'API con un limite di 20 RPM. Gli utenti ChatGPT Enterprise ed Edu avranno accesso all'inizio della prossima settimana. OpenAI prevede di portare o1-mini anche a tutti gli utenti gratuiti di ChatGPT, ma non ha detto esplicitamente quando avverrà tale cambiamento.
OpenAI sta inoltre lavorando per espandere il limite attuale e consentire a ChatGPT di scegliere automaticamente il modello migliore in base alle richieste dell'utente.
Voci su un modello OpenAI con capacità di ragionamento avanzate circolavano già nel novembre 2023. Da allora, il progetto è stato soprannominato Project Strawberry, con Atlman che ha preso piede e ha pubblicato teaser per tutta l'estate.