Introduzione a OpenAI o1-preview
OpenAI ha presentato una nuova serie di modelli avanzati di ragionamento, nota come OpenAI o1-preview. Questi modelli sono progettati per risolvere problemi complessi in scienza, programmazione e matematica, mostrando una capacità di risoluzione dei problemi significativamente migliorata rispetto ai modelli precedenti.
Funzionamento
I modelli sono stati addestrati per dedicare più tempo al ragionamento sui compiti, in modo simile a un essere umano. Raffinano il loro processo di pensiero, testano diverse strategie e identificano errori. La prossima versione ha raggiunto, nei test, risultati paragonabili a quelli di studenti di dottorato in fisica, chimica e biologia. In particolare, in matematica e programmazione, il modello ha dimostrato abilità eccezionali.
Disponibilità e utilizzo
I primi modelli della serie o1 sono già disponibili su ChatGPT e tramite API. Sono previste regolari aggiornamenti e migliorie. I modelli possono essere selezionati manualmente nella scelta del modello di ChatGPT, con o1-preview e o1-mini attualmente disponibili. Gli utenti di ChatGPT Plus e Team hanno accesso a partire da oggi, mentre gli utenti di ChatGPT Enterprise ed Edu avranno accesso dalla prossima settimana.
Misure di sicurezza
Un aspetto importante nello sviluppo di questi modelli è la sicurezza. Un nuovo approccio per il training sulla sicurezza utilizza le capacità di ragionamento dei modelli per garantire la conformità alle linee guida di sicurezza e allineamento. Un punto di riferimento per la sicurezza è quanto bene il modello rispetta le sue linee guida, anche in caso di tentativi di aggirarle (“Jailbreaking”). In uno dei test più rigorosi, il modello o1-preview ha raggiunto 84 punti su 100, mentre GPT-4o ne ha raggiunti solo 22.
Per i nuovi modelli, le misure di sicurezza, la governance interna e la collaborazione con il governo federale sono state intensificate. Questo include test rigorosi, valutazioni secondo il Preparedness Framework, misure di Red Teaming e processi di revisione a livello di consiglio, incluso il Comitato di Sicurezza e Governance.
Applicazioni e pubblico target
Le capacità avanzate di ragionamento dei modelli o1 sono particolarmente utili per utenti che devono risolvere problemi complessi in scienza, programmazione, matematica e aree correlate. I modelli o1 possono essere utilizzati da ricercatori sanitari per l’annotazione di dati di sequenziamento cellulare, da fisici per la creazione di formule matematiche complesse per l’ottica quantistica e da sviluppatori per la creazione ed esecuzione di flussi di lavoro a più fasi.
OpenAI o1-mini
Oltre a o1-preview, è disponibile anche OpenAI o1-mini, un modello più veloce ed economico, particolarmente efficace per la programmazione. o1-mini è più economico dell’80% rispetto a o1-preview e offre una soluzione potente e accessibile per applicazioni che richiedono ragionamento ma non dipendono da una vasta conoscenza del mondo.
Sviluppi futuri
Questo lancio è un’anteprima iniziale dei nuovi modelli di ragionamento su ChatGPT e API. Oltre agli aggiornamenti dei modelli, sono previste funzionalità aggiuntive come navigazione sul web, caricamento di file e immagini, per rendere i modelli ancora più utili. Sono in corso ulteriori sviluppi nella serie GPT e nella serie OpenAI o1.
Con questi nuovi modelli, OpenAI compie un passo significativo verso un nuovo livello di capacità dell’IA, specialmente nel campo del ragionamento e della risoluzione di problemi in aree complesse.
Sul sito chatgptx.com, il modello o1-preview può essere testato gratuitamente con 3000 token.