openai mloiacono.it

OpenAI ha recentemente annunciato il suo nuovo modello di intelligenza artificiale, denominato “o3”, segnando un passo significativo verso lo sviluppo dell’Intelligenza Artificiale Generale (AGI). Questo modello rappresenta un’evoluzione rispetto ai precedenti, introducendo capacità di ragionamento avanzate che avvicinano sempre più le macchine alla comprensione e all’elaborazione del pensiero umano.
La serie “o” di OpenAI è stata progettata per migliorare le capacità di ragionamento dei modelli di intelligenza artificiale. Il modello “o3” è stato sviluppato per dedicare più tempo alla deliberazione quando affronta domande che richiedono un ragionamento logico passo-passo. Questa caratteristica consente al modello di pianificare e ragionare attraverso i compiti, eseguendo una serie di passaggi intermedi per risolvere problemi complessi.

Il modello “o3” è stato annunciato il 20 dicembre 2024, con l’obiettivo di evitare conflitti di marchio con il brand di telefonia mobile “O2”. OpenAI ha invitato ricercatori in ambito di sicurezza a richiedere l’accesso anticipato a questi modelli fino al 10 gennaio 2025. Sono stati sviluppati due modelli distinti: “o3” e “o3-mini”.

Il 31 gennaio 2025, OpenAI ha rilasciato “o3-mini” a tutti gli utenti di ChatGPT, inclusi quelli del livello gratuito, e ad alcuni utenti API. “O3-mini” offre tre livelli di sforzo di ragionamento: basso, medio e alto. La versione gratuita utilizza il livello medio, mentre la variante che impiega più risorse computazionali è chiamata “o3-mini-high” ed è disponibile per gli abbonati a pagamento.

Il 2 febbraio 2025, OpenAI ha lanciato “OpenAI Deep Research”, un servizio ChatGPT che utilizza una versione di “o3” in grado di creare rapporti completi entro 5-30 minuti, basati su ricerche web.

In risposta alla concorrenza di aziende come DeepSeek, il 6 febbraio 2025, OpenAI ha annunciato un aggiornamento mirato a migliorare la trasparenza del processo di pensiero nel modello “o3-mini“.

o3 mini mloiacono.it

Capacità Avanzate di Ragionamento

Una delle principali innovazioni introdotte con “o3” è l’uso dell’apprendimento per rinforzo per insegnare al modello a “pensare” prima di generare risposte, utilizzando quello che OpenAI definisce un “private chain of thought”. Questo approccio permette al modello di pianificare in anticipo e ragionare attraverso i compiti, eseguendo una serie di passaggi di ragionamento intermedi per assistere nella risoluzione dei problemi, a costo di un maggiore utilizzo di potenza computazionale e un aumento della latenza delle risposte.

I risultati sono impressionanti: “o3” ha dimostrato prestazioni significativamente migliori rispetto al suo predecessore “o1” in compiti complessi, tra cui programmazione, matematica e scienze. Ad esempio, ha raggiunto un punteggio dell’87,7% nel benchmark GPQA Diamond, che contiene domande di scienze a livello esperto non disponibili pubblicamente online. Nel benchmark SWE-bench Verified, che valuta la capacità di risolvere problemi reali su GitHub, “o3” ha ottenuto un punteggio del 71,7%, rispetto al 48,9% di “o1”. Nel contesto di Codeforces, “o3” ha raggiunto un punteggio Elo di 2727, mentre “o1” si è fermato a 1891. Inoltre, nel benchmark ARC-AGI, che valuta la capacità di un’IA di gestire nuovi problemi logici e di acquisizione di abilità, “o3” ha ottenuto un’accuratezza tre volte superiore a quella di “o1”.

Implicazioni per l’Intelligenza Artificiale Generale (AGI)

L’introduzione del modello “o3” rappresenta un passo significativo verso l’AGI, un’intelligenza artificiale in grado di comprendere, apprendere e applicare conoscenze in modo simile agli esseri umani. Sebbene il raggiungimento dell’AGI sia ancora oggetto di dibattito tra gli esperti, i progressi compiuti con modelli come “o3” indicano che stiamo avvicinandoci a questo obiettivo. Alcuni ricercatori ritengono che forme iniziali di AGI possano già esistere, mentre altri sostengono che siano necessarie ulteriori scoperte fondamentali per raggiungere una vera AGI.

Un dipendente di OpenAI, Vahid Kazemi, ha affermato nel 2024 che l’azienda ha già raggiunto l’AGI, dichiarando: “A mio parere, abbiamo già raggiunto l’AGI ed è ancora più evidente con O1.” Kazemi ha chiarito che, sebbene l’IA non sia ancora “migliore di qualsiasi umano in qualsiasi compito”, è “migliore della maggior parte degli umani nella maggior parte dei compiti”. Queste affermazioni hanno suscitato dibattiti, poiché si basano su una definizione ampia e non convenzionale di AGI, tradizionalmente intesa come un’IA che eguaglia l’intelligenza umana in tutti i domini. I critici sostengono che, sebbene i modelli di OpenAI