Oggi, OpenAI lancia ufficialmente due nuovi modelli: o3 e o4-mini – le versioni più avanzate della serie di modelli “o”, addestrate per riflettere più a lungo prima di rispondere. Sono i modelli più intelligenti mai rilasciati, che permettono a ChatGPT di gestire compiti complessi con capacità di ragionamento profondo e utilizzo proattivo degli strumenti.
Per la prima volta, questi modelli possono utilizzare l’intera suite di strumenti in ChatGPT: ricerca web, lettura e analisi di file tramite Python, elaborazione di input visivi e generazione di immagini. Sono progettati per decidere autonomamente quando e come usare gli strumenti, rispondendo rapidamente (spesso in meno di 1 minuto) nel formato di output appropriato.
🚀 Principali nuove funzionalità
o3-mini
- Il modello di ragionamento più potente fino ad oggi
- Stabilisce nuovi record su benchmark come Codeforces, SWE-bench, MMMU
- Estremamente forte nell’analisi di immagini, grafici e diagrammi
- Riduce gli errori gravi del 20% rispetto a o1 nei compiti reali
- Altamente valutato in ambiti come programmazione, pensiero creativo, biologia, matematica ed ingegneria
o4-mini
- Modello compatto, ottimizzato per velocità e costi
- Prestazioni impressionanti su AIME 2024–2025 usando Python (99,5% pass@1)
- Supera o3-mini sia nei compiti STEM che non STEM (come data science)
- Consente limiti di utilizzo più elevati rispetto a o3, adatto a frequenze di query elevate
Multimodale
Coding
🧠 Ragionamento visivo
- Può integrare direttamente le immagini nelle catene di ragionamento
- Comprende immagini sfocate, lavagne scritte a mano, libri di testo o schizzi
- Può ruotare, zoomare e modificare le immagini durante il ragionamento
- Leader nei test multimodali
🔧 Utilizzo degli strumenti come un vero agente
Esempio: la domanda “Come si confronta il consumo di elettricità in California quest’estate rispetto all’anno scorso?”
→ o3 può:
- Cercare dati pubblici sulle utenze
- Scrivere codice Python per generare previsioni
- Creare grafici, analizzare tendenze
- Collegare strumenti in modo flessibile, cercare proattivamente dati aggiuntivi se necessario
⚙️ Ottimizzazione di efficienza e costi
- o3 è più intelligente e conveniente di o1
- o4-mini è significativamente più efficiente di o3-mini
- Per la maggior parte degli scenari reali, o3 e o4-mini sono sia più intelligenti che più economici dei modelli precedenti
🔒 Sicurezza e controllo
- Dati di addestramento sulla sicurezza completamente aggiornati
- Maggiore capacità di rifiutare risposte a contenuti sensibili (armi biologiche, malware, ecc.)
- Il sistema di monitoraggio LLM rileva circa il 99% delle sfide red-team pericolose
- Valutato approfonditamente per AI autoapprendenti, sicurezza di rete e biologia – non a livelli di rischio elevati
💻 Codex CLI – Ragionamento diretto dalla riga di comando
- Agente di codifica leggero che può essere eseguito direttamente nel terminale
- Supporta l’invio di immagini, disegni, screenshot per ragionamento locale combinato sul codice
- Open source su GitHub
- Fondo di sovvenzione da 1 milione di dollari per progetti che utilizzano Codex CLI (crediti API $25k per progetto)
🔓 Accesso e distribuzione
- Gli utenti ChatGPT Plus, Pro e Team possono scegliere o3, o4-mini, o4-mini-high
- Gli utenti Enterprise ed Edu avranno accesso dopo 1 settimana
- Gli utenti gratuiti possono provare o4-mini tramite il pulsante “Think”
- API completamente supportata tramite Chat Completions e Responses
- Responses API supporterà presto l’integrazione di strumenti: ricerca web, ricerca file, scrittura di codice
Source: https://openai.com/index/introducing-o3-and-o4-mini/