Aujourd'hui, OpenAI lance officiellement deux nouveaux modèles : o3 et o4-mini – les versions les plus avancées de la série de modèles “o”, entraînées pour réfléchir plus longtemps avant de répondre. Ce sont les modèles les plus intelligents jamais publiés, permettant à ChatGPT de gérer des tâches complexes avec des capacités de raisonnement approfondi et une utilisation proactive des outils.
Pour la première fois, ces modèles peuvent utiliser l’ensemble des outils de ChatGPT : recherche web, lecture et analyse de fichiers via Python, traitement d’entrées d’images et génération d’images. Ils sont conçus pour décider de manière autonome quand et comment utiliser les outils, répondant rapidement (souvent en moins d’une minute) dans le format de sortie approprié.
🚀 Nouvelles fonctionnalités clés
o3-mini
- Le modèle de raisonnement le plus puissant à ce jour
- Établit de nouveaux records sur des benchmarks tels que Codeforces, SWE-bench, MMMU
- Extrêmement performant dans l’analyse d’images, de graphiques et de diagrammes
- Réduit les erreurs graves de 20 % par rapport à o1 sur des tâches réelles
- Très bien noté dans des domaines tels que la programmation, la pensée créative, la biologie, les mathématiques et l’ingénierie
o4-mini
- Modèle compact, optimisé pour la rapidité et le coût
- Performances impressionnantes sur AIME 2024–2025 avec Python (99,5 % pass@1)
- Surpasse o3-mini dans les tâches STEM et non-STEM (comme la data science)
- Permet des limites d’utilisation plus élevées que o3, adapté à une fréquence de requêtes élevée
Multimodal
Programmation
🧠 Raisonnement visuel
- Peut intégrer directement des images dans les chaînes de raisonnement
- Comprend les images floues, les tableaux manuscrits, les manuels scolaires ou les croquis
- Peut faire pivoter, zoomer et éditer les images pendant le raisonnement
- Leader dans les tests multimodaux
🔧 Utilisation des outils comme un véritable agent
Exemple : la question « Comment la consommation d’électricité en Californie cet été se compare-t-elle à celle de l’an dernier ? »
→ o3 peut :
- Rechercher des données publiques sur les services publics
- Écrire du code Python pour générer des prévisions
- Créer des graphiques, analyser les tendances
- Connecter les outils de manière flexible, rechercher de manière proactive des données supplémentaires si nécessaire
⚙️ Optimisation de l’efficacité et des coûts
- o3 est plus intelligent et plus rentable que o1
- o4-mini est nettement plus efficace que o3-mini
- Pour la plupart des scénarios réels, o3 et o4-mini sont à la fois plus intelligents et moins chers que les modèles précédents
🔒 Sécurité et contrôle
- Données de formation à la sécurité entièrement mises à jour
- Capacité renforcée à refuser de répondre à des contenus sensibles (armes biologiques, malwares, etc.)
- Système de surveillance LLM détectant ~99 % des défis dangereux de red team
- Évalué en profondeur pour l’IA auto-apprenante, la sécurité réseau et la biologie – pas à des niveaux de risque élevés
💻 Codex CLI – Raisonnement direct depuis la ligne de commande
- Agent de codage léger pouvant s’exécuter directement dans le terminal
- Prend en charge l’envoi d’images, de dessins, de captures d’écran pour un raisonnement de code local combiné
- Open source sur GitHub
- Fonds de subvention de 1 million USD pour les projets utilisant Codex CLI (crédits API de 25 000 $ par projet)
🔓 Accès et distribution
- Les utilisateurs ChatGPT Plus, Pro et Team peuvent choisir o3, o4-mini, o4-mini-high
- Les utilisateurs Enterprise et Edu y auront accès après une semaine
- Les utilisateurs gratuits peuvent essayer o4-mini via le bouton “Think”
- API entièrement prise en charge via Chat Completions et Responses
- L’API Responses prendra bientôt en charge l’intégration d’outils : recherche web, recherche de fichiers, écriture de code
Source: https://openai.com/index/introducing-o3-and-o4-mini/