Einführung in OpenAI o3 und o4-mini

OpenAI bringt o3 und o4-mini auf den Markt – intelligente Modelle, die zu tiefgreifendem Denken fähig sind und Bilder sowie Werkzeuge nutzen, um komplexe Probleme zu lösen. Dies ist ein wichtiger Schritt, der ChatGPT näher daran bringt, ein wirklich autonomer Agent zu werden.

Heute bringt OpenAI offiziell zwei neue Modelle auf den Markt: o3 und o4-mini – die fortschrittlichsten Versionen der „o“-Modellreihe, trainiert darauf, länger nachzudenken, bevor sie antworten. Dies sind die intelligentesten bisher veröffentlichten Modelle und ermöglichen es ChatGPT, komplexe Aufgaben mit tiefgehenden Denkfähigkeiten und proaktivem Werkzeugeinsatz zu bewältigen.

Zum ersten Mal können diese Modelle das vollständige Toolset in ChatGPT nutzen: Websuche, Lesen und Analysieren von Dateien über Python, Verarbeitung von Bildeingaben und Generierung von Bildern. Sie sind darauf ausgelegt, autonom zu entscheiden, wann und wie Werkzeuge eingesetzt werden, und antworten schnell (oft unter 1 Minute) im passenden Ausgabeformat.

🚀 Wichtige neue Funktionen

o3-mini

Das leistungsstärkste Reasoning-Modell bisher
Setzt neue Rekorde bei Benchmarks wie Codeforces, SWE-bench, MMMU
Außerordentlich stark bei der Analyse von Bildern, Diagrammen und Grafiken
Reduziert schwerwiegende Fehler um 20 % im Vergleich zu o1 bei realen Aufgaben
Sehr gut bewertet in Bereichen wie Programmierung, kreatives Denken, Biologie, Mathematik und Ingenieurwesen

o4-mini

Kompaktes Modell, optimiert für Geschwindigkeit und Kosten
Beeindruckende Leistung bei AIME 2024–2025 mit Python (99,5 % pass@1)
Übertrifft o3-mini sowohl bei MINT- als auch Nicht-MINT-Aufgaben (wie Data Science)
Ermöglicht höhere Nutzungslimits als o3, geeignet für hohe Abfragefrequenz

Multimodal

Coding

🧠 Visuelles Reasoning

Kann Bilder direkt in Argumentationsketten integrieren
Versteht unscharfe Bilder, handschriftliche Tafeln, Lehrbücher oder Skizzen
Kann Bilder während des Reasonings drehen, zoomen und bearbeiten
Führend bei multimodalen Tests

🔧 Werkzeuge wie ein echter Agent nutzen

Beispiel: die Frage „Wie unterscheidet sich der Stromverbrauch in Kalifornien diesen Sommer im Vergleich zum letzten Jahr?“
→ o3 kann:

Nach öffentlichen Versorgungsdaten suchen
Python-Code schreiben, um Prognosen zu erstellen
Diagramme erstellen, Trends analysieren
Werkzeuge flexibel verbinden, proaktiv zusätzliche Daten suchen, falls nötig

⚙️ Effizienz und Kosten optimieren

o3 ist intelligenter und kostengünstiger als o1
o4-mini ist deutlich effizienter als o3-mini
Für die meisten realen Szenarien sind o3 und o4-mini sowohl intelligenter als auch günstiger als frühere Modelle

🔒 Sicherheit und Kontrolle

Vollständig aktualisierte Sicherheits-Trainingsdaten
Verbesserte Fähigkeit, sensible Inhalte abzulehnen (Biowaffen, Malware usw.)
LLM-Überwachungssystem erkennt ~99 % gefährlicher Red-Team-Herausforderungen
Umfassend bewertet für selbstlernende KI, Netzwerksicherheit und Biologie – kein hohes Risikoniveau

💻 Codex CLI – Direktes Reasoning aus der Kommandozeile

Leichtgewichtiger Coding-Agent, der direkt im Terminal ausgeführt werden kann
Unterstützt das Senden von Bildern, Zeichnungen, Screenshots für kombinierte lokale Code-Analyse
Open Source auf GitHub
1 Million USD Fördertopf für Projekte, die Codex CLI nutzen (API-Guthaben $25k pro Projekt)

🔓 Zugang und Verteilung

ChatGPT Plus-, Pro- und Team-Nutzer können o3, o4-mini, o4-mini-high auswählen
Enterprise- und Edu-Nutzer erhalten nach 1 Woche Zugang
Kostenlose Nutzer können o4-mini über den „Think“-Button ausprobieren
API wird vollständig über Chat Completions und Responses unterstützt
Die Responses API wird bald Tool-Integration unterstützen: Websuche, Dateisuche, Code-Erstellung

Source: https://openai.com/index/introducing-o3-and-o4-mini/