Einführung in OpenAI o3 und o4-mini

OpenAI bringt o3 und o4-mini auf den Markt – intelligente Modelle, die zu tiefgreifendem Denken fähig sind und Bilder sowie Werkzeuge nutzen, um komplexe Probleme zu lösen. Dies ist ein wichtiger Schritt, der ChatGPT näher daran bringt, ein wirklich autonomer Agent zu werden.

Heute bringt OpenAI offiziell zwei neue Modelle auf den Markt: o3 und o4-mini – die fortschrittlichsten Versionen der „o“-Modellreihe, trainiert darauf, länger nachzudenken, bevor sie antworten. Dies sind die intelligentesten bisher veröffentlichten Modelle und ermöglichen es ChatGPT, komplexe Aufgaben mit tiefgehenden Denkfähigkeiten und proaktivem Werkzeugeinsatz zu bewältigen.

Zum ersten Mal können diese Modelle das vollständige Toolset in ChatGPT nutzen: Websuche, Lesen und Analysieren von Dateien über Python, Verarbeitung von Bildeingaben und Generierung von Bildern. Sie sind darauf ausgelegt, autonom zu entscheiden, wann und wie Werkzeuge eingesetzt werden, und antworten schnell (oft unter 1 Minute) im passenden Ausgabeformat.

🚀 Wichtige neue Funktionen

o3-mini

  • Das leistungsstärkste Reasoning-Modell bisher
  • Setzt neue Rekorde bei Benchmarks wie Codeforces, SWE-bench, MMMU
  • Außerordentlich stark bei der Analyse von Bildern, Diagrammen und Grafiken
  • Reduziert schwerwiegende Fehler um 20 % im Vergleich zu o1 bei realen Aufgaben
  • Sehr gut bewertet in Bereichen wie Programmierung, kreatives Denken, Biologie, Mathematik und Ingenieurwesen

o4-mini

  • Kompaktes Modell, optimiert für Geschwindigkeit und Kosten
  • Beeindruckende Leistung bei AIME 2024–2025 mit Python (99,5 % pass@1)
  • Übertrifft o3-mini sowohl bei MINT- als auch Nicht-MINT-Aufgaben (wie Data Science)
  • Ermöglicht höhere Nutzungslimits als o3, geeignet für hohe Abfragefrequenz
Einführung in OpenAI o3 und o4-mini

Einführung in OpenAI o3 und o4-mini

Multimodal


Einführung in OpenAI o3 und o4-mini

Coding

Einführung in OpenAI o3 und o4-mini

Einführung in OpenAI o3 und o4-mini

🧠 Visuelles Reasoning

  • Kann Bilder direkt in Argumentationsketten integrieren
  • Versteht unscharfe Bilder, handschriftliche Tafeln, Lehrbücher oder Skizzen
  • Kann Bilder während des Reasonings drehen, zoomen und bearbeiten
  • Führend bei multimodalen Tests

🔧 Werkzeuge wie ein echter Agent nutzen

Beispiel: die Frage „Wie unterscheidet sich der Stromverbrauch in Kalifornien diesen Sommer im Vergleich zum letzten Jahr?“
→ o3 kann:

  • Nach öffentlichen Versorgungsdaten suchen
  • Python-Code schreiben, um Prognosen zu erstellen
  • Diagramme erstellen, Trends analysieren
  • Werkzeuge flexibel verbinden, proaktiv zusätzliche Daten suchen, falls nötig

⚙️ Effizienz und Kosten optimieren

  • o3 ist intelligenter und kostengünstiger als o1
  • o4-mini ist deutlich effizienter als o3-mini
  • Für die meisten realen Szenarien sind o3 und o4-mini sowohl intelligenter als auch günstiger als frühere Modelle

🔒 Sicherheit und Kontrolle

  • Vollständig aktualisierte Sicherheits-Trainingsdaten
  • Verbesserte Fähigkeit, sensible Inhalte abzulehnen (Biowaffen, Malware usw.)
  • LLM-Überwachungssystem erkennt ~99 % gefährlicher Red-Team-Herausforderungen
  • Umfassend bewertet für selbstlernende KI, Netzwerksicherheit und Biologie – kein hohes Risikoniveau

💻 Codex CLI – Direktes Reasoning aus der Kommandozeile

  • Leichtgewichtiger Coding-Agent, der direkt im Terminal ausgeführt werden kann
  • Unterstützt das Senden von Bildern, Zeichnungen, Screenshots für kombinierte lokale Code-Analyse
  • Open Source auf GitHub
  • 1 Million USD Fördertopf für Projekte, die Codex CLI nutzen (API-Guthaben $25k pro Projekt)

🔓 Zugang und Verteilung

  • ChatGPT Plus-, Pro- und Team-Nutzer können o3, o4-mini, o4-mini-high auswählen
  • Enterprise- und Edu-Nutzer erhalten nach 1 Woche Zugang
  • Kostenlose Nutzer können o4-mini über den „Think“-Button ausprobieren
  • API wird vollständig über Chat Completions und Responses unterstützt
  • Die Responses API wird bald Tool-Integration unterstützen: Websuche, Dateisuche, Code-Erstellung

Source: https://openai.com/index/introducing-o3-and-o4-mini/