Pengantar OpenAI o3 dan o4-mini

OpenAI meluncurkan o3 dan o4-mini – model cerdas yang mampu melakukan penalaran mendalam, memanfaatkan gambar dan alat untuk memecahkan masalah yang kompleks. Ini merupakan langkah penting yang membawa ChatGPT lebih dekat untuk menjadi agen yang benar-benar otonom.

Hari ini, OpenAI secara resmi meluncurkan dua model baru: o3 dan o4-mini – versi paling canggih dalam seri model “o”, yang dilatih untuk berpikir lebih lama sebelum menjawab. Ini adalah model paling pintar yang pernah dirilis, memungkinkan ChatGPT menangani tugas kompleks dengan kemampuan penalaran mendalam dan penggunaan alat secara proaktif.

Untuk pertama kalinya, model-model ini dapat menggunakan seluruh rangkaian alat di ChatGPT: pencarian web, membaca dan menganalisis file melalui Python, memproses input gambar, dan menghasilkan gambar. Model ini dirancang untuk secara mandiri memutuskan kapan dan bagaimana menggunakan alat, merespons dengan cepat (sering kali di bawah 1 menit) dalam format output yang sesuai.

🚀 Fitur Baru Utama

o3-mini

  • Model penalaran terkuat hingga saat ini
  • Mencetak rekor baru pada tolok ukur seperti Codeforces, SWE-bench, MMMU
  • Sangat unggul dalam menganalisis gambar, grafik, dan diagram
  • Mengurangi kesalahan serius sebesar 20% dibandingkan o1 pada tugas dunia nyata
  • Mendapat penilaian tinggi di bidang seperti pemrograman, berpikir kreatif, biologi, matematika, dan teknik

o4-mini

  • Model ringkas, dioptimalkan untuk kecepatan dan biaya
  • Performa impresif pada AIME 2024–2025 menggunakan Python (99,5% pass@1)
  • Mengungguli o3-mini pada tugas STEM maupun non-STEM (seperti data science)
  • Memungkinkan batas penggunaan lebih tinggi dibanding o3, cocok untuk frekuensi permintaan tinggi
Pengantar OpenAI o3 dan o4-mini

Pengantar OpenAI o3 dan o4-mini

Multimodal


Pengantar OpenAI o3 dan o4-mini

Coding

Pengantar OpenAI o3 dan o4-mini

Pengantar OpenAI o3 dan o4-mini

🧠 Penalaran Visual

  • Dapat langsung mengintegrasikan gambar ke dalam rantai penalaran
  • Memahami gambar buram, papan tulis tulisan tangan, buku teks, atau sketsa
  • Dapat memutar, memperbesar, dan mengedit gambar selama penalaran
  • Unggul dalam pengujian multimodal

🔧 Menggunakan alat seperti agen sejati

Contoh: pertanyaan “Bagaimana konsumsi listrik di California musim panas ini dibandingkan tahun lalu?”
→ o3 dapat:

  • Mencari data utilitas publik
  • Menulis kode Python untuk menghasilkan prediksi
  • Membuat grafik, menganalisis tren
  • Menghubungkan alat secara fleksibel, secara proaktif mencari data tambahan jika diperlukan

⚙️ Mengoptimalkan efisiensi dan biaya

  • o3 lebih pintar dan lebih hemat biaya dibanding o1
  • o4-mini jauh lebih efisien daripada o3-mini
  • Untuk sebagian besar skenario dunia nyata, o3 dan o4-mini keduanya lebih pintar dan lebih murah dibanding model sebelumnya

🔒 Keamanan dan kontrol

  • Data pelatihan keamanan diperbarui sepenuhnya
  • Kemampuan lebih baik untuk menolak menjawab konten sensitif (senjata biologis, malware, dll.)
  • Sistem pemantauan LLM mendeteksi ~99% tantangan red-team berbahaya
  • Dievaluasi secara menyeluruh untuk AI pembelajaran mandiri, keamanan jaringan, dan biologi – tidak pada tingkat risiko tinggi

💻 Codex CLI – Penalaran langsung dari command line

  • Agen pemrograman ringan yang dapat dijalankan langsung di terminal
  • Mendukung pengiriman gambar, gambar tangan, tangkapan layar untuk penalaran kode lokal gabungan
  • Open source di GitHub
  • Dana hibah $1 juta USD untuk proyek yang menggunakan Codex CLI (kredit API $25k per proyek)

🔓 Akses dan distribusi

  • Pengguna ChatGPT Plus, Pro, dan Team dapat memilih o3, o4-mini, o4-mini-high
  • Pengguna Enterprise dan Edu akan mendapatkan akses setelah 1 minggu
  • Pengguna gratis dapat mencoba o4-mini melalui tombol “Think”
  • API didukung penuh melalui Chat Completions dan Responses
  • Responses API segera akan mendukung integrasi alat: pencarian web, pencarian file, penulisan kode

Source: https://openai.com/index/introducing-o3-and-o4-mini/

model AI DolphinGemma dari Google

buat pertanyaan pilihan ganda dengan ChatGPT

AI memberdayakan evolusi pemasaran

Thông tin liên hệ

Email

Info@ninecode.vn

Ninequiz. một sản phẩm của Ninecode JSC