Giới thiệu OpenAI o3 và o4-mini

OpenAI ra mắt o3 và o4-mini – mô hình thông minh có khả năng tư duy sâu, sử dụng hình ảnh và công cụ để giải quyết vấn đề phức tạp. Đây là bước tiến quan trọng giúp ChatGPT tiến gần hơn đến vai trò agent tự chủ thực thụ.

Hôm nay, OpenAI chính thức ra mắt hai mô hình mới: o3o4-mini – phiên bản tiên tiến nhất trong dòng mô hình “o”, được huấn luyện để suy nghĩ lâu hơn trước khi trả lời. Đây là những mô hình thông minh nhất từng được phát hành, giúp ChatGPT xử lý các tác vụ phức tạp với khả năng suy luận sâu và sử dụng công cụ một cách chủ động.

Lần đầu tiên, các mô hình này có thể sử dụng toàn bộ công cụ trong ChatGPT: tìm kiếm web, đọc và phân tích file qua Python, xử lý đầu vào hình ảnh và tạo hình ảnh. Chúng được thiết kế để tự quyết định khi nào và cách nào sử dụng công cụ, trả lời nhanh chóng (thường dưới 1 phút) bằng định dạng đầu ra phù hợp.

🚀 Những điểm mới nổi bật

o3-mini

  • Mô hình suy luận mạnh nhất hiện nay
  • Thiết lập kỷ lục mới trên các benchmark như Codeforces, SWE-bench, MMMU
  • Phân tích hình ảnh, biểu đồ, đồ thị cực kỳ mạnh
  • Giảm 20% lỗi nghiêm trọng so với o1 trên các tác vụ thực tế
  • Được đánh giá cao trong các lĩnh vực như lập trình, tư duy sáng tạo, sinh học, toán học, kỹ thuật

o4-mini

  • Mô hình nhỏ, tối ưu tốc độ và chi phí
  • Hiệu suất ấn tượng trên AIME 2024–2025 khi dùng Python (99.5% pass@1)
  • Vượt trội o3-mini cả ở bài toán STEM và phi-STEM (như khoa học dữ liệu)
  • Cho phép giới hạn sử dụng cao hơn o3, phù hợp với tần suất truy vấn lớn
Giới thiệu OpenAI o3 và o4-mini

Giới thiệu OpenAI o3 và o4-mini

Đa phương thức


Giới thiệu OpenAI o3 và o4-mini

Mã hóa

Giới thiệu OpenAI o3 và o4-mini

Giới thiệu OpenAI o3 và o4-mini

🧠 Tư duy bằng hình ảnh

  • Có thể tích hợp hình ảnh trực tiếp vào chuỗi suy luận
  • Hiểu ảnh mờ, ảnh bảng viết tay, sách giáo khoa hoặc bản vẽ phác thảo
  • Có thể xoay, thu phóng, chỉnh sửa ảnh trong quá trình lập luận
  • Dẫn đầu trong các bài kiểm tra đa phương tiện (multimodal)

🔧 Sử dụng công cụ như một agent thực thụ

Ví dụ: câu hỏi “Lượng tiêu thụ điện tại California mùa hè năm nay so với năm ngoái thế nào?”
→ o3 có thể:

  • Tìm kiếm dữ liệu tiện ích công cộng
  • Viết mã Python tạo dự báo
  • Tạo biểu đồ, phân tích xu hướng
  • Gắn kết các công cụ một cách linh hoạt, chủ động tìm thêm dữ liệu nếu cần

⚙️ Tối ưu hóa hiệu quả và chi phí

  • o3 thông minh và tiết kiệm hơn o1
  • o4-mini hiệu quả hơn rõ rệt so với o3-mini
  • Với hầu hết tình huống thực tế, o3 và o4-mini vừa thông minh hơn, vừa rẻ hơn các mô hình trước

🔒 An toàn và kiểm soát

  • Cập nhật toàn bộ dữ liệu huấn luyện về an toàn
  • Nâng cấp khả năng từ chối trả lời các nội dung nhạy cảm (vũ khí sinh học, phần mềm độc hại…)
  • Hệ thống giám sát LLM giúp phát hiện ~99% các thử thách red-team nguy hiểm
  • Đã được đánh giá kỹ về AI tự học, bảo mật mạng và sinh học – chưa đạt mức rủi ro cao

💻 Codex CLI – Suy luận trực tiếp từ dòng lệnh

  • Trình agent mã hóa nhẹ có thể chạy ngay trên terminal
  • Hỗ trợ truyền hình ảnh, bản vẽ, ảnh chụp màn hình để suy luận kết hợp mã cục bộ
  • Open source trên GitHub
  • Cung cấp quỹ tài trợ $1 triệu USD cho các dự án sử dụng Codex CLI (API credits $25k mỗi suất)

🔓 Truy cập và phân phối

  • Người dùng ChatGPT Plus, Pro, Team có thể chọn o3, o4-mini, o4-mini-high
  • Người dùng Enterprise, Edu sẽ có sau 1 tuần
  • Người dùng miễn phí có thể thử o4-mini qua nút “Think”
  • API hỗ trợ đầy đủ qua Chat Completions và Responses
  • Responses API sắp hỗ trợ tích hợp công cụ: tìm web, tìm file, viết mã

Source: https://openai.com/index/introducing-o3-and-o4-mini/