OpenAI o3 和 o4-mini 简介

OpenAI 推出了 o3 和 o4-mini——这些智能模型具备深度推理能力，能够利用图像和工具解决复杂问题。这是让 ChatGPT 更接近成为真正自主智能体的重要一步。

今天，OpenAI 正式发布了两款新模型：o3 和 o4-mini —— “o” 系列中最先进的版本，经过训练可在回答前进行更深入的思考。这些是迄今为止最智能的模型，使 ChatGPT 能够处理复杂任务，具备深度推理能力和主动使用工具的能力。

首次，这些模型可以使用 ChatGPT 的全部工具：网页搜索、通过 Python 阅读和分析文件、处理图像输入以及生成图像。它们被设计为自主决定何时以及如何使用工具，并能以合适的输出格式快速响应（通常在1分钟内）。

🚀 主要新特性

o3-mini

迄今为止最强大的推理模型
在 Codeforces、SWE-bench、MMMU 等基准测试上创下新纪录
对图像、图表和曲线分析能力极强
在真实世界任务中，严重错误率比 o1 降低 20%
在编程、创造性思维、生物学、数学和工程等领域评价极高

o4-mini

紧凑型模型，优化了速度和成本
在 AIME 2024–2025 Python 测试中表现出色（99.5% pass@1）
在 STEM 和非 STEM 任务（如数据科学）上均优于 o3-mini
支持比 o3 更高的使用上限，适合高频查询场景

OpenAI o3 和 o4-mini 简介

OpenAI o3 和 o4-mini 简介

多模态

OpenAI o3 和 o4-mini 简介

编程

OpenAI o3 和 o4-mini 简介

OpenAI o3 和 o4-mini 简介

🧠 视觉推理

可将图像直接整合进推理链
能理解模糊图片、手写板、教材或草图
推理过程中可旋转、缩放和编辑图片
在多模态测试中处于领先地位

🔧 像真正的智能体一样使用工具

示例：问题“今年夏天加州的用电量与去年相比如何？”
→ o3 可以：

搜索公共事业数据
编写 Python 代码生成预测
创建图表，分析趋势
灵活连接工具，主动寻找更多数据（如有需要）

⚙️ 优化效率与成本

o3 比 o1 更智能且更具性价比
o4-mini 比 o3-mini 明显更高效
对于大多数真实场景，o3 和 o4-mini 都比以往模型更智能且更便宜

🔒 安全与可控

安全训练数据全面更新
增强了拒绝回答敏感内容（生物武器、恶意软件等）的能力
LLM 监控系统可检测约 99% 的危险红队挑战
针对自学习 AI、网络安全和生物学进行了全面评估——未达到高风险水平

💻 Codex CLI – 命令行直接推理

轻量级编程智能体，可直接在终端运行
支持发送图片、绘图、截图进行本地代码推理
在 GitHub 上开源
为使用 Codex CLI 的项目提供 100 万美元资助（每个项目 API 额度 2.5 万美元）

🔓 访问与分发

ChatGPT Plus、Pro 和 Team 用户可选择 o3、o4-mini、o4-mini-high
企业和教育用户将在一周后获得访问权限
免费用户可通过“Think”按钮试用 o4-mini
API 完全支持 Chat Completions 和 Responses
Responses API 即将支持工具集成：网页搜索、文件搜索、代码编写

Source: https://openai.com/index/introducing-o3-and-o4-mini/

相关文章

人工智能营销变革

ChatGPT 学习新功能

ChatGPT 与 NineQuiz 集成

谷歌人工智能模型 DolphinGemma

Thông tin liên hệ

Email

Info@ninecode.vn

Terms and Conditions

Terms of Use

Privacy Policy

Instructions

User Manual

Contact Support

Other Products

Qr Code Event

Card Visit Online

QR code

Asset QR code

Menu QR code

Ninequiz. một sản phẩm của Ninecode JSC