แนะนำ OpenAI o3 และ o4-mini

OpenAI เปิดตัว o3 และ o4-mini – โมเดลอัจฉริยะที่มีความสามารถในการให้เหตุผลเชิงลึก ใช้ภาพและเครื่องมือในการแก้ปัญหาที่ซับซ้อน นี่เป็นก้าวสำคัญที่ทำให้ ChatGPT เข้าใกล้การเป็นเอเจนต์อัตโนมัติอย่างแท้จริง

วันนี้ OpenAI เปิดตัวโมเดลใหม่สองตัวอย่างเป็นทางการ: o3 และ o4-mini – เวอร์ชันที่ล้ำหน้าที่สุดในซีรีส์โมเดล “o” ซึ่งได้รับการฝึกฝนให้ คิดนานขึ้นก่อนตอบ นี่คือโมเดลที่ฉลาดที่สุดที่เคยเปิดตัวมา ช่วยให้ ChatGPT จัดการงานที่ซับซ้อนได้ด้วยความสามารถในการให้เหตุผลเชิงลึกและการใช้เครื่องมืออย่างเชิงรุก

เป็นครั้งแรกที่โมเดลเหล่านี้สามารถใช้เครื่องมือทั้งหมดใน ChatGPT ได้: ค้นหาเว็บ อ่านและวิเคราะห์ไฟล์ผ่าน Python ประมวลผลอินพุตภาพ และสร้างภาพ พวกเขาถูกออกแบบมาให้ ตัดสินใจใช้เครื่องมือได้อย่างอัตโนมัติทั้งเวลาและวิธีการ พร้อมตอบสนองอย่างรวดเร็ว (มักใช้เวลาต่ำกว่า 1 นาที) ในรูปแบบผลลัพธ์ที่เหมาะสม

🚀 ฟีเจอร์ใหม่ที่สำคัญ

o3-mini

โมเดลให้เหตุผลที่ทรงพลังที่สุดจนถึงปัจจุบัน
สร้างสถิติใหม่บนเกณฑ์วัดผล เช่น Codeforces, SWE-bench, MMMU
แข็งแกร่งมากในการวิเคราะห์ภาพ แผนภูมิ และกราฟ
ลดข้อผิดพลาดร้ายแรงลง 20% เมื่อเทียบกับ o1 ในงานจริง
ได้รับคะแนนสูงในด้านโปรแกรมมิ่ง ความคิดสร้างสรรค์ ชีววิทยา คณิตศาสตร์ และวิศวกรรม

o4-mini

โมเดลขนาดกะทัดรัด ปรับแต่งเพื่อความเร็วและประหยัดต้นทุน
ประสิทธิภาพโดดเด่นในการสอบ AIME 2024–2025 ด้วย Python (ผ่าน@1 99.5%)
เหนือกว่า o3-mini ทั้งงานสาย STEM และไม่ใช่ STEM (เช่น data science)
อนุญาตให้ใช้งานได้มากกว่า o3 เหมาะสำหรับการส่งคำถามบ่อย

มัลติโหมด

โค้ดดิ้ง

🧠 การให้เหตุผลด้วยภาพ

สามารถผสานภาพเข้ากับกระบวนการให้เหตุผลได้โดยตรง
เข้าใจภาพเบลอ กระดานเขียนด้วยลายมือ ตำรา หรือภาพร่าง
หมุน ขยาย และแก้ไขภาพระหว่างให้เหตุผลได้
เป็นผู้นำในการทดสอบมัลติโหมด

🔧 ใช้เครื่องมือเหมือนเอเจนต์จริง

ตัวอย่าง: คำถาม “การใช้ไฟฟ้าในแคลิฟอร์เนียช่วงฤดูร้อนนี้เทียบกับปีที่แล้วเป็นอย่างไร?”
→ o3 สามารถ:

ค้นหาข้อมูลสาธารณูปโภคสาธารณะ
เขียนโค้ด Python เพื่อสร้างการคาดการณ์
สร้างแผนภูมิ วิเคราะห์แนวโน้ม
เชื่อมต่อเครื่องมืออย่างยืดหยุ่น ค้นหาข้อมูลเพิ่มเติมหากจำเป็น

⚙️ เพิ่มประสิทธิภาพและลดต้นทุน

o3 ฉลาดและคุ้มค่ากว่า o1
o4-mini มีประสิทธิภาพมากกว่า o3-mini อย่างเห็นได้ชัด
ในสถานการณ์จริงส่วนใหญ่ o3 และ o4-mini ทั้งฉลาดและถูกกว่ารุ่นก่อน

🔒 ความปลอดภัยและการควบคุม

อัปเดตข้อมูลฝึกอบรมด้านความปลอดภัยอย่างสมบูรณ์
เพิ่มความสามารถในการปฏิเสธตอบเนื้อหาละเอียดอ่อน (อาวุธชีวภาพ มัลแวร์ ฯลฯ)
ระบบตรวจสอบ LLM ตรวจจับความท้าทายอันตรายแบบ red-team ได้ ~99%
ประเมินอย่างละเอียดด้าน AI ที่เรียนรู้ด้วยตนเอง ความปลอดภัยเครือข่าย และชีววิทยา – ไม่อยู่ในระดับเสี่ยงสูง

💻 Codex CLI – ให้เหตุผลตรงจากคอมมานด์ไลน์

เอเจนต์โค้ดดิ้งน้ำหนักเบาที่รันได้โดยตรงในเทอร์มินัล
รองรับการส่งภาพ วาดมือ สกรีนช็อต เพื่อให้เหตุผลกับโค้ดในเครื่อง
โอเพ่นซอร์สบน GitHub
กองทุนสนับสนุน $1 ล้านดอลลาร์สหรัฐสำหรับโปรเจกต์ที่ใช้ Codex CLI (เครดิต API $25k ต่อโปรเจกต์)

🔓 การเข้าถึงและการกระจาย