วันนี้ OpenAI เปิดตัวโมเดลใหม่สองตัวอย่างเป็นทางการ: o3 และ o4-mini – เวอร์ชันที่ล้ำหน้าที่สุดในซีรีส์โมเดล “o” ซึ่งได้รับการฝึกฝนให้ คิดนานขึ้นก่อนตอบ นี่คือโมเดลที่ฉลาดที่สุดที่เคยเปิดตัวมา ช่วยให้ ChatGPT จัดการงานที่ซับซ้อนได้ด้วยความสามารถในการให้เหตุผลเชิงลึกและการใช้เครื่องมืออย่างเชิงรุก
เป็นครั้งแรกที่โมเดลเหล่านี้สามารถใช้เครื่องมือทั้งหมดใน ChatGPT ได้: ค้นหาเว็บ อ่านและวิเคราะห์ไฟล์ผ่าน Python ประมวลผลอินพุตภาพ และสร้างภาพ พวกเขาถูกออกแบบมาให้ ตัดสินใจใช้เครื่องมือได้อย่างอัตโนมัติทั้งเวลาและวิธีการ พร้อมตอบสนองอย่างรวดเร็ว (มักใช้เวลาต่ำกว่า 1 นาที) ในรูปแบบผลลัพธ์ที่เหมาะสม
🚀 ฟีเจอร์ใหม่ที่สำคัญ
o3-mini
- โมเดลให้เหตุผลที่ทรงพลังที่สุดจนถึงปัจจุบัน
- สร้างสถิติใหม่บนเกณฑ์วัดผล เช่น Codeforces, SWE-bench, MMMU
- แข็งแกร่งมากในการวิเคราะห์ภาพ แผนภูมิ และกราฟ
- ลดข้อผิดพลาดร้ายแรงลง 20% เมื่อเทียบกับ o1 ในงานจริง
- ได้รับคะแนนสูงในด้านโปรแกรมมิ่ง ความคิดสร้างสรรค์ ชีววิทยา คณิตศาสตร์ และวิศวกรรม
o4-mini
- โมเดลขนาดกะทัดรัด ปรับแต่งเพื่อความเร็วและประหยัดต้นทุน
- ประสิทธิภาพโดดเด่นในการสอบ AIME 2024–2025 ด้วย Python (ผ่าน@1 99.5%)
- เหนือกว่า o3-mini ทั้งงานสาย STEM และไม่ใช่ STEM (เช่น data science)
- อนุญาตให้ใช้งานได้มากกว่า o3 เหมาะสำหรับการส่งคำถามบ่อย
มัลติโหมด
โค้ดดิ้ง
🧠 การให้เหตุผลด้วยภาพ
- สามารถผสานภาพเข้ากับกระบวนการให้เหตุผลได้โดยตรง
- เข้าใจภาพเบลอ กระดานเขียนด้วยลายมือ ตำรา หรือภาพร่าง
- หมุน ขยาย และแก้ไขภาพระหว่างให้เหตุผลได้
- เป็นผู้นำในการทดสอบมัลติโหมด
🔧 ใช้เครื่องมือเหมือนเอเจนต์จริง
ตัวอย่าง: คำถาม “การใช้ไฟฟ้าในแคลิฟอร์เนียช่วงฤดูร้อนนี้เทียบกับปีที่แล้วเป็นอย่างไร?”
→ o3 สามารถ:
- ค้นหาข้อมูลสาธารณูปโภคสาธารณะ
- เขียนโค้ด Python เพื่อสร้างการคาดการณ์
- สร้างแผนภูมิ วิเคราะห์แนวโน้ม
- เชื่อมต่อเครื่องมืออย่างยืดหยุ่น ค้นหาข้อมูลเพิ่มเติมหากจำเป็น
⚙️ เพิ่มประสิทธิภาพและลดต้นทุน
- o3 ฉลาดและคุ้มค่ากว่า o1
- o4-mini มีประสิทธิภาพมากกว่า o3-mini อย่างเห็นได้ชัด
- ในสถานการณ์จริงส่วนใหญ่ o3 และ o4-mini ทั้งฉลาดและถูกกว่ารุ่นก่อน
🔒 ความปลอดภัยและการควบคุม
- อัปเดตข้อมูลฝึกอบรมด้านความปลอดภัยอย่างสมบูรณ์
- เพิ่มความสามารถในการปฏิเสธตอบเนื้อหาละเอียดอ่อน (อาวุธชีวภาพ มัลแวร์ ฯลฯ)
- ระบบตรวจสอบ LLM ตรวจจับความท้าทายอันตรายแบบ red-team ได้ ~99%
- ประเมินอย่างละเอียดด้าน AI ที่เรียนรู้ด้วยตนเอง ความปลอดภัยเครือข่าย และชีววิทยา – ไม่อยู่ในระดับเสี่ยงสูง
💻 Codex CLI – ให้เหตุผลตรงจากคอมมานด์ไลน์
- เอเจนต์โค้ดดิ้งน้ำหนักเบาที่รันได้โดยตรงในเทอร์มินัล
- รองรับการส่งภาพ วาดมือ สกรีนช็อต เพื่อให้เหตุผลกับโค้ดในเครื่อง
- โอเพ่นซอร์สบน GitHub
- กองทุนสนับสนุน $1 ล้านดอลลาร์สหรัฐสำหรับโปรเจกต์ที่ใช้ Codex CLI (เครดิต API $25k ต่อโปรเจกต์)
🔓 การเข้าถึงและการกระจาย
- ผู้ใช้ ChatGPT Plus, Pro และ Team สามารถเลือก o3, o4-mini, o4-mini-high
- ผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้หลัง 1 สัปดาห์
- ผู้ใช้ฟรีสามารถทดลอง o4-mini ได้ผ่านปุ่ม “Think”
- API รองรับเต็มรูปแบบผ่าน Chat Completions และ Responses
- Responses API จะรองรับการผสานเครื่องมือเร็วๆ นี้: ค้นหาเว็บ ค้นหาไฟล์ เขียนโค้ด
Source: https://openai.com/index/introducing-o3-and-o4-mini/
บทความที่เกี่ยวข้อง
ChatGPT ฟีเจอร์ใหม่สำหรับการเรียนรู้
mô hình AI DolphinGemma của Google
วิวัฒนาการด้านการตลาดที่ขับเคลื่อนด้วย AI