แนะนำ OpenAI o3 และ o4-mini

OpenAI เปิดตัว o3 และ o4-mini – โมเดลอัจฉริยะที่มีความสามารถในการให้เหตุผลเชิงลึก ใช้ภาพและเครื่องมือในการแก้ปัญหาที่ซับซ้อน นี่เป็นก้าวสำคัญที่ทำให้ ChatGPT เข้าใกล้การเป็นเอเจนต์อัตโนมัติอย่างแท้จริง

วันนี้ OpenAI เปิดตัวโมเดลใหม่สองตัวอย่างเป็นทางการ: o3 และ o4-mini – เวอร์ชันที่ล้ำหน้าที่สุดในซีรีส์โมเดล “o” ซึ่งได้รับการฝึกฝนให้ คิดนานขึ้นก่อนตอบ นี่คือโมเดลที่ฉลาดที่สุดที่เคยเปิดตัวมา ช่วยให้ ChatGPT จัดการงานที่ซับซ้อนได้ด้วยความสามารถในการให้เหตุผลเชิงลึกและการใช้เครื่องมืออย่างเชิงรุก

เป็นครั้งแรกที่โมเดลเหล่านี้สามารถใช้เครื่องมือทั้งหมดใน ChatGPT ได้: ค้นหาเว็บ อ่านและวิเคราะห์ไฟล์ผ่าน Python ประมวลผลอินพุตภาพ และสร้างภาพ พวกเขาถูกออกแบบมาให้ ตัดสินใจใช้เครื่องมือได้อย่างอัตโนมัติทั้งเวลาและวิธีการ พร้อมตอบสนองอย่างรวดเร็ว (มักใช้เวลาต่ำกว่า 1 นาที) ในรูปแบบผลลัพธ์ที่เหมาะสม

🚀 ฟีเจอร์ใหม่ที่สำคัญ

o3-mini

  • โมเดลให้เหตุผลที่ทรงพลังที่สุดจนถึงปัจจุบัน
  • สร้างสถิติใหม่บนเกณฑ์วัดผล เช่น Codeforces, SWE-bench, MMMU
  • แข็งแกร่งมากในการวิเคราะห์ภาพ แผนภูมิ และกราฟ
  • ลดข้อผิดพลาดร้ายแรงลง 20% เมื่อเทียบกับ o1 ในงานจริง
  • ได้รับคะแนนสูงในด้านโปรแกรมมิ่ง ความคิดสร้างสรรค์ ชีววิทยา คณิตศาสตร์ และวิศวกรรม

o4-mini

  • โมเดลขนาดกะทัดรัด ปรับแต่งเพื่อความเร็วและประหยัดต้นทุน
  • ประสิทธิภาพโดดเด่นในการสอบ AIME 2024–2025 ด้วย Python (ผ่าน@1 99.5%)
  • เหนือกว่า o3-mini ทั้งงานสาย STEM และไม่ใช่ STEM (เช่น data science)
  • อนุญาตให้ใช้งานได้มากกว่า o3 เหมาะสำหรับการส่งคำถามบ่อย
แนะนำ OpenAI o3 และ o4-mini

แนะนำ OpenAI o3 และ o4-mini

มัลติโหมด


แนะนำ OpenAI o3 และ o4-mini

โค้ดดิ้ง

แนะนำ OpenAI o3 และ o4-mini

แนะนำ OpenAI o3 และ o4-mini

🧠 การให้เหตุผลด้วยภาพ

  • สามารถผสานภาพเข้ากับกระบวนการให้เหตุผลได้โดยตรง
  • เข้าใจภาพเบลอ กระดานเขียนด้วยลายมือ ตำรา หรือภาพร่าง
  • หมุน ขยาย และแก้ไขภาพระหว่างให้เหตุผลได้
  • เป็นผู้นำในการทดสอบมัลติโหมด

🔧 ใช้เครื่องมือเหมือนเอเจนต์จริง

ตัวอย่าง: คำถาม “การใช้ไฟฟ้าในแคลิฟอร์เนียช่วงฤดูร้อนนี้เทียบกับปีที่แล้วเป็นอย่างไร?”
→ o3 สามารถ:

  • ค้นหาข้อมูลสาธารณูปโภคสาธารณะ
  • เขียนโค้ด Python เพื่อสร้างการคาดการณ์
  • สร้างแผนภูมิ วิเคราะห์แนวโน้ม
  • เชื่อมต่อเครื่องมืออย่างยืดหยุ่น ค้นหาข้อมูลเพิ่มเติมหากจำเป็น

⚙️ เพิ่มประสิทธิภาพและลดต้นทุน

  • o3 ฉลาดและคุ้มค่ากว่า o1
  • o4-mini มีประสิทธิภาพมากกว่า o3-mini อย่างเห็นได้ชัด
  • ในสถานการณ์จริงส่วนใหญ่ o3 และ o4-mini ทั้งฉลาดและถูกกว่ารุ่นก่อน

🔒 ความปลอดภัยและการควบคุม

  • อัปเดตข้อมูลฝึกอบรมด้านความปลอดภัยอย่างสมบูรณ์
  • เพิ่มความสามารถในการปฏิเสธตอบเนื้อหาละเอียดอ่อน (อาวุธชีวภาพ มัลแวร์ ฯลฯ)
  • ระบบตรวจสอบ LLM ตรวจจับความท้าทายอันตรายแบบ red-team ได้ ~99%
  • ประเมินอย่างละเอียดด้าน AI ที่เรียนรู้ด้วยตนเอง ความปลอดภัยเครือข่าย และชีววิทยา – ไม่อยู่ในระดับเสี่ยงสูง

💻 Codex CLI – ให้เหตุผลตรงจากคอมมานด์ไลน์

  • เอเจนต์โค้ดดิ้งน้ำหนักเบาที่รันได้โดยตรงในเทอร์มินัล
  • รองรับการส่งภาพ วาดมือ สกรีนช็อต เพื่อให้เหตุผลกับโค้ดในเครื่อง
  • โอเพ่นซอร์สบน GitHub
  • กองทุนสนับสนุน $1 ล้านดอลลาร์สหรัฐสำหรับโปรเจกต์ที่ใช้ Codex CLI (เครดิต API $25k ต่อโปรเจกต์)

🔓 การเข้าถึงและการกระจาย

  • ผู้ใช้ ChatGPT Plus, Pro และ Team สามารถเลือก o3, o4-mini, o4-mini-high
  • ผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้หลัง 1 สัปดาห์
  • ผู้ใช้ฟรีสามารถทดลอง o4-mini ได้ผ่านปุ่ม “Think”
  • API รองรับเต็มรูปแบบผ่าน Chat Completions และ Responses
  • Responses API จะรองรับการผสานเครื่องมือเร็วๆ นี้: ค้นหาเว็บ ค้นหาไฟล์ เขียนโค้ด

Source: https://openai.com/index/introducing-o3-and-o4-mini/

บทความที่เกี่ยวข้อง

ChatGPT ฟีเจอร์ใหม่สำหรับการเรียนรู้

mô hình AI DolphinGemma của Google

วิวัฒนาการด้านการตลาดที่ขับเคลื่อนด้วย AI

การเติบโตขององค์กรที่ขับเคลื่อนด้วย AI

เทคโนโลยี AI ในโรงเรียนยุคใหม่

Thông tin liên hệ

Email

Info@ninecode.vn

Ninequiz. một sản phẩm của Ninecode JSC