OpenAI o3 और o4-mini का परिचय

OpenAI ने o3 और o4-मिनी लॉन्च किए हैं – ये बुद्धिमान मॉडल गहन तर्क करने में सक्षम हैं, छवियों और टूल्स का उपयोग करके जटिल समस्याओं का समाधान कर सकते हैं। यह एक महत्वपूर्ण कदम है जो ChatGPT को वास्तव में स्वायत्त एजेंट बनने के और करीब लाता है।

आज, OpenAI ने आधिकारिक रूप से दो नए मॉडल लॉन्च किए हैं: o3 और o4-mini – “o” मॉडल सीरीज़ के सबसे उन्नत संस्करण, जिन्हें उत्तर देने से पहले अधिक सोचने के लिए प्रशिक्षित किया गया है। ये अब तक के सबसे स्मार्ट मॉडल हैं, जो ChatGPT को जटिल कार्यों को गहरी तर्कशक्ति और सक्रिय टूल उपयोग के साथ संभालने में सक्षम बनाते हैं।

पहली बार, ये मॉडल ChatGPT के सभी टूल्स का पूरा उपयोग कर सकते हैं: वेब सर्च, Python के माध्यम से फाइलें पढ़ना और विश्लेषण करना, इमेज इनपुट प्रोसेस करना, और इमेज जनरेट करना। इन्हें स्वतंत्र रूप से तय करने के लिए डिज़ाइन किया गया है कि कब और कैसे टूल्स का उपयोग करें, और उपयुक्त आउटपुट फॉर्मेट में तेज़ी से (अक्सर 1 मिनट से कम में) प्रतिक्रिया दें।

🚀 मुख्य नई विशेषताएँ

o3-mini

  • अब तक का सबसे शक्तिशाली तर्कशक्ति मॉडल
  • Codeforces, SWE-bench, MMMU जैसे बेंचमार्क पर नए रिकॉर्ड स्थापित करता है
  • इमेज, चार्ट और ग्राफ़ का विश्लेषण करने में बेहद सक्षम
  • वास्तविक दुनिया के कार्यों में o1 की तुलना में गंभीर त्रुटियों को 20% तक कम करता है
  • प्रोग्रामिंग, रचनात्मक सोच, जीवविज्ञान, गणित और इंजीनियरिंग जैसे क्षेत्रों में उच्च रेटिंग

o4-mini

  • कॉम्पैक्ट मॉडल, गति और लागत के लिए अनुकूलित
  • AIME 2024–2025 पर Python का उपयोग करते हुए शानदार प्रदर्शन (99.5% pass@1)
  • STEM और गैर-STEM कार्यों (जैसे डेटा साइंस) दोनों में o3-mini से बेहतर प्रदर्शन
  • o3 की तुलना में अधिक उपयोग सीमा, उच्च क्वेरी फ्रीक्वेंसी के लिए उपयुक्त
OpenAI o3 और o4-mini का परिचय

OpenAI o3 और o4-mini का परिचय

मल्टीमोडल


OpenAI o3 और o4-mini का परिचय

कोडिंग

OpenAI o3 और o4-mini का परिचय

OpenAI o3 और o4-mini का परिचय

🧠 विज़ुअल रीजनिंग

  • तर्क की श्रृंखला में सीधे इमेज को जोड़ सकता है
  • धुंधली इमेज, हस्तलिखित बोर्ड, पाठ्यपुस्तकें या स्केच समझ सकता है
  • तर्क के दौरान इमेज को घुमा, ज़ूम और संपादित कर सकता है
  • मल्टीमोडल परीक्षणों में अग्रणी

🔧 एक सच्चे एजेंट की तरह टूल्स का उपयोग

उदाहरण: प्रश्न “इस गर्मी में कैलिफ़ोर्निया में बिजली की खपत पिछले साल की तुलना में कैसी है?”
→ o3 कर सकता है:

  • सार्वजनिक यूटिलिटी डेटा खोजें
  • पूर्वानुमान बनाने के लिए Python कोड लिखें
  • चार्ट बनाएं, रुझानों का विश्लेषण करें
  • टूल्स को लचीले ढंग से जोड़ें, आवश्यकता होने पर अतिरिक्त डेटा सक्रिय रूप से खोजें

⚙️ प्रभावशीलता और लागत का अनुकूलन

  • o3, o1 की तुलना में अधिक स्मार्ट और लागत प्रभावी है
  • o4-mini, o3-mini की तुलना में काफी अधिक कुशल है
  • अधिकांश वास्तविक दुनिया की परिस्थितियों में, o3 और o4-mini दोनों ही पिछले मॉडलों की तुलना में अधिक स्मार्ट और सस्ते हैं

🔒 सुरक्षा और नियंत्रण

  • पूरी तरह से अपडेटेड सुरक्षा प्रशिक्षण डेटा
  • संवेदनशील सामग्री (जैसे बायोवेपन्स, मैलवेयर आदि) का उत्तर देने से इनकार करने की बेहतर क्षमता
  • LLM मॉनिटरिंग सिस्टम लगभग 99% खतरनाक रेड-टीम चुनौतियों का पता लगाता है
  • सेल्फ-लर्निंग AI, नेटवर्क सुरक्षा और जीवविज्ञान के लिए पूरी तरह से मूल्यांकन – उच्च जोखिम स्तर पर नहीं

💻 Codex CLI – कमांड लाइन से सीधा तर्क

  • हल्का कोडिंग एजेंट जो सीधे टर्मिनल में चल सकता है
  • इमेज, ड्रॉइंग, स्क्रीनशॉट भेजने का समर्थन करता है ताकि स्थानीय कोड तर्क के साथ जोड़ा जा सके
  • GitHub पर ओपन सोर्स
  • Codex CLI का उपयोग करने वाले प्रोजेक्ट्स के लिए $1 मिलियन USD अनुदान निधि (प्रति प्रोजेक्ट $25k API क्रेडिट)

🔓 पहुंच और वितरण

  • ChatGPT Plus, Pro, और Team उपयोगकर्ता o3, o4-mini, o4-mini-high चुन सकते हैं
  • Enterprise और Edu उपयोगकर्ताओं को 1 सप्ताह बाद एक्सेस मिलेगा
  • फ्री उपयोगकर्ता “Think” बटन के माध्यम से o4-mini आज़मा सकते हैं
  • API पूरी तरह से Chat Completions और Responses के माध्यम से समर्थित
  • Responses API जल्द ही टूल इंटीग्रेशन का समर्थन करेगा: वेब सर्च, फाइल सर्च, कोड लेखन

Source: https://openai.com/index/introducing-o3-and-o4-mini/