OpenAI تطرح طراز o3 من الجيل التالي أوائل العام المقبل
تاريخ النشر: 21st, December 2024 GMT
بعد ما يقرب من أسبوعين من الإعلانات، اختتمت OpenAI سلسلة البث المباشر التي استمرت 12 يومًا من OpenAI بمعاينة لطرازها الرائد من الجيل التالي. قال الرئيس التنفيذي لشركة OpenAI سام ألتمان لأولئك الذين شاهدوا الإعلان على YouTube: "احترامًا للأصدقاء في Telefónica (مالك شبكة O2 الخلوية في أوروبا)، ووفقًا للتقاليد العظيمة التي تتسم بها OpenAI بأنها سيئة حقًا في الأسماء، فقد أطلقنا عليها اسم o3".
الطراز الجديد ليس جاهزًا للاستخدام العام حتى الآن. بدلاً من ذلك، تجعل OpenAI أولاً o3 متاحًا للباحثين الذين يريدون المساعدة في اختبارات السلامة. كما أعلنت OpenAI عن وجود o3-mini. قال ألتمان إن الشركة تخطط لإطلاق هذا الطراز "في نهاية شهر يناير"، مع إطلاق o3 "بعد ذلك بفترة وجيزة".
كما قد تتوقع، يقدم o3 أداءً محسنًا مقارنة بسابقه، ولكن ما مدى تفوقه على o1 هو السمة الرئيسية هنا. على سبيل المثال، عندما تم اجتياز امتحان الرياضيات الأمريكي لهذا العام، حققت o3 درجة دقة بلغت 96.7 في المائة. وعلى النقيض من ذلك، حصلت o1 على تصنيف أكثر تواضعًا بنسبة 83.3 في المائة. قال مارك تشين، نائب الرئيس الأول للأبحاث في OpenAI: "ما يدل على ذلك هو أن o3 غالبًا ما تفوت سؤالاً واحدًا فقط". في الواقع، حققت o3 أداءً جيدًا للغاية في مجموعة المعايير المعتادة التي تضعها OpenAI لنماذجها لدرجة أن الشركة اضطرت إلى إيجاد اختبارات أكثر تحديًا لمقارنتها بها.
أحد هذه الاختبارات هو ARC-AGI، وهو معيار يختبر قدرة خوارزمية الذكاء الاصطناعي على الحدس والتعلم على الفور. وفقًا لمبتكر الاختبار، مؤسسة ARC Prize غير الربحية، فإن نظام الذكاء الاصطناعي الذي يمكنه التغلب بنجاح على ARC-AGI من شأنه أن يمثل "معلمًا مهمًا نحو الذكاء الاصطناعي العام". منذ ظهوره لأول مرة في عام 2019، لم يتفوق أي نموذج للذكاء الاصطناعي على ARC-AGI. يتكون الاختبار من أسئلة الإدخال والإخراج التي يمكن لمعظم الناس فهمها بشكل حدسي. على سبيل المثال، في المثال أعلاه، ستكون الإجابة الصحيحة هي إنشاء مربعات من البوليومينو الأربعة باستخدام كتل زرقاء داكنة.
في إعداد الحوسبة المنخفضة، سجل o3 نسبة 75.7 في المائة في الاختبار. مع قوة المعالجة الإضافية، حقق النموذج تصنيفًا بنسبة 87.5 في المائة. وفقًا لـ Greg Kamradt، رئيس مؤسسة ARC Prize Foundation، "الأداء البشري قابل للمقارنة عند عتبة 85 في المائة، لذا فإن تجاوز هذا يعد إنجازًا رئيسيًا".
استعرضت OpenAI أيضًا o3-mini. يستخدم النموذج الجديد واجهة برمجة تطبيقات Adaptive Thinking Time التي أعلنت عنها OpenAI مؤخرًا لتقديم ثلاثة أوضاع استدلال مختلفة: منخفضة ومتوسطة وعالية. في الممارسة العملية، يسمح هذا للمستخدمين بتعديل المدة التي "يفكر" فيها البرنامج في مشكلة قبل تقديم إجابة. كما ترى من الرسم البياني أعلاه، يمكن لـ o3-mini تحقيق نتائج مماثلة لنموذج الاستدلال الحالي o1 من OpenAI، ولكن بجزء بسيط من تكلفة الحوسبة. كما ذكرنا، سيصل o3-mini للاستخدام العام قبل o3.
المصدر: بوابة الوفد
كلمات دلالية: فی المائة
إقرأ أيضاً:
يؤثر على المستخدمين.. عطل مفاجئ يضرب chatgpt على مستوى العالم
واجه تطبيق ChatGPT العديد من المشاكل، مما أدى إلى عجز المستخدمين عن الوصول إلى روبوت الدردشة والتوقف تمامًا عن إستخدام الخدمة.
وقف الخدمة وأسبابهووفقًا لموقع «theverge ، أصيبت خدمة ChatGPT من OpenAI بعطل مفاجيء لدى بعض المستخدمين وبدأت المنصة تواجه العديد من المشاكل في الأداء صباح اليوم حوالي الساعة الثالثة صباحًا بتوقيت شرق الولايات المتحدة، لتتأثر بها مناطق متعددة عالميًا.
وتُشير صفحة حالة OpenAI إلى أن بعض المستخدمين قد بدأوا يواجهون «ارتفاعًا في معدلات الأخطاء ووقت استجابة» في ذلك الوقت، وأن المشاكل كانت تؤثر على تطبيق ChatGPT، وأداة Sora لتحويل النصوص إلى فيديو بواسطة الذكاء الاصطناعي، وواجهات برمجة تطبيقات OpenAI، اعتبارًا من الساعة 5:23 صباحًا بتوقيت شرق الولايات المتحدة.
وأضافت OpenAI سطرًا منفصلًا لأرتفاع معدلات الأخطاء في Sora»، ثم حدثت حالة ChatGPT إلى انقطاع جزئي«.
الوصول إلى تطبيقفي الوقت نفسه يستطيع بعض المستخدمين الوصول إلى تطبيق ChatGPT، لكنهم يجدون الخدمة في المقابل بطيئة وتستغرق وقتًا أطول مقارنة بالوقت المعتاد للاستجابة، فيما يستطيع آخرون من استخدام روبوت الدردشة وذلك دون أي مشاكل، لذا يبدو أن تلك الانقطاعات والأخطاء لا تؤثر على جميع المستخدمين.
من ناحية أخرى، أكدت OpenAI أنها تواصل حاليا التحقيق في تلك المشكلة، ويعد ليس من الواضح ما هو سبب الانقطاعات، أو متى سيتم عودة الخدمة إلى طبيعتها.