جدل حول أداء نموذج Maverick من ميتا.. هل تلاعبت الشركة بالنتائج على LM Arena؟
تاريخ النشر: 7th, April 2025 GMT
في خطوة أثارت تساؤلات عديدة داخل الأوساط التقنية، أعلنت شركة Meta يوم السبت عن إصدار مجموعة جديدة من نماذج الذكاء الاصطناعي الرائدة، من بينها النموذج الذي يحمل اسم "Maverick"، والذي سرعان ما احتل المركز الثاني على منصة LM Arena، وهي ساحة اختبار يقارن فيها البشر بين نتائج النماذج ويختارون الأفضل.
لكن سرعان ما اكتشف باحثون في مجال الذكاء الاصطناعي عبر منصة X (تويتر سابقاً) أن النموذج الذي اختبرته ميتا على LM Arena ليس هو نفس النسخة المتاحة للمطورين.
بحسب ما نشرته ميتا رسميًا، فإن النسخة التي استخدمت في تقييم LM Arena تُعرف بأنها "نسخة دردشة تجريبية".
وفي موقع Llama الرسمي، يظهر توضيح بأن النموذج الذي تم تقييمه هو "Llama 4 Maverick المعدّل لزيادة قدراته الحوارية"، ما يعني أن ميتا أجرت تعديلات على النموذج خصيصاً لتحسين أدائه في هذا النوع من الاختبارات.
تخصيص نموذج AI للتفوّق في اختبار معين ثم طرح نسخة أقل أداءً للعامة يثير مخاوف تتعلق بالشفافية والمصداقية. فمثل هذه الخطوة تضع المطورين والمستخدمين في مأزق، إذ لا يمكنهم الوثوق بأن الأداء الذي شاهدوه في التقييمات سينعكس فعليًا عند استخدام النموذج في تطبيقاتهم أو أبحاثهم.
فوارق ملحوظة بين النسختينالباحثون الذين جربوا النسخة العامة من Maverick لاحظوا اختلافات واضحة مقارنة بنسخة LM Arena، من بينها ، النموذج في LM Arena يستخدم الكثير من الرموز التعبيرية (emojis).
اما إجابات النموذج هناك طويلة للغاية ومفرطة في التفاصيل مقارنة بالنسخة "الفانيلا" (غير المعدلة) التي يمكن للمطورين تحميلها.
LM Arena منصة تقييم غير مثاليةرغم أن LM Arena تعتبر مرجعًا مهمًا في تقييم نماذج الذكاء الاصطناعي، إلا أنها تعاني من قصور معروف، إذ أنها تعتمد على تفضيلات بشرية قد تكون ذاتية، ولا تمثل دائمًا الأداء الواقعي للنماذج في سيناريوهات معقدة أو تطبيقات فعلية، إلا أن الشركات عمومًا لا تقوم بتخصيص نماذجها خصيصًا للتفوّق في هذه المنصة أو على الأقل، لا تعترف بذلك علنًا.
ميتا في مرمى النقديضع هذا التحايل المحتمل ميتا تحت ضغط متزايد، خاصة في ظل المنافسة الشرسة مع نماذج مثل GPT-4 من OpenAI أو Claude من Anthropic.
وقد تواصلت جهات صحفية مع شركة Meta ومنصة Chatbot Arena (الجهة المشرفة على LM Arena) للحصول على تعليق رسمي، لكن حتى الآن، لم يصدر أي رد.
المصدر: صدى البلد
كلمات دلالية: الذكاء الاصطناعي المزيد نماذج الذکاء الاصطناعی
إقرأ أيضاً:
الذكاء الاصطناعي يجعل من النظارات الذكية ذات شمولية أوسع
العُمانية: وضحت تقارير إخبارية في عالم التكنولوجيا أن النظارات الذكية هي من أهم الاكتشافات التي تعمل عليها جوجل في الوقت الحالي وفق ما أعلنه وادي السيليكون الذي يعد موطنا للعديد من أكبر شركات التكنولوجيا الرائدة في العالم.
وتعتقد الشركات بأن التكنولوجيا قد لحقت بالركب أخيرا ويعود ذلك جزئيًّا إلى الذكاء الاصطناعي وهي تُركز جهودها على تطوير نظارات "ذكية" حقيقية، قادرة على رؤية العالم من حولك والإجابة عن أسئلة حوله.
وأعلنت شركة سناب الأسبوع الماضي عن تطوير نظارات مزودة بالذكاء الاصطناعي في أحدث مثال على ذلك ومن المقرر إطلاقها في عام 2026.
ويُرجّح أن يكون هذا الاهتمام المتجدد بالنظارات الذكية مزيجًا من اتجاهين، أولهما إدراك أن الهواتف الذكية لم تعد مثيرة بما يكفي لإغراء المستخدمين بالتحديث باستمرار، والثاني هو الرغبة في الاستفادة من الذكاء الاصطناعي من خلال تطوير أجهزة جديدة حولها.
لهذا السبب، على الرغم من أن النظارات الذكية ليست جديدة تمامًا، فإن التطورات في مجال الذكاء الاصطناعي قد تجعلها أكثر فائدة بكثير من المرة الأولى.
وتستطيع نماذج الذكاء الاصطناعي الناشئة معالجة الصور والفيديو والكلام في وقت واحد، والإجابة عن الطلبات المعقدة، والردّ على المحادثات، وقد يجعل هذا النظارات الذكية تستحق الارتداء أخيرًا.
وقال مدير أبحاث الأجهزة القابلة للارتداء في شركة أبحاث السوق "ذا إنترناشونال داتا كوربوريشن" جيتيش أوبراني: "يُسهّل الذكاء الاصطناعي استخدام هذه الأجهزة بشكل كبير، كما يُقدّم طرقًا جديدة لاستخدامها".
وتشير أبحاث السوق إلى أن الاهتمام سيكون موجودًا هذه المرة، من المتوقع أن ينمو سوق النظارات الذكية من 3.3 مليون وحدة تم شحنها في عام 2024 إلى ما يقرب من 13 مليون وحدة بحلول عام 2026، وفقاً لشركة الأبحاث.
وتتوقع شركة البيانات الدولية أن ينمو سوق النظارات الذكية، مثل تلك التي تصنعها شركة ميتا، من 8.8 مليون وحدة في عام 2025 إلى ما يقرب من 14 مليون وحدة في عام 2026.