على الرغم من تميز الذكاء الاصطناعي في بعض المهام مثل البرمجة أو إنشاء البودكاست، إلا أنه يُظهر ضعفًا واضحًا في اجتياز اختبارات التاريخ المتقدمة، وفقًا لدراسة حديثة.  

         

 

GPT-4 وLlama وGemini: نماذج لغوية فشلت في تقديم إجابات دقيقة



قام فريق من الباحثين بتطوير معيار جديد لاختبار ثلاث نماذج لغوية ضخمة رائدة: "GPT-4" من أوبن إي آي، و"Llama" من ميتا، و"Gemini" من جوجل، في الإجابة عن أسئلة تاريخية.

يعتمد هذا المعيار، المعروف باسم "Hist-LLM"، على قاعدة بيانات التاريخ العالمي "Seshat"، وهي قاعدة بيانات شاملة للمعرفة التاريخية. 

النتائج التي تم تقديمها الشهر الماضي في مؤتمر "NeurIPS" المرموق، كانت مخيبة للآمال. حيث حقق أفضل نموذج، وهو "GPT-4 Turbo"، دقة بلغت حوالي 46% فقط، وهي نسبة بالكاد تفوق التخمين العشوائي.  


اقرأ أيضاً.. هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي

 

وأوضحت "ماريا ديل ريو-تشانونا"، إحدى المشاركات في الدراسة وأستاذة علوم الحاسوب في جامعة كوليدج لندن: "الاستنتاج الأساسي من هذه الدراسة هو أن النماذج اللغوية الكبيرة، رغم إمكانياتها المذهلة، لا تزال تفتقر إلى الفهم العميق المطلوب للتعامل مع استفسارات تاريخية متقدمة. يمكنها التعامل مع الحقائق الأساسية، ولكن عندما يتعلق الأمر بالتحليل العميق على مستوى الدكتوراه، فهي غير قادرة على الأداء المطلوب بعد". 

 



أخبار ذات صلة وداعاً للكلمات المفتاحية.. الذكاء الاصطناعي يعيد تعريف البحث في ويندوز 11 مدير عام مركز إدارة الطوارئ والأزمات والكوارث لإمارة أبوظبي لـ«الاتحاد»: توظيف الذكاء الاصطناعي

القصور في الفهم العميق



 

من الأمثلة التي فشل فيها النموذج، سؤال عن استخدام الدروع القشرية في فترة معينة من مصر القديمة. أجاب "GPT-4 Turbo" بنعم، بينما الحقيقة أن هذه التقنية لم تظهر في مصر إلا بعد 1500 عام.  

يرجع هذا القصور، وفقًا للباحثين، إلى اعتماد النماذج على بيانات تاريخية بارزة، مما يصعّب عليها استرجاع المعلومات النادرة أو الأقل شهرة.

كما أشار الباحثون إلى وجود أداء أضعف للنماذج في مناطق معينة، مثل إفريقيا جنوب الصحراء الكبرى، مما يبرز التحيزات المحتملة في بيانات التدريب.


اقرأ أيضاً..  الذكاء الاصطناعي يفك شيفرة أصوات الطيور المهاجرة


 

التحديات المستمرة



وأكد "بيتر تيرتشين"، قائد الدراسة وأستاذ بمعهد علوم التعقيد في النمسا، أن هذه النتائج تُظهر أن النماذج اللغوية لا تزال غير بديل عن البشر في مجالات معينة. ومع ذلك، يبقى الأمل في أن تسهم هذه النماذج في مساعدة المؤرخين مستقبلاً. يعمل الباحثون على تحسين المعيار بإضافة بيانات من مناطق غير ممثلة بشكل كافٍ وتضمين أسئلة أكثر تعقيدًا.  

واختتمت الدراسة بالقول: "رغم أن نتائجنا تسلط الضوء على المجالات التي تحتاج إلى تحسين، إلا أنها تؤكد أيضًا الإمكانيات الواعدة لهذه النماذج في دعم البحث التاريخي". 

 

المصدر: وكالات

المصدر: صحيفة الاتحاد

كلمات دلالية: تشات جي بي تي أوبن إي آي نماذج الذكاء الاصطناعي التوليدية بودكاست البرمجة الذكاء الاصطناعي جوجل الذکاء الاصطناعی

إقرأ أيضاً:

زوكربيرغ: الذكاء الاصطناعي الخارق أصبح وشيكًا

وضع مارك زوكربيرغ، الرئيس التنفيذي لشركة "ميتا"، خطته لمستقبل الذكاء الاصطناعي، وتتمحور حول منح المستخدمين "ذكاءً خارقًا شخصيًا".
في رسالة، رسم رئيس "ميتا" صورةً لما هو آتٍ، ويعتقد أنه أقرب مما نعتقد. ويقول إن فرق عمله تشهد بالفعل بوادر تقدم مبكرة.
كتب زوكربيرغ "خلال الأشهر القليلة الماضية، بدأنا نلمس لمحاتٍ من أنظمة الذكاء الاصطناعي لدينا تُحسّن نفسها. التحسن بطيءٌ حاليًا، ولكن لا يمكن إنكاره. تطوير الذكاء الخارق أصبح وشيكًا".
فما الذي يريد تحقيقه بهذا الذكاء الاصطناعي الخارق ؟
دعك من الذكاء الاصطناعي الذي يُؤتمت العمل المكتبي الممل فحسب، فرؤية زوكربيرغ وشركته "ميتا" للذكاء الخارق الشخصي أكثر عمقًا. إنه يتخيل مستقبلًا تخدم فيه التكنولوجيا نمونا الفردي، وليس إنتاجيتنا فحسب.
على حد تعبيره، ستكون الثورة الحقيقية أن "يتمتع كل شخص بذكاء خارق شخصي يساعد على تحقيق أهدافه، وخلق ما يرغب برؤيته في العالم، وخوض أي مغامرة، وأن يكون صديقًا أفضل لمن يحب، وأن ينمو ليصبح الشخص الذي يطمح إليه".
وصرح روكربيرغ "هذا يختلف عن غيره في هذا المجال ممن يعتقدون أن الذكاء الخارق يجب أن يُوجَّه بشكل مركزي نحو أتمتة جميع الأعمال القيّمة، ومن ثم ستعيش البشرية على نصيبها من إنتاجه".
اقرأ أيضا... مايكروسوفت تتيح مشاركة سطح المكتب مع مساعد ذكاء اصطناعي
ويقول زوكربيرغ إن "ميتا" تراهن على الفرد عندما يتعلق الأمر بالذكاء الاصطناعي الخارق، حيث تؤمن الشركة بأن التقدم كان دائمًا نتيجة سعي الناس وراء أحلامهم، وليس نتيجة العيش على فتات آلة خارقة الكفاءة.
إذا كان محقًا، فسنقضي وقتًا أقل في التعامل مع البرامج، ووقتًا أطول في الإبداع والتواصل. سيعيش هذا الذكاء الاصطناعي الشخصي في أجهزة مثل النظارات الذكية، ليفهم عالمنا لأنه يستطيع "رؤية ما نراه، وسماع ما نسمعه".
بالطبع، هو يعلم أن هذا أمر قوي، بل وخطير. يُقر زوكربيرغ بأن الذكاء الخارق سيُثير مخاوف جديدة تتعلق بالسلامة، وأنه سيتعين على "ميتا" توخي الحذر بشأن ما تُطلقه للعالم. ومع ذلك، يُجادل بأن الهدف يجب أن يكون تمكين الناس قدر الإمكان.
يعتقد زوكربيرغ أننا نقف الآن عند مفترق طرق. فالخيارات التي نتخذها في السنوات القليلة القادمة ستحدد كل شيء.
وحذر قائلاً: "يبدو أن ما تبقى من هذا العقد سيكون على الأرجح الفترة الحاسمة لتحديد المسار الذي ستسلكه هذه التكنولوجيا"، واصفًا إياها بالاختيار بين "التمكين الشخصي أو قوة تُركز على استبدال قطاعات واسعة من المجتمع".
لقد اتخذ زوكربيرغ قراره. وهو يُركز موارد "ميتا" الهائلة على بناء مستقبل الذكاء الخارق الشخصي هذا.
مصطفى أوفى (أبوظبي)

أخبار ذات صلة قيمة مايكروسوفت السوقية تتجاوز 4 تريليونات دولار للمرة الأولى مراكز الثورة الصناعية الرابعة بالإمارات وماليزيا ورواندا تعزز حوكمة الذكاء الاصطناعي المصدر: الاتحاد - أبوظبي

مقالات مشابهة

  • محمود عتمان: مجلس الشيوخ يرفع دراسة الذكاء الاصطناعي للرئيس السيسي لتفعيلها تنفيذياً
  • زوكربيرغ: الذكاء الاصطناعي الخارق أصبح وشيكًا
  • نزيف العقول في آبل.. خبراء الذكاء الاصطناعي يهاجرون إلى ميتا بعروض خيالية
  • بالذكاء الاصطناعي.. إطلاق خاصية لمساعدة الطلاب على الدراسة والحد من الغش
  • وضع الدراسة في ChatGPT.. بديلا للمدرسين بالذكاء الاصطناعي بين يدي الطلاب
  • احتيال شركات الذكاء الاصطناعي يجب أن يتوقف
  • السباق الاستخباراتي على الذكاء الاصطناعي
  • معضلة الذكاء الاصطناعي والمؤلف العلمي
  • خبراء يكشفون خطر الذكاء الاصطناعي على الدماغ
  • بداري يتفقد مركز بيانات متخصص في تطبيقات الذكاء الإصطناعي