مع التقدم الكبير في تقنيات الذكاء الاصطناعي، أصبح من الممكن استخدام هذه التقنيات في مجالات عديدة، ولكن الذكاء الاصطناعي ما زال يواجه عدة تحديات رئيسية عند التعامل مع التاريخ، وذلك بحسب ما كشفت عنه دراسة حديثة اختبرت قدرات ثلاثة من أهم النماذج اللغوية الكبيرة في الإجابة عن أسئلة تاريخية معقدة.

ولإجراء هذه الدراسة، أنشأ فريق من الباحثين معيارًا جديدًا يُسمى (Hist-LLM)، لاختبار أداء ثلاثة نماذج لغوية كبيرة رائدة، وهي:(GPT-4) من OpenAI، و(Llama) من ميتا، و(Gemini) من جوجل، في الإجابة عن أسئلة تاريخية دقيقة، بحسب موقع البوابة التقنية.

واعتمد هذا المعيار في تقييمه على قاعدة بيانات شاملة للمعرفة التاريخية تُسمى (سشات) Seshat، وهي قاعدة بيانات ضخمة تجمع معلومات تاريخية من مصادر متعددة وتغطي فترات زمنية وأماكن جغرافية مختلفة، وقد سميت هذه القاعدة على اسم سشات، إلهة الحكمة والكتابة والمعرفة في الحضارة المصرية القديمة.

ويركز معيار (Hist-LLM) في اختبار مدى دقة المعلومات التاريخية وموثوقيتها التي يقدمها كل نموذج لغوي، مقارنةً بالمعلومات الموثقة في قاعدة بيانات (Seshat)، مما يساعد في تحديد نقاط القوة والضعف في قدرة النماذج اللغوية الكبيرة على فهم السياق التاريخي واستيعابه والتمييز بين الحقائق التاريخية الصحيحة والمعلومات غير الصحيحة أو المضللة.

نتائج مخيبة للآمال

عُرضت نتائج هذه الدراسة في مؤتمر (NeurIPS)، وهو أحد أبرز المؤتمرات العالمية في مجال الذكاء الاصطناعي، وجاءت مخيبة للآمال، وفقًا للباحثين المنتسبين إلى معهد الأبحاث (Complexity Science Hub) في النمسا، إذ حقق نموذج (GPT-4 Turbo) أفضل أداء بين النماذج المختبرة، ولكنه لم يحقق سوى دقة تقارب 46% في الإجابة عن الأسئلة التاريخية، ويشير هذا الرقم إلى أن أداء نموذج (GPT-4 Turbo) لم يكن أفضل بكثير من التخمين العشوائي، إذ إن نسبة 50% تمثل احتمالية الإجابة الصحيحة عن سؤال له خياران فقط عن طريق التخمين.

الذكاء الاصطناعي

وعلقت ماريا ديل ريو-شانونا، الأستاذة المشاركة في علوم الحاسوب في جامعة كوليدج لندن وأحد مؤلفي الورقة البحثية، على هذه النتائج قائلة: «الخلاصة الرئيسية من هذه الدراسة هي أن النماذج اللغوية الكبيرة أصبحت مثيرة للإعجاب في الكثير من الجوانب التقنية والإبداعية، ولكنها ما زالت تفتقر إلى عمق الفهم المطلوب للتعامل مع البحث التاريخي المتقدم على مستوى الدراسات العليا».

وأوضحت تشانونا تفصيلًا مهمًا حول طبيعة هذه النماذج وقدراتها، إذ أشارت إلى أنها رائعة في استرجاع الحقائق الأساسية والمعلومات العامة وتقديمها، بمعنى آخر، يمكن لهذه النماذج التعامل بكفاءة مع المعلومات التاريخية المباشرة والمتاحة بسهولة، مثل تواريخ الأحداث المهمة أو أسماء الشخصيات التاريخية.

ويؤكد ذلك أن النماذج اللغوية الكبيرة غير قادرة حاليًا على تحليل المصادر التاريخية بشكل نقدي، أو فهم السياق التاريخي المعقد، كما لا يمكنها حاليًا إجراء تحليلات تاريخية مبتكرة أو تقديم تفسيرات جديدة للأحداث التاريخية.

أسباب ضعف النماذج اللغوية الكبيرة في التاريخ

تثير نتائج هذه الدراسة التساؤل عن أسباب ضعف النماذج اللغوية الكبيرة في الإجابة عن الأسئلة التاريخية التقنية، في حين تظهر كفاءة عالية في الإجابة عن أسئلة معقدة في مجالات أخرى مثل البرمجة.

وأرجعت ديل ريو-شانونا ذلك إلى ميل هذه النماذج إلى الاستقراء من البيانات التاريخية الشائعة والبارزة، مما يجعل من الصعب عليها استرجاع المعرفة التاريخية الأكثر غموضًا.

وشرحت ديل ريو شانونا هذه الظاهرة قائلة: «إذا تكرر ذكر (A) و (B) أمامك 100 مرة، وذُكر (C) مرة واحدة فقط، ثم طُرح عليك سؤال حول (C)، فمن المحتمل أن تتذكر (A) و(B) وتحاول الاستنتاج بناءً عليهما».

الذكاء الاصطناعي تحيزات في بيانات التدريب

كشفت الدراسة أيضًا عن توجهات أخرى، منها أن أداء نموذجي GPT-4، و Llama كان أسوأ في مناطق معينة مثل أفريقيا جنوب الصحراء الكبرى، مما يشير إلى وجود تحيزات محتملة في بيانات التدريب المستخدمة.

وأكد بيتر تورتشين، قائد الدراسة وعضو هيئة التدريس في معهد (Complexity Science Hub)، أن نتائج هذه الدراسة تظهر أن النماذج اللغوية الكبيرة لا تزال غير قادرة على الحلول محل البشر في مجالات معينة مثل التاريخ.

ومع ذلك، لا يزال الباحثون متفائلين بإمكانية استفادة المؤرخين من هذه النماذج في المستقبل كأداة مساعدة تساهم في تسريع بعض جوانب البحث وتوفير معلومات أولية، ويعملون حاليًا على تحسين معايير التقييم المستخدمة في دراستهم بإضافة المزيد من البيانات من المناطق الممثلة تمثيلًا ناقصًا، وطرح أسئلة أكثر تعقيدًا.

وتُختتم الورقة البحثية بالتأكيد أن النتائج تسلط الضوء على المجالات التي تحتاج فيها النماذج اللغوية الكبيرة إلى تحسين، وتؤكد أيضًا إمكانات هذه النماذج في المساعدة في البحث التاريخي.

اقرأ أيضاً«ترامب» يعلن ضح استثمارات بـ500 مليار دولار في الذكاء الاصطناعي

اليونسكو تنظم ندوة عن كيفية الاستفادة من الذكاء الاصطناعي في التعليم

تلفزيون بريكس يبرز مساعي الإمارات وماليزيا لتعزيز التعاون في مجال الذكاء الاصطناعي

المصدر: الأسبوع

كلمات دلالية: الذكاء الاصطناعي الذكاء الإصطناعي تطبيقات الذكاء الاصطناعي الذكاء الاصطناعي وتطبيقاته مجالات الذكاء الاصطناعي ذكاء اصطناعي تعلم الذكاء الاصطناعي الذكاء الصناعي ما هو الذكاء الاصطناعي الذكاء الاصطناعي مجانا تخصصات الذكاء الاصطناعي خوارزميات الذكاء الاصطناعي النماذج اللغویة الکبیرة الذکاء الاصطناعی فی الإجابة عن هذه الدراسة هذه النماذج

إقرأ أيضاً:

دعوة لمقاربة شاملة لتنظيم الذكاء الاصطناعي

يحتاج العالم بشكل عاجل إلى مقاربة شاملة لتنظيم الذكاء الاصطناعي للحؤول دون أن يؤدي أي تفلت في هذا المجال إلى تفاقم المخاطر وعدم المساواة، على ما تؤكد الأمينة العامة للاتحاد الدولي للاتصالات، وهي وكالة متخصصة تابعة للأمم المتحدة، في مقابلة صحفية.
تأمل الأميركية دورين بوغدان-مارتن، التي تترأس الاتحاد الدولي للاتصالات منذ عام 2023، أن "يُفيد الذكاء الاصطناعي البشرية جمعاء حقا"، على ما قالت خلال المقابلة التي أجريت معها هذا الأسبوع في جنيف.
وأكدت أن تنظيم الذكاء الاصطناعي أمر أساسي في ظل تزايد المخاوف بشأن مخاطر هذه التقنية، بينها القلق من فقدان الوظائف ومن المعلومات المضللة وانتشار "التزييف العميق" (محتوى مُتلاعب به باستخدام الذكاء الاصطناعي)، وزعزعة النسيج الاجتماعي.
وأضافت "من المُلحّ السعي لوضع الإطار المناسب"، على أن يتم ذلك من خلال "مقاربة شاملة".
تأتي تعليقاتها بعد أن كشف البيت الأبيض أخيرا عن خطة عمل لتعزيز التطوير الحر لنماذج الذكاء الاصطناعي الأميركية في الولايات المتحدة وخارجها، رافضا أي مخاوف بشأن إساءة استخدامها المحتملة.
وقد رفضت بوغدان-مارتن التعليق على هذا التطور الأخير، موضحة أنها "لا تزال تحاول استيعابه".
وقالت "أعتقد أن هناك مقاربات مختلفة" في المسألة، مضيفة "هناك مقاربة الاتحاد الأوروبي، وثمة المقاربة الصينية. واليوم، نشهد على المقاربة الأميركية. أعتقد أن ما نحتاجه هو تفاعل هذه المقاربات".
وأشارت أيضا إلى أن "85% من الدول لا تزال تفتقر إلى سياسات أو استراتيجيات للذكاء الاصطناعي".
ولفتت بوغدان-مارتن إلى أن قضايا الابتكار وبناء القدرات والاستثمار في البنية التحتية ترتدي أهمية محورية بشكل خاص في المناقشات المتعلقة بالتنظيم.
لكنها أبدت اعتقادا بأن "النقاش لا يزال بحاجة إلى أن يُجرى على المستوى العالمي لتحديد مقدار التنظيم اللازم".
أمضت المسؤولة الرفيعة المستوى معظم مسيرتها المهنية في الاتحاد الدولي للاتصالات، وتعتقد أن هذه الوكالة الأممية المسؤولة عن تطوير خدمات وشبكات وتقنيات الاتصالات في جميع أنحاء العالم، تتمتع بمكانة جيدة للمساعدة في تسهيل الحوار بين الدول حول تنظيم الذكاء الاصطناعي.
وأكدت أن "الحاجة إلى نهج عالمي تبدو أساسية بالنسبة لي"، محذرة من أن "المقاربات المجزأة لن تخدم الجميع ولن تصل إليهم".

أخبار ذات صلة "جوجل" تطلق خاصية جديدة لتنظيم نتائج البحث باستخدام الذكاء الاصطناعي «الإمارات الصحية»: برامج وخدمات متكاملة للكشف المبكر عن السرطان المصدر: آ ف ب

مقالات مشابهة

  • دراسة تحذر من اقتناء الأطفال دون 13 عاما للهواتف الذكية
  • دراسة لجامعة نزوى: 4% من أراضي سلطنة عمان صالحة لزراعة القمح حتى عام 2080
  • هل يؤدي ارتفاع سكر الدم إلى تراجع القدرة الجنسية لدى الرجال؟ دراسة تجيب
  • فوائد غير متوقعة.. دراسة: مشروب شائع يعالج الضغط ويحسن صحة كبار السن
  • حوارٌ مثيرٌ مع الذكاء الاصطناعي
  • دراسة تحذر: هذا ما يفعله الحزن الشديد في الجسم
  • هل تنفجر معدلات النمو الاقتصادي في زمن الذكاء الاصطناعي؟
  • نماذج ذكاء اصطناعي تغير إجاباتها تبعا لطريقة تحدث المستخدم
  • دعوة لمقاربة شاملة لتنظيم الذكاء الاصطناعي
  • أثر الذكاء الاصطناعي على إنتاجية المبرمجين: نتائج متباينة تكشفها دراسة حديثة