مع التقدم الكبير في تقنيات الذكاء الاصطناعي، أصبح من الممكن استخدام هذه التقنيات في مجالات عديدة، ولكن الذكاء الاصطناعي ما زال يواجه عدة تحديات رئيسية عند التعامل مع التاريخ، وذلك بحسب ما كشفت عنه دراسة حديثة اختبرت قدرات ثلاثة من أهم النماذج اللغوية الكبيرة في الإجابة عن أسئلة تاريخية معقدة.

ولإجراء هذه الدراسة، أنشأ فريق من الباحثين معيارًا جديدًا يُسمى (Hist-LLM)، لاختبار أداء ثلاثة نماذج لغوية كبيرة رائدة، وهي:(GPT-4) من OpenAI، و(Llama) من ميتا، و(Gemini) من جوجل، في الإجابة عن أسئلة تاريخية دقيقة، بحسب موقع البوابة التقنية.

واعتمد هذا المعيار في تقييمه على قاعدة بيانات شاملة للمعرفة التاريخية تُسمى (سشات) Seshat، وهي قاعدة بيانات ضخمة تجمع معلومات تاريخية من مصادر متعددة وتغطي فترات زمنية وأماكن جغرافية مختلفة، وقد سميت هذه القاعدة على اسم سشات، إلهة الحكمة والكتابة والمعرفة في الحضارة المصرية القديمة.

ويركز معيار (Hist-LLM) في اختبار مدى دقة المعلومات التاريخية وموثوقيتها التي يقدمها كل نموذج لغوي، مقارنةً بالمعلومات الموثقة في قاعدة بيانات (Seshat)، مما يساعد في تحديد نقاط القوة والضعف في قدرة النماذج اللغوية الكبيرة على فهم السياق التاريخي واستيعابه والتمييز بين الحقائق التاريخية الصحيحة والمعلومات غير الصحيحة أو المضللة.

نتائج مخيبة للآمال

عُرضت نتائج هذه الدراسة في مؤتمر (NeurIPS)، وهو أحد أبرز المؤتمرات العالمية في مجال الذكاء الاصطناعي، وجاءت مخيبة للآمال، وفقًا للباحثين المنتسبين إلى معهد الأبحاث (Complexity Science Hub) في النمسا، إذ حقق نموذج (GPT-4 Turbo) أفضل أداء بين النماذج المختبرة، ولكنه لم يحقق سوى دقة تقارب 46% في الإجابة عن الأسئلة التاريخية، ويشير هذا الرقم إلى أن أداء نموذج (GPT-4 Turbo) لم يكن أفضل بكثير من التخمين العشوائي، إذ إن نسبة 50% تمثل احتمالية الإجابة الصحيحة عن سؤال له خياران فقط عن طريق التخمين.

الذكاء الاصطناعي

وعلقت ماريا ديل ريو-شانونا، الأستاذة المشاركة في علوم الحاسوب في جامعة كوليدج لندن وأحد مؤلفي الورقة البحثية، على هذه النتائج قائلة: «الخلاصة الرئيسية من هذه الدراسة هي أن النماذج اللغوية الكبيرة أصبحت مثيرة للإعجاب في الكثير من الجوانب التقنية والإبداعية، ولكنها ما زالت تفتقر إلى عمق الفهم المطلوب للتعامل مع البحث التاريخي المتقدم على مستوى الدراسات العليا».

وأوضحت تشانونا تفصيلًا مهمًا حول طبيعة هذه النماذج وقدراتها، إذ أشارت إلى أنها رائعة في استرجاع الحقائق الأساسية والمعلومات العامة وتقديمها، بمعنى آخر، يمكن لهذه النماذج التعامل بكفاءة مع المعلومات التاريخية المباشرة والمتاحة بسهولة، مثل تواريخ الأحداث المهمة أو أسماء الشخصيات التاريخية.

ويؤكد ذلك أن النماذج اللغوية الكبيرة غير قادرة حاليًا على تحليل المصادر التاريخية بشكل نقدي، أو فهم السياق التاريخي المعقد، كما لا يمكنها حاليًا إجراء تحليلات تاريخية مبتكرة أو تقديم تفسيرات جديدة للأحداث التاريخية.

أسباب ضعف النماذج اللغوية الكبيرة في التاريخ

تثير نتائج هذه الدراسة التساؤل عن أسباب ضعف النماذج اللغوية الكبيرة في الإجابة عن الأسئلة التاريخية التقنية، في حين تظهر كفاءة عالية في الإجابة عن أسئلة معقدة في مجالات أخرى مثل البرمجة.

وأرجعت ديل ريو-شانونا ذلك إلى ميل هذه النماذج إلى الاستقراء من البيانات التاريخية الشائعة والبارزة، مما يجعل من الصعب عليها استرجاع المعرفة التاريخية الأكثر غموضًا.

وشرحت ديل ريو شانونا هذه الظاهرة قائلة: «إذا تكرر ذكر (A) و (B) أمامك 100 مرة، وذُكر (C) مرة واحدة فقط، ثم طُرح عليك سؤال حول (C)، فمن المحتمل أن تتذكر (A) و(B) وتحاول الاستنتاج بناءً عليهما».

الذكاء الاصطناعي تحيزات في بيانات التدريب

كشفت الدراسة أيضًا عن توجهات أخرى، منها أن أداء نموذجي GPT-4، و Llama كان أسوأ في مناطق معينة مثل أفريقيا جنوب الصحراء الكبرى، مما يشير إلى وجود تحيزات محتملة في بيانات التدريب المستخدمة.

وأكد بيتر تورتشين، قائد الدراسة وعضو هيئة التدريس في معهد (Complexity Science Hub)، أن نتائج هذه الدراسة تظهر أن النماذج اللغوية الكبيرة لا تزال غير قادرة على الحلول محل البشر في مجالات معينة مثل التاريخ.

ومع ذلك، لا يزال الباحثون متفائلين بإمكانية استفادة المؤرخين من هذه النماذج في المستقبل كأداة مساعدة تساهم في تسريع بعض جوانب البحث وتوفير معلومات أولية، ويعملون حاليًا على تحسين معايير التقييم المستخدمة في دراستهم بإضافة المزيد من البيانات من المناطق الممثلة تمثيلًا ناقصًا، وطرح أسئلة أكثر تعقيدًا.

وتُختتم الورقة البحثية بالتأكيد أن النتائج تسلط الضوء على المجالات التي تحتاج فيها النماذج اللغوية الكبيرة إلى تحسين، وتؤكد أيضًا إمكانات هذه النماذج في المساعدة في البحث التاريخي.

اقرأ أيضاً«ترامب» يعلن ضح استثمارات بـ500 مليار دولار في الذكاء الاصطناعي

اليونسكو تنظم ندوة عن كيفية الاستفادة من الذكاء الاصطناعي في التعليم

تلفزيون بريكس يبرز مساعي الإمارات وماليزيا لتعزيز التعاون في مجال الذكاء الاصطناعي

المصدر: الأسبوع

كلمات دلالية: الذكاء الاصطناعي الذكاء الإصطناعي تطبيقات الذكاء الاصطناعي الذكاء الاصطناعي وتطبيقاته مجالات الذكاء الاصطناعي ذكاء اصطناعي تعلم الذكاء الاصطناعي الذكاء الصناعي ما هو الذكاء الاصطناعي الذكاء الاصطناعي مجانا تخصصات الذكاء الاصطناعي خوارزميات الذكاء الاصطناعي النماذج اللغویة الکبیرة الذکاء الاصطناعی فی الإجابة عن هذه الدراسة هذه النماذج

إقرأ أيضاً:

الذكاء الاصطناعي يقلب موازين البحث في في غوغل

  

يُعد هذا التوسع امتدادًا للتحول الذي بدأتْه غوغل قبل عام، حين أطلقت ملخصات محادثة تحت اسم "ملخصات الذكاء الاصطناعي"، والتي تظهر بشكل متزايد في أعلى صفحة النتائج، وتحتل مكانةً أعلى من الروابط التقليدية في نتائج البحث.

وبحسب ما أعلنت غوغل، فإن نحو 1.5 مليار شخص يتفاعلون بانتظام مع هذه الملخصات، كما أصبح المستخدمون يدخلون استفسارات أطول وأكثر تعقيدًا.

وفي كلمة أمام حضور كبير في قاعة مؤتمرات قريبة من مقر الشركة في ماونتن فيو بكاليفورنيا، قال سوندار بيتشاي، الرئيس التنفيذي لشركة غوغل: "كل هذا التقدم يعني أننا دخلنا مرحلة جديدة في تطور منصتنا المبنية على الذكاء الاصطناعي، حيث تحولت عقود من الأبحاث إلى واقع يستفيد منه الناس في كل أنحاء العالم".

الذكاء الاصطناعي يُعيد تشكيل سلوك المستخدم

وعلى الرغم من توقعات سوندار بيتشاي وفريق الإدارة في غوغل بأن ميزة "النظرة العامة للذكاء الاصطناعي" ستزيد من عمليات البحث والنقر على الروابط، إلا أن الواقع لم يكن على هذا النحو حتى الآن، بحسب بيانات شركة BrightEdge المتخصصة في تحسين محركات البحث.

 

وأظهرت دراسة حديثة أجرتها الشركة انخفاضًا بنسبة 30% في معدلات النقر على نتائج بحث غوغل خلال العام الماضي، مشيرة إلى أن السبب الرئيسي هو اكتفاء المستخدمين بالمعلومات المقدمة عبر الملخصات الذكية دون الحاجة للنقر على الروابط.

ويُعد قرار إتاحة "وضع الذكاء الاصطناعي" على نطاق واسع بعد فترة اختبار قصيرة دليلًا على ثقة غوغل في دقة التكنولوجيا وعدم انتشار المعلومات المضللة عبرها، وهو ما يعكس أيضًا وعي الشركة بالمنافسة الشديدة التي تواجهها من أدوات بحث أخرى مدعومة بالذكاء الاصطناعي مثل ChatGPT وPerplexity.

الصعود السريع للذكاء الاصطناعي يُعيد رسم خريطة المنافسة

برز الصعود السريع لبدائل الذكاء الاصطناعي كمصدر اهتمام رئيسي في الإجراءات القانونية التي قد تؤدي إلى اضطرار غوغل إلى إعادة هيكلة أجزاء من إمبراطوريتها على الإنترنت، بعد أن أعلن قاضٍ فيدرالي أمريكي أن محرك بحث الشركة يمثل احتكارًا غير قانوني.

وأفاد إيدي كيو، المدير التنفيذي لشركة Apple، خلال شهادته في المحاكمة مبكرًا هذا الشهر، بأن عمليات البحث عبر غوغل من خلال متصفح Safari على iPhone انخفضت، نتيجة تحول المستخدمين إلى بدائل تعتمد على الذكاء الاصطناعي.

 

وأشارت غوغل إلى التغيرات الناتجة عن صعود الذكاء الاصطناعي كسبب رئيس لضرورة إجراء تعديلات طفيفة فقط على آلية عمل محرك بحثها، مشيرة إلى أن هذه التكنولوجيا تعيد تشكيل المشهد التنافسي بشكل جذري.

لكن على ما يبدو، فإن الاعتماد المتزايد لغوغل على الذكاء الاصطناعي حتى الآن ساعد محرك بحثها في الحفاظ على مكانته كبوابة رئيسية للإنترنت، وهو العامل الرئيسي الذي يجعل قيمتها السوقية ضمن شركتها الأم ألفابت تصل إلى تريليوني دولار (1.8 تريليون يورو).

وبحسب بيانات جمعها موقع onelittleweb.com، بلغ عدد زيارات غوغل الشهرية خلال العام المنتهي في مارس الماضي 136 مليار زيارة، أي ما يعادل 34 ضعف الزيارات الشهرية لموقع ChatGPT البالغة أربعة مليارات زيارة.

وعند سؤال "وضع الذكاء الاصطناعي" الخاص بغوغل من قبل صحفي في وكالة أسوشيتد برس، عما إذا كان اعتماد الذكاء الاصطناعي قد يؤثر سلبًا على محرك البحث، أكد أن ذلك غير محتمل، مشيرًا إلى أنه قد يعزز مكانة الشركة أكثر.

  

ورد "وضع الذكاء الاصطناعي": "نعم، من المحتمل جدًا أن يجعل هذا الوضع شركة غوغل أقوى، خاصةً في مجال الوصول إلى المعلومات والتأثير على الإنترنت". وحذّرت الميزة أيضًا من أن الناشرين على الويب قد يواجهون انخفاضًا في الزيارات القادمة من نتائج البحث.

 

مقالات مشابهة

  • دراسة أوروبية: ثلاث عادات بسيطة قد تبطئ الشيخوخة البيولوجية لدى كبار السن
  • لماذا لن يُفقدنا الذكاء الاصطناعي وظائفنا؟
  • هاوس: بين الحقيقة والخيال.. دراسة علمية تكشف 77 خطأ في المسلسل الشهير
  • الذكاء الاصطناعي يثير ضجة حول عادل إمام
  • دراسة هيكل «الحوت البالين» في مراقبة آثار بنغازي
  • الذكاء الاصطناعي يقلب موازين البحث في في غوغل
  • دراسة تحذّر من مخطط تهجير ممنهج بغزة وتدعو إلى اقتصاد مقاوم يتصدّى له
  • دراسة: خسارة الوزن في منتصف العمر تُقلل الأمراض وتُطيل العمر
  • الذكاء الاصطناعي والدراما العراقية.. صراع بين تطور التقنية السريع وبطء الواقع
  • دراسة جديدة: فيتامين "د" قد يساهم بـ"إبطاء" الشيخوخة