كشف فريق من الباحثين أن الذكاء الاصطناعي قد يتمكن من اجتياز ما وصفوه بـ "آخر اختبار للبشرية" خلال الأشهر التسعة المقبلة، وذلك بعد أن حقق حتى الآن نتائج متواضعة جدًا في هذا التحدي الأكاديمي المصمم ليقيس حدود معرفته.  

 

اختبار البشرية


ووفقاً لموقع popular mechanics التقني، يُعد "آخر اختبار للبشرية" (Humanity’s Last Exam) أصعب اختبار معرفي يتم إعداده خصيصًا لنماذج الذكاء الاصطناعي اللغوية الضخمة (LLMs)، مثل "تشات جي بي تي" وغيره، حيث طُلب من أكاديميين ومتخصصين حول العالم تقديم أصعب الأسئلة في مجالات متعددة، من الرياضيات إلى الطب والهندسة والفيزياء والعلوم الإنسانية.

وتم استبعاد أي أسئلة يمكن للذكاء الاصطناعي الحالي الإجابة عنها بسهولة.  

أداء النماذج


بحسب الدراسة التي نشرها الباحثون على منصة الأبحاث arXiv (ولم تخضع بعد لمراجعة علمية محكمة)، سجّلت النماذج الحالية نسب نجاح تراوحت بين 3% و14% فقط. إلا أن العلماء يتوقعون أن تصل هذه النماذج إلى نسبة دقة لا تقل عن 50% بنهاية عام 2025، وهو ما يعتبر "درجة النجاح" في هذا التحدي.

 

اقرأ أيضاً.. لأول مرة.. إصدار صحيفة مولّدة بالكامل بالذكاء الاصطناعي

 

محتوى الاختبار


وأوضح الباحثون أن الاختبار يتضمن أسئلة اختيار من متعدد وأخرى تتطلب إجابات قصيرة قابلة للتصحيح الآلي، مع وجود إجابة صحيحة واحدة دقيقة وواضحة لكل سؤال، ما يمنع النماذج من البحث السريع عن الإجابة عبر الإنترنت.  

ويتوزع محتوى الاختبار على عدة مجالات، منها 41% للرياضيات، 11% للأحياء والطب، 10% لعلوم الحاسوب، 9% للفيزياء، 9% للعلوم الإنسانية والاجتماعية، 6% للكيمياء، و5% للهندسة، بالإضافة إلى موضوعات أخرى متنوعة.


أسئلة صعبة

أخبار ذات صلة كهرباء دبي تطلق خارطة طريق لتصبح قائمة على الذكاء الاصطناعي "أوبن أيه آي": تحديثات جديدة في "تشات جي بي تي" لحوار أكثر سلاسة

من بين الأسئلة التي واجهتها النماذج سؤال يطلب ترجمة نقش روماني قديم، وآخر حول عدد الأوتار الزوجية المرتبطة بعظمة معينة في جسم طائر الطنان، إلى جانب مسائل رياضية معقدة وأسئلة حول تفاعلات كيميائية وروابط مفقودة، بل وأسئلة تختبر مدى إدراك الذكاء الاصطناعي لنفسه.

 

وتتم مراجعة الإجابات من قبل نموذج ذكاء اصطناعي آخر يُدعى GPT-40، مهمته التأكد من صحة الإجابات حتى لو اختلفت الصياغة قليلاً لكنها حافظت على جوهر المعنى.

اقرأ أيضاً.. هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي

 

تطور الذكاء


وأشار الباحثون إلى أن المرحلة القادمة من تطوير النماذج ستتضمن تدريب الذكاء الاصطناعي على الاعتراف بمستوى ثقته في إجاباته، بحيث لا يجيب بثقة على سؤال وهو غير متأكد، بل يعبر عن درجة ثقته من 0 إلى 100%.

وقال الفريق: "رغم أن أداء النماذج الحالية منخفض جدًا في هذا الاختبار، إلا أن التاريخ القريب يُظهر كيف استطاعت النماذج خلال فترة قصيرة الانتقال من أداء شبه معدوم إلى أداء شبه مثالي في اختبارات مشابهة".

ومع ذلك، شدد الباحثون على أن هذه النماذج لن تشعر بالخجل أو الذنب لفشلها، لأن الذكاء الاصطناعي لم يصل بعد إلى مستوى الإدراك أو الوعي الذاتي... على الأقل حتى الآن.

 

إسلام العبادي (أبوظبي)

المصدر: صحيفة الاتحاد

كلمات دلالية: تشات جي بي تي الذكاء الاصطناعي الذکاء الاصطناعی

إقرأ أيضاً:

الذكاء الاصطناعي يتنبأ بسكر الدم!

في خطوة رائدة نحو تحسين إدارة مرض السكري، أعلنت شركتا IBM وRoche عن تطوير حل ذكي مشترك يُعالج واحدة من أكثر التحديات الصحية تعقيدًا: العبء اليومي المستمر لمراقبة مستويات السكر في الدم.
جاءت النتيجة على شكل تطبيق مبتكر يحمل اسم Accu-Chek SmartGuide Predict، يعتمد على تقنيات الذكاء الاصطناعي للتنبؤ بمستويات الجلوكوز قبل حدوث التغييرات المفاجئة، ما يمنح المستخدمين فرصة استباق الأحداث واتخاذ قرارات صحية مبنية على التوقع لا رد الفعل.

تنبؤ بسكر الدم... كما تتنبأ بالأحوال الجوية
يأخذ التطبيق مفهوم مراقبة السكري إلى بُعد جديد، إذ لا يكتفي بإظهار مستوى السكر الحالي، بل يرسم خريطة لتوجهاته المستقبلية. تمامًا كما تعتمد على نشرة الطقس لتخطط ليومك، يمكنك الآن الاعتماد على هذا التطبيق للتخطيط لمستويات سكر في الدم خلال الساعات المقبلة.
ويعمل التطبيق بالتكامل مع جهاز الاستشعار المستمر للجلوكوز من Roche، حيث يعالج البيانات لحظيًا باستخدام الذكاء الاصطناعي، ليمنح المستخدم رؤى دقيقة تساعده على تفادي التقلبات المفاجئة والخطيرة في مستويات الجلوكوز.

ثلاث ميزات رئيسية تحدث فرقًا حقيقيًا
يمتاز تطبيق SmartGuide Predict بثلاث وظائف رئيسية، كل منها يستهدف قلقًا شائعًا لدى مرضى السكري:
* Glucose Predict: ميزة تعرض تصورًا لمسار مستوى الجلوكوز خلال الساعتين المقبلتين، ما يمنح المستخدم وقتًا كافيًا لتعديل نظامه الغذائي أو أخذ جرعة إنسولين وقائية.
* Low Glucose Predict: بمثابة نظام إنذار مبكر، ينبّه المستخدم باحتمال حدوث انخفاض حاد في السكر قبل 30 دقيقة تقريبًا من وقوعه—وقت كافٍ لاتخاذ إجراء تصحيحي سريع.
* Night Low Predict: خاصية تُعد الأهم لكثير من المرضى، إذ تتنبأ بخطر انخفاض السكر أثناء النوم وهو أكثر الأوقات خطورة. التطبيق يقيم المخاطر قبل النوم ويقترح ما إذا كانت وجبة خفيفة ليلية ضرورية.
يقول موريتز هارتمان، رئيس قسم حلول المعلومات في شركة Roche: «من خلال تسخير قوة التكنولوجيا التنبؤية المدعومة بالذكاء الاصطناعي، يمكن لتطبيق Accu-Chek SmartGuide Predict أن يمنح مرضى السكري قدرة أكبر على اتخاذ قرارات استباقية لإدارة حالتهم الصحية بثقة ووعي».

الذكاء الاصطناعي يعيد تشكيل أبحاث السكري
تتجاوز فوائد التعاون بين IBM وRoche الجانب العلاجي، لتصل إلى مجال الأبحاث السريرية. فقد طوّرت الشركتان أداة ذكية مدعومة بمنصة watsonx من IBM، تعيد تعريف كيفية تحليل البيانات في التجارب السريرية.
بدلًا من العمليات اليدوية البطيئة، تقوم الأداة الجديدة برقمنة وتصنيف وترجمة البيانات السريرية المجهولة الهوية، وربطها تلقائيًا بمعلومات أجهزة مراقبة السكر ونمط حياة المشاركين في الدراسة.
والحصيلة؟ اكتشاف أنماط وارتباطات دقيقة في وقت قياسي ما يمكن أن يُحدث نقلة نوعية في فهم المرض وتطوير أساليب العلاج، وربما يكون أكثر تأثيرًا على المدى البعيد من التطبيق ذاته. 

تحالف فريد بين التكنولوجيا والصحة
يجمع هذا التعاون بين قوتين من عالمين مختلفين: خبرة IBM التقنية والذكاء الاصطناعي من جهة، وخبرة Roche في علوم الحياة والرعاية الصحية من جهة أخرى. وهو نموذج ناجح لتكامل الصناعات لخدمة احتياجات صحية حقيقية.
يقول هارتمان: «شراكتنا طويلة الأمد مع IBM تعكس الإمكانات الكبيرة للابتكار بين الصناعات في تقديم حلول فعّالة لاحتياجات صحية غير ملبّاة، وتسريع الوصول إلى نتائج علاجية أفضل».
وأضاف كريستيان كيلر، المدير العام لـIBM في سويسرا: «التعاون مع Roche يُبرهن على قوة الذكاء الاصطناعي عندما يُستخدم لهدف واضح: دعم المرضى في إدارة حالاتهم بشكل أفضل. نحن نوفر بيئة تقنية موثوقة، آمنة، ومخصصة تُعزز الابتكار في مجال الرعاية الصحية». 

دلالات الابتكار لمستقبل التكنولوجيا الصحية؟
بعد سنوات من متابعة التكنولوجيا الصحية، يمكن القول إن هذه الشراكة مختلفة. فهي لا تقدم وعودًا فضفاضة، بل تركز على حل واضح وملموس لمشكلة تؤثر على أكثر من 590 مليون شخص حول العالم يعيشون مع مرض السكري.
إنّ التحول من الإدارة التفاعلية إلى الإدارة التنبؤية لا يُعد مجرد تحسين، بل تغيير في قواعد اللعبة. فبدلًا من انتظار المشكلة، أصبح بالإمكان توقعها ومنعها. الذكاء الاصطناعي هنا لا يستبدل الإنسان، بل يزوّده بالمعلومة في الوقت المناسب ليحسن اتخاذ القرار.
التطبيق متاح حاليًا فقط في سويسرا، وهي خطوة مدروسة لاختبار فعالية النظام قبل تعميمه عالميًا. ومن المتوقع أن يتابعه قطاع الرعاية الصحية عن كثب.
إذا أثبتت هذه التجربة نجاحها، فقد تفتح الباب أمام حلول مشابهة لأمراض مزمنة أخرى، مثل أمراض القلب، الربو، أو حتى اضطرابات الجهاز العصبي كمرض باركنسون.
وفي الوقت الراهن، يبقى الهدف الأساسي هو منح مرضى السكري القدرة على عيش حياة أكثر راحة واستقرارًا حتى أثناء نومهم. وهو هدف إنساني نبيل، يستحق أن يُسخّر له الذكاء الاصطناعي بكل إمكاناته.

أخبار ذات صلة تعليم نماذج الذكاء الاصطناعي ما لا تعرفه "واتساب" يختبر ميزة إنشاء مساعد مدعوم بالذكاء الاصطناعي

مقالات مشابهة

  • الذكاء الاصطناعي يتيح للأطباء الدردشة مع السجلات الطبية
  • خرافات عن الذكاء الاصطناعي تنهار أمام الحقيقة.. تقرير يكشف المفاجآت!
  • هجوم حاد على راشد الماجد لاستخدامه الذكاء الاصطناعي في أغنيته الجديدة.. فيديو
  • جامعة القاهرة تتصدّر أبحاث الذكاء الاصطناعي في مصر بـ2,191 بحثًا
  • «شرطة دبي» تنظم ورشة تعريفية لتطبيقات الذكاء الاصطناعي
  • خلال محاكمة.. الذكاء الاصطناعي يحيل إلى مرجع غير موجود
  • الذكاء الاصطناعي يتنبأ بسكر الدم!
  • تعليم نماذج الذكاء الاصطناعي ما لا تعرفه
  • نقابات العمال الأمريكية تبدأ معركتها ضد الذكاء الاصطناعي
  • احذر فخ الذكاء الاصطناعي: مشهد وهمي بتقنية Veo 3 يثير الجدل