قام فريق من الباحثين من كليات ويلسلي وأوبرلين وجامعة تكساس في أوستن وجامعة نورث إيسترن وشركة Cursor الناشئة بتطوير معيار جديد لاختبار قدرات الاستدلال لدى نماذج الذكاء الاصطناعي، وذلك باستخدام الألغاز التي تُطرح في برنامج Sunday Puzzle الإذاعي على شبكة NPR، وفق موقع "تيك كرنش".





ألغاز برنامج Sunday Puzzle



 

يعتمد هذا البرنامج، الذي يقدّمه منذ سنوات طويلة ويل شورتز، خبير الكلمات المتقاطعة في نيويورك تايمز، على ألغاز مصممة بحيث لا تتطلب معرفة متخصصة، لكنها رغم ذلك تشكل تحديًا حتى للمشاركين المهرة.

يرى الباحثون أن هذا النوع من الألغاز مثالي لاختبار مدى قدرة الذكاء الاصطناعي على حل المشكلات بطريقة منطقية بدلاً من الاعتماد على الحفظ أو البيانات المخزنة.  




اقرأ أيضاً.. رغم تفوقها في البرمجة.. نماذج الذكاء الاصطناعي تخفق في التاريخ

 




نتائج غير متوقعة

 

في هذه الدراسة، اختبر الباحثون مجموعة من نماذج الذكاء الاصطناعي، بما في ذلك نموذج o1 من أوبين إيه آي ونموذج R1 من DeepSeek، وذلك على مجموعة تضم 600 لغز من البرنامج.


وكشفت النتائج أن هذه النماذج لا تزال تواجه تحديات كبيرة في التفكير المنطقي، حيث أظهرت بعض السلوكيات غير المتوقعة.


 

أخبار ذات صلة "التمكين الحكومي" تستعرض ريادة أبوظبي في مجال الذكاء الاصطناعي خلال جولة مايكروسوفت الذكاء الاصطناعي يحول اللغة من الدماغ إلى نصوص مكتوبة

اقرأ ايضاً..  هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي 



 تفوق نسبي لـ o1.. وأداء ضعيف لـ R1



على سبيل المثال، قدمت بعض النماذج إجابات خاطئة رغم إدراكها أنها غير صحيحة، بل إن نموذج R1 كتب بشكل صريح "أنا أستسلم" "I give up" متبوعًا بإجابة عشوائية.

كما لوحظ أن بعض النماذج تقدم إجابة، ثم تتراجع عنها وتحاول اقتراح إجابة جديدة، لكنها تخطئ مرة أخرى. في بعض الأحيان، تصل النماذج إلى الإجابة الصحيحة مباشرة، لكنها تستمر في تحليل إجابات أخرى دون سبب واضح، بينما أظهر نموذج R1 في بعض الحالات سلوكًا غريبًا بوصف حالته بـ"الإحباط"، مما يعكس محاكاة مثيرة للسلوك البشري عند مواجهة مشاكل صعبة.  


أما من حيث الأداء، فقد حقق النموذج o1 أفضل نتيجة، مسجلاً 59%، يليه o3-mini بنسبة 47%، بينما حصل R1 على 35%. يخطط الباحثون لتوسيع الاختبارات لتشمل نماذج أخرى، بهدف تحسين قدرة الذكاء الاصطناعي على حل المشكلات المعقدة بطرق أكثر ذكاءً واستنادًا إلى التفكير المنطقي بدلاً من الاسترجاع الآلي.  



 




كيف نحسن قدرات الذكاء الاصطناعي



تُظهر هذه الدراسة الحاجة إلى تطوير معايير اختبار جديدة للذكاء الاصطناعي تكون أكثر ارتباطًا بالقدرات المطلوبة في الاستخدامات اليومية. وكما أوضح أرجون غها، أحد الباحثين المشاركين: "لا تحتاج إلى شهادة دكتوراه لتكون جيدًا في الاستدلال، لذلك ينبغي أن تكون هناك معايير تقيس هذه المهارة دون الحاجة إلى معرفة أكاديمية متخصصة".

 



من خلال هذه المعايير، يمكن توفير أدوات أكثر شمولًا تتيح للباحثين والمستخدمين العاديين على حد سواء فهم نقاط القوة والضعف في هذه النماذج، مما يساعد في تحسينها وجعلها أكثر قدرة على التفاعل مع المشكلات الحقيقية بطرق فعالة ومنطقية.


إسلام العبادي(أبوظبي)

المصدر: صحيفة الاتحاد

كلمات دلالية: الذكاء الاصطناعي الروبوتات الذکاء الاصطناعی

إقرأ أيضاً:

نقابة المهن التمثيلية تواجه أشباح الذكاء الاصطناعي.. المستشار القانوني للنقابة يكشف التفاصيل

قال المستشار القانوني لنقابة المهن التمثيلية، المحامي شعبان سعيد، إن التطور التكنولوجي الهائل وظهور تقنيات الذكاء الاصطناعي، إلى جانب الانتشار الواسع لوسائل التواصل الاجتماعي، جعل الفنانين أكثر عرضة للتجاوزات الرقمية من أي وقت مضى، موضحا أن النقابة لاحظت خلال الفترة الأخيرة انتشار صور ومقاطع مزيفة لفنانات تظهرهن بصورة مسيئة وبملابس غير لائقة، وهي مواد يصعب على الجمهور في البداية التمييز بين كونها حقيقية أو مُنتجة عبر الذكاء الاصطناعي، ما استدعى تدخّل النقابة بشكل عاجل.

أوضح سعيد، خلال مداخلة هاتفية في برنامج "العاشرة"، مع الإعلامي محمد سعيد محفوظ، على شاشة "إكسترا نيوز"، أن اللجنة التي شُكّلت قبل أربعة أشهر حصرت التجاوزات وتلقت بلاغات متعددة، وتم بالفعل تقديم عدد من الشكاوى للنيابات المختصة، وما زالت القضايا قيد الفحص والتحقيق، موضحا أن النقابة تواجه صعوبات كبيرة في تعقب مرتكبي هذه الجرائم، بسبب غياب قوانين حديثة وسريعة ورادعة تنظّم التعامل مع جرائم الذكاء الاصطناعي، لافتاً إلى أن القوانين الحالية مثل قانون حماية الملكية الفكرية لعام 2002 وقانون مكافحة جرائم تقنية المعلومات، تتيح تقديم البلاغات فقط دون تمكين النقابة من ملاحقة الجناة بشكل مباشر.

وأشار إلى أن الجهات المختصة قد تنجح أحياناً في التوصل إلى مرتكبي هذه الأفعال عبر أجهزتها الفنية، لكن غالباً ما تكون الحسابات المستخدمة خارج البلاد أو تُغلق سريعاً بعد نشر المحتوى، مما يجعل الوصول إلى المتورطين أمراً بالغ الصعوبة.

وأكد المستشار القانوني لنقابة المهن التمثيلية أن النقابة بصدد المشاركة في إعداد مشروع قانون جديد لتغليظ العقوبات المتعلقة بجرائم الذكاء الاصطناعي، خاصة أن أعضاء النقابة هم من أكثر الفئات المتضررة من هذه الأفعال.

وأوضح أن المشروع سيُعرض في بداية دورة مجلس النواب المقبلة، بهدف وضع إطار تشريعي رادع يحمي الفنانين من عمليات التزييف الرقمي ويضمن محاسبة المتورطين. وشدد على أنه في ظل القوانين الحالية، فإن أي شخص يثبت تورطه في إنتاج محتوى مسيء سيُعاقب جنائياً ومدنياً، إلا أن التحدي الأكبر يتمثل في القدرة على ضبط الجناة، مشيراً إلى أن جرائم الذكاء الاصطناعي أكثر "زئبقية" مقارنة بجرائم السب والقذف التقليدية، وتتطلب أدوات تقنية وتشريعية أكثر تطوراً لمواجهة هذا النوع الجديد من الجرائم.

مقالات مشابهة

  • أوبن أيه آي تطلق نموذج الذكاء الاصطناعي GPT-5.2 بعد تحسينات واسعة
  • مقارنة بين نماذج الذكاء الاصطناعي والبرامج الإحصائية التقليدية.. ورشة عمل بجامعة العاصمة
  • المهن التمثيلية تواجه أشباح الذكاء الاصطناعي .. المستشار القانوني للنقابة يكشف
  • نقابة المهن التمثيلية تواجه أشباح الذكاء الاصطناعي.. المستشار القانوني للنقابة يكشف التفاصيل
  • المهن التمثيلية تواجه أشباح الذكاء الاصطناعي.. المستشار القانوني للنقابة يكشف التفاصيل
  • الذكاء الاصطناعي النووي يُحدث نقلة في إدارة قطاع الطاقة
  • نماذج الذكاء الاصطناعي وإعادة صياغة الظهور الرقمي
  • الذكاء الاصطناعي يحل مشكلة السمع في الضوضاء
  • حكماء المسلمين في إندونيسيا ينظِّم ندوة وطنيَّة لمناقشة سبل تعزيز الاستخدام الأخلاقي للذكاء الاصطناعي
  • الذكاء الاصطناعي يكتب أكثر في 2026 لكن الصحافة البشرية لا تفقد قيمتها