رغم الضجة حول قوة نماذج الذكاء الاصطناعي الجديدة من OpenAI، وهما o3 و o4-mini، فإن تقارير فنية كشفت عن مفارقة غير متوقعة، حيث ثوبت أن هذه النماذج تهلوس أكثر من سابقتها ،أي أنها تقدم معلومات غير صحيحة أو ملفقة بمعدل أعلى من النماذج الأقدم مثل o1 و o3-mini.

 ما هي "الهلوسة" في الذكاء الاصطناعي؟

في سياق نماذج الذكاء الاصطناعي، يشير مصطلح "الهلوسة" إلى إنتاج معلومات غير دقيقة أو مختلقة ، مثل تقديم روابط غير موجودة، أو نسب أحداث لأشخاص لم تحدث، أو حتى الادعاء بتنفيذ عمليات لم تحدث أصلًا.

وبحسب اختبارات داخلية أجرتها OpenAI، فإن، نموذج o3 هلوس في 33% من الأسئلة في اختبار داخلي يسمى PersonQA، ضعف معدل الهلوسة في o1 و o3-mini.

أما نموذج o4-mini، فكانت النتائج أسوأ، بهلوسة في 48% من الأسئلة.

نماذج OpenAI الجديدة أكثر ذكاء... لكنها "تتخيل" أكثر من اللازمOpenAI تطلق جيلا جديدا من الذكاء الاصطناعي يعتمد على التفكير قبل الإجابةOpenAI تطور شبكة اجتماعية جديدة على غرار إكسOpenAI تطلق أحدث نسخة من نموذج الذكاء الاصطناعي GPT-4.1OpenAI تفرض خطوات تحقق صارمة على المؤسسات لحماية نماذجها المتقدمةأجهزة o4-mini و o3.. بداية مرحلة جديدة في إنتاج الذكاء الاصطناعي من OpenAIOpenAI ترفع دعوى مضادة ضد إيلون ماسكOpenAI توفر وصولا مجانيا إلى Chatgpt Plus حتى مايو 2025OpenAI تطور هاتفا بلا شاشة يعمل بالذكاء الاصطناعيOpenAI تواجه اتهامات خطيرة بسبب كتب O’Reilly المحمية بحقوق النشر مصدر القلق الأكبر؟

 لا تعرف شركة OpenAI السبب الدقيق لهذه الزيادة في معدل الهلوسة،
ففي تقريرها الفني، أشارت إلى أن "هناك حاجة إلى مزيد من الأبحاث لفهم السبب وراء تفاقم الهلوسات عند توسيع نطاق النماذج المنطقية reasoning models".

ورغم أن o3 و o4-mini حققا أداءً ممتازًا في مهام الترميز والرياضيات، إلا أن زيادة عدد الادعاءات الكلية التي تنتجها النماذج أدى بدوره إلى ارتفاع عدد الادعاءات الخاطئة أيضًا، بحسب التقرير.

 نتائج تحقيق خارجي

اختبارات مستقلة أجراها مختبر Transluce البحثي غير الربحي كشفت أن نموذج o3 لا يكتفي بتقديم معلومات خاطئة، بل يختلق إجراءات لم تحدث أصلاً.

في إحدى الحالات، ادعى o3 أنه قام بتشغيل كود على جهاز MacBook Pro ثم نقل الأرقام إلى جوابه، في حين أن النموذج لا يمتلك تلك الإمكانيات أصلاً.

أرجع  Neil Chowdhury، الباحث في Transluce والموظف السابق في OpenAI، الظاهرة إلى أن طريقة التعلم بالتعزيز المستخدمة في نماذج o-series قد تضخم مشكلات كان يتم الحد منها في نماذج أخرى عبر تقنيات ما بعد التدريب.

 تطبيقات عملية

رغم المشكلات، أشار خبراء مثل Kian Katanforoosh، أستاذ مساعد بجامعة ستانفورد ومدير شركة Workera الناشئة، إلى أن فريقه يستخدم o3 في سير عمل الترميز واعتبره متفوقًا على المنافسين.
لكنهم لاحظوا أن النموذج يهلوس روابط ويب مكسورة، حيث يقترح روابط تبدو واقعية ولكنها لا تعمل فعليًا.

 البحث على الويب

تُعد إضافة ميزة البحث المباشر على الإنترنت إحدى الحلول المطروحة لتقليل الهلوسة، حيث سجل GPT-4o المزود بالبحث دقة بلغت 90% في اختبار SimpleQA، وفقًا لـ OpenAI.
لكن الاعتماد على بحث خارجي يعني أن المستخدم يجب أن يقبل بمشاركة محتوى الاستعلامات مع محركات بحث طرف ثالث، وهو ما قد يثير تحفظات تتعلق بالخصوصية.

 سباق الذكاء يواجه مفارقة

رغم أن التركيز الحالي في صناعة الذكاء الاصطناعي يتحول نحو "نماذج التفكير والاستدلال" (reasoning models) باعتبارها أكثر كفاءة من النماذج التقليدية، فإنها تبدو أكثر عرضة للهلوسة.

وهذا ما يجعل مسألة تحسين دقة النماذج أكثر إلحاحًا من أي وقت مضى، خاصة في القطاعات الحساسة مثل القانون، الصحة، والإعلام، حيث قد تؤدي الهلوسة إلى عواقب كارثية.

المصدر: صدى البلد

كلمات دلالية: الذكاء الاصطناعي المزيد الذکاء الاصطناعی

إقرأ أيضاً:

من النفط إلى الذكاء الاصطناعي.. كيف تعيد دول الخليج تشكيل اقتصادها؟

نشرت صحيفة "لوموند" الفرنسية، تقريرًا، تناولت فيه تصاعد دور دول الخليج، خصوصًا دولة الإمارات العربية المتحدة والمملكة العربية السعودية، في إعادة تشكيل مسار اقتصاداتها بعيدًا عن النفط من خلال الاستثمار الضخم في مجال الذكاء الاصطناعي والبنية التحتية الرقمية.

وقالت الصحيفة، في تقريرها الذي ترجمته "عربي21"، إنّ: "هذه الاستراتيجية الطموحة تهدف إلى تحويل هذه الدول إلى لاعبين كبار على الساحة العالمية للتكنولوجيا. سلط مؤتمر "فيفا تيك" التقني بباريس الضوء على شركة "المجموعة 42" الإماراتية التي كان القليل من الحضور يعرفونها".

وأوضحت: "حضر مدير الشركة، بينغ شياو، اللقاء، بتكريم رسمي بوجود ممثلين عن الدولة الفرنسية، في إشارة إلى أهمية الشراكات الدولية في هذا القطاع".

فرنسا ضمن دائرة الاستثمار
ذكرت الصحيفة أنّ: "الإمارات  تشارك بشكل مباشر في بناء البنية التحتية الرقمية في فرنسا من خلال استثمارات ضخمة في مراكز البيانات. ومن أبرز المشاريع التي تقودها شركة "مجموعة 42" بالتعاون مع صندوق "إم جي إكس" السيادي هو مركز بيانات في منطقة فوجو بقدرة 1.4 غيغاواط، أي ما يعادل قدرة مفاعل نووي كبير".

وأضافت: "تشمل الشراكات أيضًا شركات فرنسية مثل مسترال أيه آي، ومعهد بوليتكنيك، والبنك العام للاستثمار "بي بي آي فرانس" وبمساهمة شركة إنفيديا الأمريكية. فيما تؤكد وزارة الذكاء الاصطناعي والرقمنة الفرنسية أن هذه الاستثمارات هدفها تلبية الحاجة المتزايدة إلى قوة الحوسبة في تطوير الذكاء الاصطناعي محليًا".


مشاريع مشتركة وتوسّع مستمر
تشارك "المجموعة 42"، أيضًا، عبر ذراعها شركة  "كور 42 " في مشروع بناء حرم جامعي للذكاء الاصطناعي قرب مدينة غرونوبل الفرنسية، يستفيد من إعادة تأهيل مراكز بيانات قائمة. ومن المقرر أن يدخل المشروع حيز التشغيل في تشرين الأول/ أكتوبر 2025 بدعم من تحالف فرنسي محلي يضم عددًا من الشركات الناشئة والفاعلين الاقتصاديين".

واسترسل: "تسعى كل من شركة "أوريوس" و" كور 42" إلى توسيع النشاط عبر استكشاف مواقع جديدة في منطقتي غراند إيست وفرنسا العليا".

وأردف: "في خطوة أخرى، أبرمت "مجموعة 42" الإماراتية شراكة مع  "مسترال أيه آي" لتطوير تطبيقات موجهة للشركات في أوروبا والشرق الأوسط في إطار تعاون تكنولوجي أوسع يشمل زيارات رسمية ووفود متخصصة".

استراتيجية تعاون استراتيجية
"تندرج هذه المبادرات في إطار الحوار الاستراتيجي بين الإمارات وفرنسا الذي بدأ سنة 2008، ويغطي مجالات متعددة من الدفاع والثقافة إلى التعليم والتكنولوجيا" وفقا للتقرير نفسه الذي ترجمته "عربي21".

واستطرد: "لكن هذه الانطلاقة الخليجية ليست محصورة في فرنسا فقط بل تمتد إلى الولايات المتحدة وأماكن أخرى، حيث تسعى الإمارات إلى تمويل نمو شركات عالمية مثل شركة أوبن إيه آي وتعمل على مشروع "ستارغيت" الضخم في تكساس بتمويل قد يصل إلى 500 مليار دولار".

طموحات وتحديات
بحسب التقرير ذاته، فإنّ: "الذكاء الاصطناعي بات محور الاستراتيجية الإماراتية منذ تأسيس وزارة خاصة له سنة 2017 بهدف تحقيق مساهمة نسبتها 20% من الناتج المحلي الإجمالي بحلول سنة 2031. أما السعودية، فتسعى لتحقيق قدرة إنتاجية تصل إلى 6.6 غيغاواط بحلول 2034، عبر صندوق الاستثمارات العامة وصندوقين جديدين بقيمة 100 مليار دولار لكل منهما".

أبرز: "هذا التوسّع لا يخلو من تحديات. فقد واجهت مجموعة 42 في السنوات الماضية مخاطر سياسية واتهامات مرتبطة بالعلاقات مع شركات صينية قبل أن تعيد ترتيب صفوفها وتفتح صفحة جديدة مع واشنطن، ما مّكنها من الحصول على شرائح إلكترونية حديثة وتعزيز الشراكات مع شركات أمريكية مثل مايكروسوفت وأنفيديا".


موقف فرنسي: السيادة ليست انعزالية
من جانبها، أكدت فرنسا، بحسب التقرير، أنها: "لا تستطيع تطوير البنية التحتية الخاصة بالذكاء الاصطناعي بمفردها وأن التعاون الدولي ضروري بشرط ضمان السيادة. وأشار المتحدث باسم وزارة الشؤون الرقمية الفرنسية إلى أنّ: السيادة ليست انعزالية"، وأكدت الوزارة أنها ستراقب عن كثب أي نقل محتمل للتكنولوجيا الحساسة".

 وتقلا عن مدير شركة "مجموعة 42"، بينغ شياو، ختمت الصحيفة تقريرها بالقول: "هو واثق من أن التوسع العالمي في الذكاء الاصطناعي سيجعل الإمارات مركزًا مهماً في هذا المجال".

وأشار إلى أنّ: "العالم يحتاج إلى 300 إلى 500 غيغاواط من قدرة مراكز البيانات، بينما لا يوجد الآن سوى 60 غيغاواط. بهذا التوجه، ترسم دول الخليج خريطة طريق جديدة نحو المستقبل تعتمد على التكنولوجيا كركيزة أساسية للتحول الاقتصادي والسياسي".

مقالات مشابهة

  • من النفط إلى الذكاء الاصطناعي.. كيف تعيد دول الخليج تشكيل اقتصادها؟
  • الذكاء الاصطناعي يجعل من النظارات الذكية ذات شمولية أوسع
  • الذكاء الاصطناعي يقدّر بفاعلية جرعة العلاج الكيميائي لسرطان القولون
  • غوغل تواجه اتهامات برقابة الإنترنت باستخدام الذكاء الاصطناعي
  • تأهيل 10 آلاف شخص في الذكاء الاصطناعي بحلول 2030
  • عملاقة الإنترنت الكورية تعلن إنشاء مركز بيانات ضخم مخصص للذكاء الاصطناعي بالمغرب
  • شاهد: أحدث وسيلة للغش بواسطة قلم الذكاء الاصطناعي
  • تحذير.. الذكاء الاصطناعي يهدد السلم المجتمعي في العراق
  • محاكم دبي تبحث توظيف الذكاء الاصطناعي في القضاء
  • إنشاء كرسي لتطبيقات الذكاء الاصطناعي في جامعة نزوى