منذ ظهور "شات جي بي تي" في نهاية عام 2022 ومطلع العام الذي يليه، تعالت الأصوات من مختلف بقاع العالم في مختلف الوظائف خوفًا من استيلاء هذه التقنية على الوظائف في العالم، وهي الأصوات التي لم تثن الشركات عن تطوير هذه النماذج بشكل أكثر وأقوى في مسعى منها لزيادة قدراتها.

ومن أجل قياس هذه القدرات، تقوم الشركات باختبارات مستمرة، وهي الاختبارات التي تنجح فيها نماذج الذكاء الاصطناعي بشكل باهر، ولكن هذه النجاحات كانت سببًا لإثارة شكوك ريان كريشنان الذي قرر لاحقًا تأسيس شركة وأطلق عليها "فالس إيه آي" (Vals AI).

تسعى "فالس إيه آي" لاختبار نماذج الذكاء الاصطناعي بشكل مستقل وبعيد عن الشركات، وذلك عبر مجموعة من الاختبارات المكثفة للتيقن من جودة هذه النماذج واكتشاف نقاط الضعف فيها. وبحسب الاختبارات التي أجرتها "فالس إيه آي" على 22 نموذجا عاما للذكاء الاصطناعي من "أوبن إيه آي" و"غوغل" وآنثروبيك" و"إكس" وغيرها، فإن جميع هذه النماذج سجلت أقل من 50% في اختبارات الدقة المتعلقة بالتحليل والجوانب المالية المتنوعة، وتجدر الإشارة إلى أن هذه الاختبارات لم تكن اختبارات معقدة، بل كانت لمهام مالية بسيطة، فكيف حدث هذا؟

إعلان فجوة بين قاعدة معلومات التدريب والاستخدامات الحقيقية

يرى كريشنان أن الادعاءات المتعلقة بجودة نماذج الذكاء الاصطناعي ودقتها تفتقر بشكل كبير إلى الدقة، وذلك لأنها تأتي مباشرة من الشركة المطورة للنموذج مع غياب أدوات المراجعة والتقييم الخارجية، لذا كان يجب إيجاد حل خارجي لتقييم نماذج الذكاء الاصطناعي المختلفة وأدواتها.

وفي حديثه مع صحيفة "واشنطن بوست"، أشار كيرشنان إلى أن معظم نماذج الذكاء الاصطناعي تُدرّب على أبحاث علمية وأوراق بحثية بحتة، وهي في أغلب الأحيان لا تمتّ إلى الواقع والاستخدامات اليومية بصلة، ولذلك أحيانًا تكون النتائج جيدة علميا ولكنها سيئة عمليا.

دفع هذا "فالس إيه آي" إلى تطوير اختبار ذكاء اصطناعي مكون من 500 سؤال بمساعدة إحدى المؤسسات المالية الرائدة من أجل بناء اختبار فعال في القطاع المالي تحديدًا، وتحديد مستوى جودة نماذج الذكاء الاصطناعي ودقتها.

وأضاف أيضًا أن معظم اختبارات الذكاء الاصطناعي تتم عبر مجموعة من الأسئلة العامة والبيانات العلمية الواردة في الأوراق البحثية، وهي بيانات متوفرة لأغلب نماذج الذكاء الاصطناعي في العالم ويمكن الوصول إليها بسهولة كبيرة، وهو ما يجعل نتائج الاختبارات إيجابية دومًا.

وعن الاختبار الذي أجرته "فالس إيه آي"، قال كريشنان إن الاختبار تضمن مجموعة من المهام المتنوعة والأساسية لكل من يعمل في أسواق المال وحتى الصحفيين الذين يغطون عالم المال بشكل مستمر حتى أصبحت لديهم خبرة كافية. شمل الاختبار أسئلة مثل البحث عن معلومات داخل أنظمة "إدغار" (EDGAR) لتخزين البيانات في الشركات، أو حتى قاعدة بيانات هيئة الأوراق المالية والبورصات المتاحة للعامة والتي تحتوي على ملفات الشركات، وهي جميعًا موارد يستخدمها المحللون والخبراء ويحتاجون إليها بشكل يومي.

أقل من 50% لجميع النماذج

بحسب تقرير "واشنطن بوست"، فإن اختبار "فالس إيه آي" أثمر عن نتائج متدنية لنماذج الذكاء الاصطناعي التي لم تتخطّ نتائجها معًا 50% من إجمالي النتائج في الاختبار. فمثلًا، تمكن نموذج "أوبن إيه آي أو 3" الأحدث من الشركة من تحقيق نتيجة 48.3% رغم كونه مخصصًا لهذا النوع من الأبحاث والمعلومات.

إعلان

ومن ناحية نموذج "آثنروبيك" الأحدث "كلود سونيت 3.7" (Claude Sonnet 3.7)، فقد تمكن النموذج من تحقيق نسبة 44.1%. وأما نماذج "ميتا" الثلاثة "إل إل إم إيه" (LLMA)، فقد كانت نتائجها مخيبة للآمال بشكل كبير، إذ لم تتجاوز نتائجها 10% في الاختبارات جميعها.

بالطبع، تجاهلت هذه الشركات اختبارات "فالس إيه آي" ورفضت التعليق عليها تمامًا، وذلك سواء كان من قبل "أوبن إيه آي" أو غيرها من الشركات التي تجاهلت نتائج الاختبارات بالكامل.

معظم نماذج الذكاء الاصطناعي تُدرّب على أبحاث علمية وأوراق بحثية بحتة (شترستوك) لماذا هذه النتائج السيئة؟

توجد العديد من الأسباب المنطقية التي تجعل نتائج الذكاء الاصطناعي سيئة إلى هذه الدرجة، بدءًا من اعتماد الذكاء الاصطناعي على مجموعة من المواد غير الدقيقة في الاختبارات وحتى المواد العلمية البحتة التي لا تتطرق إلى الأسئلة الحقيقية التي يحتاجها الخبراء.

وعلى النقيض، فإن الشركة اعتمدت على الخبراء لبناء مكتبة الأسئلة الخاصة بها، وذلك من دون تزويد النموذج بالمستندات والتدريب اللازم للوصول إلى هذه النتائج، إذ وُجّهت الأسئلة مباشرة إلى النماذج من دون تقديم سياق حقيقي لها.

صيحة جديدة في عالم الذكاء الاصطناعي

تعد شركة "فالس إيه آي" من الشركات الناشئة الجديدة في قطاع الذكاء الاصطناعي والتي تسعى للتيقن والتأكد من نتائج اختبارات النماذج المختلفة وتدقيق النماذج، وذلك كاستجابة مباشرة لتنوع نماذج الذكاء الاصطناعي وطرح العديد منها باستمرار.

ويرى كريشنان أن الاعتماد على اختبارات الشركات الخارجية مثل "فالس إيه آي" هو الطريق الوحيد لتطوير نماذج الذكاء الاصطناعي وبناء روبوتات دردشة حقيقية قادرة على مساعدة المستخدمين في التحديات الحقيقية التي يواجهونها.

وفي هذه الحالة، فإن الذكاء الاصطناعي لن يأخذ مكان البشر بل سيكون أداة لتيسير أداء العمل والانتهاء منه في وقت سريع وقياسي، شريطة أن تكون النتائج دقيقة ويمكن أن يعتمد عليها الخبراء.

إعلان هل يستبدل الذكاء الاصطناعي البشر تمامًا؟

في فبراير/شباط الماضي، قال بيل غيتس مؤسس "مايكروسوفت" إن الذكاء الاصطناعي سيأخذ مكان العديد من الوظائف البشرية مثل الأطباء والمعلمين، وهو الأمر الذي أيده فيكتور لازارتي المستثمر الأبرز في العديد من الشركات التقنية، إذ قال إن دور الذكاء الاصطناعي لن يقتصر على تعزيز المهام البشرية فقط.

ولكن ما مدى صحة هذه النظريات والتصريحات في ضوء نتائج اختبارات "فالس إيه آي" التي أثبتت قصر قدرات الذكاء الاصطناعي في بعض المجالات؟

المصدر: الجزيرة

كلمات دلالية: حريات نماذج الذکاء الاصطناعی مجموعة من العدید من

إقرأ أيضاً:

غوغل تطلق "وضع الذكاء الاصطناعي" لتحويل البحث إلى حوار ذكي

تُعيد غوغل تشكيل تجربة البحث عبر الإنترنت من خلال إطلاق "وضع الذكاء الاصطناعي"، الذي يحوّل التفاعل مع محرك البحث إلى محادثة ذكية، في خطوة تهدف إلى تعزيز هيمنتها الرقمية ومواجهة المنافسة المتزايدة. اعلان

أطلقت شركة "غوغل" يوم الثلاثاء موجة جديدة من تقنيات الذكاء الاصطناعي (AI) بهدف تسريع عملية إعادة تصميم محرك البحث الخاص بها التي بدأت قبل عام.

وتعمل الشركة على تغيير طريقة حصول المستخدمين على المعلومات، وذلك عبر تقليل اعتمادهم على التنقل عبر المواقع الإلكترونية.

وتتضمن المرحلة الجديدة، التي تم الإعلان عنها خلال مؤتمر المطورين السنوي لشركة غوغل، إطلاق خيار جديد يُسمى "وضع الذكاء الاصطناعي" في الولايات المتحدة.

تُحوّل هذه الميزة تجربة التفاعل مع محرك بحث غوغل إلى حوار مع خبير يمكنه الإجابة عن أي سؤال، مهما كان موضوعه.

وقد تم إطلاق "وضع الذكاء الاصطناعي" لجميع المستخدمين في الولايات المتحدة بعد أقل من ثلاثة أشهر من اختباره مع مجموعة محدودة من المستخدمين ضمن قسم المختبرات.

كما تقوم غوغل الآن بدمج أحدث إصدار من نموذج الذكاء الاصطناعي الخاص بها، Gemini 2.5، في خوارزميات البحث لديها، وستبدأ قريبًا باختبار ميزات جديدة أخرى مدعومة بالذكاء الاصطناعي، مثل شراء تذاكر الحفلات تلقائيًا والبحث عبر بث الفيديو المباشر.

وفي مثال آخر على التزام غوغل المتسع باستخدام الذكاء الاصطناعي، أعلنت الشركة أنها تخطط لاستخدام هذه التقنية في إعادة دخول سوق النظارات الذكية عبر إطلاق جهاز جديد يعمل بنظام Android XR.

ستأتي هذه النظارة المنتظرة بكاميرا تُستخدم دون الحاجة إلى اليدين، وبمساعد ذكي مدعوم بالذكاء الاصطناعي. هذا الإعلان يأتي بعد 13 عامًا من طرح "نظارات غوغل"، وهي نظارات أوقفت الشركة إنتاجها إثر رد فعل سلبي واسع بسبب مخاوف تتعلق بالخصوصية والأمان.

لم تحدد غوغل موعد توفر نظارات Android XR أو سعرها، لكنها أوضحت أن تصميم النظارة سيتم بالتعاون مع شركتي Gentle Monster وWarby Parker.

ومن المتوقع أن تنافس هذه النظارة منتجًا مشابهًا موجودًا بالفعل في السوق، وهو النظارات الذكية التي أطلقتها شركة Meta Platforms (الشركة الأم لفيسبوك) بالشراكة مع Ray-Ban.

Relatedعلى خطى غوغل ومايكروسوفت.. أمازون تتحول نحو الطاقة النووية لتشغيل مراكز البيانات اليابان تدعو الاتحاد الأوروبي للتعاون في تطوير نماذج ذكاء اصطناعيوسط ضغوط فدرالية وامتثالًا لقواعد ترامب.. غوغل تُعدّل سياساتها في التنوع على برامج الذكاء الاصطناعيالذكاء الاصطناعي يعيد تشكيل تجربة البحث في غوغل

يُعد هذا التوسع امتدادًا للتحول الذي بدأتْه غوغل قبل عام، حين أطلقت ملخصات محادثة تحت اسم "ملخصات الذكاء الاصطناعي"، والتي تظهر بشكل متزايد في أعلى صفحة النتائج، وتحتل مكانةً أعلى من الروابط التقليدية في نتائج البحث.

وبحسب ما أعلنت غوغل، فإن نحو 1.5 مليار شخص يتفاعلون بانتظام مع هذه الملخصات، كما أصبح المستخدمون يدخلون استفسارات أطول وأكثر تعقيدًا.

وفي كلمة أمام حضور كبير في قاعة مؤتمرات قريبة من مقر الشركة في ماونتن فيو بكاليفورنيا، قال سوندار بيتشاي، الرئيس التنفيذي لشركة غوغل: "كل هذا التقدم يعني أننا دخلنا مرحلة جديدة في تطور منصتنا المبنية على الذكاء الاصطناعي، حيث تحولت عقود من الأبحاث إلى واقع يستفيد منه الناس في كل أنحاء العالم".

الذكاء الاصطناعي يُعيد تشكيل سلوك المستخدم

وعلى الرغم من توقعات سوندار بيتشاي وفريق الإدارة في غوغل بأن ميزة "النظرة العامة للذكاء الاصطناعي" ستزيد من عمليات البحث والنقر على الروابط، إلا أن الواقع لم يكن على هذا النحو حتى الآن، بحسب بيانات شركة BrightEdge المتخصصة في تحسين محركات البحث.

اعلان

وأظهرت دراسة حديثة أجرتها الشركة انخفاضًا بنسبة 30% في معدلات النقر على نتائج بحث غوغل خلال العام الماضي، مشيرة إلى أن السبب الرئيسي هو اكتفاء المستخدمين بالمعلومات المقدمة عبر الملخصات الذكية دون الحاجة للنقر على الروابط.

ويُعد قرار إتاحة "وضع الذكاء الاصطناعي" على نطاق واسع بعد فترة اختبار قصيرة دليلًا على ثقة غوغل في دقة التكنولوجيا وعدم انتشار المعلومات المضللة عبرها، وهو ما يعكس أيضًا وعي الشركة بالمنافسة الشديدة التي تواجهها من أدوات بحث أخرى مدعومة بالذكاء الاصطناعي مثل ChatGPT وPerplexity.

الصعود السريع للذكاء الاصطناعي يُعيد رسم خريطة المنافسة

برز الصعود السريع لبدائل الذكاء الاصطناعي كمصدر اهتمام رئيسي في الإجراءات القانونية التي قد تؤدي إلى اضطرار غوغل إلى إعادة هيكلة أجزاء من إمبراطوريتها على الإنترنت، بعد أن أعلن قاضٍ فيدرالي أمريكي أن محرك بحث الشركة يمثل احتكارًا غير قانوني.

وأفاد إيدي كيو، المدير التنفيذي لشركة Apple، خلال شهادته في المحاكمة مبكرًا هذا الشهر، بأن عمليات البحث عبر غوغل من خلال متصفح Safari على iPhone انخفضت، نتيجة تحول المستخدمين إلى بدائل تعتمد على الذكاء الاصطناعي.

اعلان

وأشارت غوغل إلى التغيرات الناتجة عن صعود الذكاء الاصطناعي كسبب رئيس لضرورة إجراء تعديلات طفيفة فقط على آلية عمل محرك بحثها، مشيرة إلى أن هذه التكنولوجيا تعيد تشكيل المشهد التنافسي بشكل جذري.

لكن على ما يبدو، فإن الاعتماد المتزايد لغوغل على الذكاء الاصطناعي حتى الآن ساعد محرك بحثها في الحفاظ على مكانته كبوابة رئيسية للإنترنت، وهو العامل الرئيسي الذي يجعل قيمتها السوقية ضمن شركتها الأم ألفابت تصل إلى تريليوني دولار (1.8 تريليون يورو).

وبحسب بيانات جمعها موقع onelittleweb.com، بلغ عدد زيارات غوغل الشهرية خلال العام المنتهي في مارس الماضي 136 مليار زيارة، أي ما يعادل 34 ضعف الزيارات الشهرية لموقع ChatGPT البالغة أربعة مليارات زيارة.

وعند سؤال "وضع الذكاء الاصطناعي" الخاص بغوغل من قبل صحفي في وكالة أسوشيتد برس، عما إذا كان اعتماد الذكاء الاصطناعي قد يؤثر سلبًا على محرك البحث، أكد أن ذلك غير محتمل، مشيرًا إلى أنه قد يعزز مكانة الشركة أكثر.

اعلان

ورد "وضع الذكاء الاصطناعي": "نعم، من المحتمل جدًا أن يجعل هذا الوضع شركة غوغل أقوى، خاصةً في مجال الوصول إلى المعلومات والتأثير على الإنترنت". وحذّرت الميزة أيضًا من أن الناشرين على الويب قد يواجهون انخفاضًا في الزيارات القادمة من نتائج البحث.

انتقل إلى اختصارات الوصولشارك هذا المقالمحادثة

مقالات مشابهة

  • لحلّ لغز الرسوم الجمركية المعقدة.. الشركات تتجه نحو الذكاء الاصطناعي
  • الذكاء الاصطناعي يسهل البحث على غوغل.. فيديو
  • أسلحة الذكاء الاصطناعي التي استخدمتها إسرائيل في حرب غزة
  • الشركات تلجأ إلى الذكاء الاصطناعي لمواجهة "فوضى" الرسوم الجمركية
  • الصين تطلق أول بطولة ملاكمة لروبوتات الذكاء الاصطناعي .. فيديو
  • الذكاء الاصطناعي يكشف التوحد في ثوانٍ
  • الذكاء الاصطناعي بين الإنجاز والمخاطر
  • بعد سنوات قليلة.. دواء من تصميم الذكاء الاصطناعي في صيدليات العالم
  • غوغل تطلق "وضع الذكاء الاصطناعي" لتحويل البحث إلى حوار ذكي