إنجاز جديد لـ GPT-4.5.. يجتاز اختبار "العقل البشري" ويربك خبراء الذكاء الاصطناعي
تاريخ النشر: 5th, April 2025 GMT
كشفت دراسة جديدة أجراها باحثون في جامعة كاليفورنيا، سان دييغو أن أحدث نماذج الذكاء الاصطناعي، GPT‑4.5 من OpenAI وLlama‑3.1‑405B من Meta، تمكّنا من اجتياز اختبار تورينغ ثلاثي الأطراف تحت ظروف معينة، وهو ما يعيد طرح الأسئلة حول مدى اقتراب الذكاء الاصطناعي من التفكير البشري.
ووفقاً لنتائج الدراسة، أخطأ المحققون في تمييز الآلة عن الإنسان خلال جلسات محادثة استمرت لمدة 5 دقائق، حيث تم اعتبار GPT‑4.
هذا الإنجاز تم بفضل استخدام مُوجِّه استراتيجي يُعرف باسم "PERSONA"، يُزوّد النموذج بشخصية افتراضية مليئة بالتفاصيل اليومية والعاطفية، ما يجعل تفاعله أكثر واقعية.
أما نموذج Llama‑3.1‑405B، فنجح هو الآخر في خداع المحققين بنسبة 56% عند توجيهه لشخصية معينة، في حين حقق النموذج المرجعي GPT‑4o نسبة لا تتجاوز 21% باستخدام تعليمات بسيطة فقط.
ووفقاً للباحث الرئيسي كاميرون جونز، حقق GPT‑4.5، باستخدام مُوجِّه "PERSONA" الاستراتيجي، نسبة نجاح بلغت 73% ، مما يعني أنه في جلسات الدردشة التي استمرت خمس دقائق، تم التعرف على نظام الذكاء الاصطناعي على أنه الإنسان أكثر من الإنسان نفسه.
وبحسب كاميرون جونز، فإن الأداء المذهل للنماذج اللغوية لا يعود فقط إلى تطورها التقني، بل إلى مدى قدرة النموذج على تبني "هوية" كاملة، تُضفي على المحادثة طابعاً بشرياً مقنعاً، يشمل الحديث عن العلاقات والمشاعر واليوميات.
وعند إزالة هذه "الشخصيات الافتراضية"، تراجع أداء GPT‑4.5 إلى 36%، مما يؤكد أن التخصيص عامل حاسم في قدرة الذكاء الاصطناعي على تجاوز الاختبار.
هل اختبار تورينغ لا يزال معياراً فعّالًا؟يهدف اختبار تورينغ، الذي وضعه العالم البريطاني آلان تورينغ عام 1950، لقياس قدرة الآلة على "التفكير" عبر محاكاة المحادثة مع البشر.
فإذا فشل الشخص في التمييز بين الإنسان والآلة خلال المحادثة النصية، فإن الآلة تعتبر قد نجحت في "لعبة المحاكاة".
لكن مع تطور التكنولوجيا، بات هذا المعيار محل شك، إذ يرى نقّاد أن الاختبار بات يقيس قدرتنا على تصديق المحاكاة أكثر من كونه مقياساً دقيقاً للوعي أو الذكاء الحقيقي.
محاكاة أم ذكاء؟ورغم الإنجاز التقني اللافت، يبقى السؤال الأهم مطروحاً: هل هذه النماذج "تفكر" حقاً؟، أم أنها فقط تحاكي السلوك البشري ببراعة، بفضل قواعد بيانات ضخمة ونماذج مطابقة أنماط معقدة؟
الدراسة تُظهر أن الذكاء الاصطناعي بات يقترب من اجتياز واحد من أقدم تحديات الفكر البشري، لكنها في الوقت ذاته تُسلّط الضوء على حدود هذا الإنجاز، وتعيد طرح الأسئلة الفلسفية الكبرى حول طبيعة "الذكاء" و"الوعي".
وسيبرز السؤال، هل تُقنعنا روبوتات الدردشة البليغة بسهولة بالغة، أم أن نماذج الذكاء الاصطناعي قد تجاوزت بالفعل عتبةً مُميزة من التفكير الحسابي؟.
خلاصةبينما يُواصل الذكاء الاصطناعي تقدمه بخطى متسارعة، يبدو أن اجتياز اختبار تورينغ لم يعد مجرد إنجاز تقني، بل أصبح مرآة تعكس قدرتنا كبشر على التفاعل مع آلة تتحدث لغتنا، بل وتُجيد خداعنا أحياناً.
المصدر: موقع 24
كلمات دلالية: حرب ترامب التجارية وقف الأب عام المجتمع اتفاق غزة إيران وإسرائيل غزة وإسرائيل الإمارات الحرب الأوكرانية تكنولوجيا الذكاء الاصطناعي الذکاء الاصطناعی
إقرأ أيضاً:
كيف ننتج ملخصات الأخبار باستخدام الذكاء الاصطناعي؟
يبدو أن النقاش بشأن استخدام أدوات الذكاء الاصطناعي في إنتاج محتوى إعلامي سيظل مستمرا، وسنسمع كل يوم أشياء جديدة بشأنه.
فقد أعلنت 3 مؤسسات إعلامية أميركية بارزة مؤخرا أنها تستخدم أدوات الذكاء الاصطناعي في إنتاج ملخصات لكثير من المواد التي تنشرها، والمؤسسات المشار إليها هي: وول ستريت جورنال، وبلومبيرغ، وياهو نيوز.
اقرأ أيضا list of 2 itemslist 1 of 2كيف تكتب عن فلسطين؟ دليل "ساخر" للسلوك الإعلامي "المريح"list 2 of 2كيف يغير الذكاء الاصطناعي بيئة العمل الصحفي؟end of listومما تجدر الإشارة إليه أن ملخصات الأخبار، التي يسميها البعض النقاط الرئيسية أو الموجزة، والتي تلخص أهم ما في الأخبار والموضوعات الصحفية آخذة في مزيد من الظهور على المواقع الإخبارية.
وقد نشرت سارة ساير نائبة رئيس تحرير مختبر نيمان مؤخرا مقالا في موقع مختبر نيمان للصحافة تناول هذه التجربة بالشرح والتوضيح، ويبدو أن المقال حصيلة لنقاش مع 3 من مسؤولي هذه المؤسسات، وتحقيقا للفائدة نحاول أن نتعرف في النقاط التالية على أهم ما جاء فيه.
ومع تطور التكنولوجيا -خاصة الذكاء الاصطناعي- التي تساعد في إنتاج هذه الملخصات اضطرت العديد من غرف الأخبار إلى تبنيها والتكيف معها، ولم تكن النتائج دائما مثالية أو مضمونة. ولكن بالرغم من ذلك لجأت وول ستريت جورنال، وبلومبيرغ، وياهو نيوز، وهي مؤسسات إخبارية رائدة، إلى استخدام تكنولوجيا الذكاء الاصطناعي في إنتاج ملخصات سهلة القراءة.
إعلانوتقول سارة ساير أنها سمعت بعض الشائعات التي تُفيد بأن هذا النوع من "النقاط الرئيسية" يمكن أن يساعد في إبراز الأخبار والموضوعات الصحفية على غوغل ومحركات البحث الأخرى. ويرد إد هايات، مدير تحسين محركات البحث في غرفة الأخبار في وول ستريت جورنال، بأن هذا الكلام ربما يكون صحيحا.
ويضيف: "ليس لدينا دليل قوي يُشير إلى أن الملخصات أو النقاط الرئيسية تُساعد في البحث، ولكنها بالتأكيد تُساعد بطريقة ما.. فعادة ما يكون النص مُحسنا في بداية الخبر، وهو أمر رائع لكل من الزوار و"غوغل بوت" لفهم محتوى الخبر بسرعة".
وتنظر المؤسسات الإخبارية، التي أطلقت ملخصات منتجة بواسطة الذكاء الاصطناعي، إلى هذه الميزة كخدمة مخصصة للقراء المُنشغلين، وتقول إنها تلاحظ نتائج إيجابية تحفزها على مواصلة التجارب في هذا الشأن.
طوّرت منصة ياهو نيوز، وهي منصة لتجميع الأخبار، ميزة "الخلاصات الرئيسية" لبعض المقالات على موقعها. وتهدف هذه الخلاصات إلى تلخيص المقال، بالإضافة إلى حثّ القراء على قراءته كاملا. وعلى عكس الملخصات الأخرى، فإن الخلاصات الرئيسية على ياهو نيوز متاحة للمشتركين.
وقد أطلقت ياهو نيوز ميزة "أهم النقاط" في عام 2024، حيث أعادت إطلاق تطبيقها بالكامل ليضم مجموعة كاملة من الميزات المدعومة بالذكاء الاصطناعي.
وتقول كات داونز مولدر، المديرة العامة لياهو نيوز إن الاستحواذ على تطبيق "آرتفاكت" "Artifact" سهّل وبشكل كبير عملية تطوير أدوات الذكاء الاصطناعي في غرفة الأخبار.
وأضافت أن ميزة أهم النقاط لدى ياهو نيوز تهدف إلى تسهيل تجربة القراءة لمستخدمي المنصة، وليست بديلا عن قراءة المقال بالكامل.
وأشارت إلى أن "الملخصات صُممت بهدف استخراج المعلومات من المقال نفسه، بدلا من جلب معلومات من الإنترنت، لأن هذا يُقلل بشكل كبير من احتمالية ظهور الأخطاء أو عدم دقة الملخصات".
إعلانوأكدت أن تطبيق "أهم النقاط" خضع لعدة جولات من الاختبارات المكثفة قبل إطلاقه، مع الطلب من الزوار الإبلاغ عن الملخصات التي يجدونها غير مفيدة.
وأوضحت أن المنصة تجري عمليات ضبط الجودة بطرق متعددة، بما في ذلك المراجعة البشرية، وأن الزوار عادة ما يُقيّمون الملخصات على أنها دقيقة. ويبدو أنهم يستجيبون جيدا للتطبيق المُعاد إطلاقه وميزاته المُدعمة بالذكاء الاصطناعي. وأشارت إلى أن تفاعل المستخدمين زاد بنسبة 50%، وارتفع الوقت الذي يقضيه المستخدم بنسبة 165% منذ إعادة الإطلاق.
واختتمت بأنهم في ياهو نيوز "حريصون دائما على ضمان أن يحسن الذكاء الاصطناعي تجربة المستخدم، وحريصون كذلك على دمج المراجعة البشرية مع الذكاء الاصطناعي".
The new Yahoo News app is here. Finally, news curation that feels like magic with spot-on personalization and free access to premium news sources. Plus new features:
????Key takeaways on articles
????Flag to rewrite clickbait headlines
????Reading streaks and badges
Download now ????… pic.twitter.com/SztGykQJYy
— Yahoo News (@YahooNews) June 13, 2024
وول ستريت جورنال: التدخل البشري مهمتشدد صحيفة وول ستريت جورنال على ضرورة وجود مُشاركة بشرية في إنتاج ملخصات الأخبار عبر الذكاء الاصطناعي وتنظر إليه باعتباره أمرا بالغ الأهمية.
ففي وول ستريت جورنال، تُقدم الملخصات المُولّدة بالذكاء الاصطناعي على شكل 3 نقاط تُسمى "النقاط الرئيسية". وتقول تيس جيفرز، مديرة بيانات غرفة الأخبار والذكاء الاصطناعي في الصحيفة الأميركية البارزة، إن جوهر رسالتنا لجمهورنا مبني على الثقة والشفافية، بحيث يجري شرح بسيط لكل ملخص مُولّد بواسطة الذكاء الاصطناعي للزوار.
ويتبع ذلك الإشارة بالعبارات التالية: أنشأت أداة ذكاء اصطناعي هذا الملخص، الذي استند إلى نص المقال، وراجعه محرر.
إعلانوقد بدأت وول ستريت جورنال العمل على إنتاج الملخصات عن طريق الذكاء الاصطناعي في أوائل عام 2024.
وبحسب جيفرز، فقد كان هذا العمل في البداية مصمما لمنتج يستهدف عملاء الشركات الذين يرغبون في الحصول على معلومات رئيسية دون الحاجة إلى قراءة نص المقال كاملا. "ولكن بمجرد دمج سير عمل الذكاء الاصطناعي في نظام إدارة المحتوى، أصبح بإمكاننا الاستفادة من الملخصات في أماكن أخرى".
وقبل البدء بنشر الملخصات على الموقع، عملت غرفة الأخبار في الصحيفة مع فرق التقنية والمنتجات لصياغة محفز يُنتج ملخصات عالية الجودة، وقيّمت دقة الملخصات.
بعد ذلك، عُرضت النقاط الرئيسية -المُنتجة بواسطة غوغل جيميني- على مجموعة عشوائية من المستخدمين، وركزت الصحيفة بدقة على سؤالين: هل أثرت النقاط الرئيسية على تفاعل المشتركين مع خدماتها الصحفية (عدد المقالات المقروءة لكل جلسة، أو مدة الجلسة، أو المدة المُستغرقة في قراءة مقال يحتوي على نقاط رئيسية)؟ وبعد الاختبارات، بدأت الصحيفة بتضمين الملخصات في جميع المقالات الإخبارية الأساسية.
وتقول إدارة الصحيفة إن أداة التلخيص مدمجة مباشرة في نظام إدارة المحتوى الخاص بها، وبمجرد إنشاء الملخصات، فإنها تخضع لنفس نظام سير عمل القصة نفسها، حيث تقوم غرفة الأخبار بمراجعتها للتأكد من دقتها ووضوحها وأسلوبها.
ووفقا لما ذكرته مديرة بيانات غرفة الأخبار والذكاء الاصطناعي في وول ستريت: فإن دمج أو إزالة النقاط الرئيسية المنتجة بواسطة أدوات الذكاء الاصطناعي في مقالة ما يعود في نهاية المطاف لتقدير محرر تلك المقالة.
وتضيف جيفرز أن "دمج النقاط الرئيسية يعطي أفضل النتائج في قصصنا الإخبارية الأساسية حيث تكون الحقائق واضحة".
إعلانوأشارت إلى أن تقنية الذكاء الاصطناعي الأساسية في تطور مستمر، مما يتطلب تحديثات منتظمة لنموذج الذكاء الاصطناعي المستخدم.
وأضافت أن "أحد الدروس المستفادة هو أن هذه التقنية تتطلب عناية ومراجعة دورية.. تقنية الذكاء الاصطناعي التوليدي في تغير مستمر، مما يعني أنه يجب علينا أيضا أن نكون مستعدين للتطوير المستمر.
ووضحت أن "من الدروس المستفادة أيضا أنه في ظل الوضع الراهن للتكنولوجيا، يُعدّ وجود فريق بشري مُدرب أمرا بالغ الأهمية. ورغم سعادتنا بانخفاض معدلات الأخطاء، فإنها ليست معدومة. وكما لاحظ ناشرون آخرون، حتى هذا المعدل المنخفض من الأخطاء قد يؤدي إلى عدد من الأخطاء القابلة للتصحيح".
ووصفت جيفرز الذكاء الاصطناعي التوليدي بأنه "يُحدث نقلة نوعية في المساعدة على توسيع نطاق أعمالنا في مجال الأخبار وتأثيرها"، على وجه الخصوص.
تسمي بلومبيرغ الملخصات المنتجة بأدوات الذكاء الاصطناعي على موقعها "الخلاصات" وهي تكون مع الموضوعات الطويلة نوعا ما.
وقد بدأت بلومبيرغ باختبار الملخصات المنتجة بأدوات الذكاء الاصطناعي في نهاية عام 2024، ثم عممت استخدامها على نطاق أوسع في بداية هذا العام. وتُستخدم هذه الملخصات في عدد محدود ولكنه متزايد من التقارير، كما تُقدمها بلومبيرغ في المقالات المطولة، وتخطط لإدراجها في مقالات الرأي مستقبلا.
ووصف كريس كولينز، كبير مسؤولي المنتجات في قسم الأخبار في بلومبيرغ، هذه الملخصات بأنها "نظرة سريعة وواضحة". وأشار إلى أن بلومبيرغ "تنشر آلاف القصص يوميا.. وخاصة في هذا الوقت المزدحم بالأخبار، ويُخبرنا الزوار برغبتهم في مواكبة الأحداث والاطلاع بسرعة على المعلومات المهمة".
إعلانوأضاف: أن هذه الملخصات صُممت لتعزيز تجربة القراءة، وهي ليست بديلا عن العمق والسياق والتحليل الذي يقدمه مراسلو بلومبيرغ.
وأكد كولينز أن تعليقات الزوار -سواء في التعليقات الموجهة لبلومبيرغ أو ما اطلعت عليه غرفة الأخبار من بيانات الجمهور- كانت إيجابية للغاية.
ويشدد كولينز بشكل خاص على الملخصات المتعلقة بالأخبار سريعة التطور، فمن خلال هذا النوع من الملخصات، تحاول بلومبيرغ مساعدة الزوار على مواكبة آخر الأخبار، وضرب مثلا بتغطيتهم لموضوع الرسوم الجمركية التي أعلنها الرئيس الأميركي دونالد ترامب، موضحا أنها حظيت بتغطية إعلامية واسعة مؤخرا، حيث ساعدت الملخصات الزوار على البقاء على اطلاع دائم.
واختتم كولينز حديثه بفقرة عن الدروس المستفادة من التجربة. حيث قال: "من المهم أن تبدأ بفهم عميق لجمهورك، واحتياجاته من المحتوى والتجربة بشكل عام.. وليكن استخدام الذكاء الاصطناعي لتحسين تجربة المستخدم، وليس فقط لإدخال تقنية جديدة.. وتأكد من أن الملخصات ليست بديلا عن الصحافة، ولا يمكن أن توجد بدونها".
———————————————————————————————————————–
مشرف غرفة الأخبار بالجزيرة نت، ومدرب الصحافة الرقمية في معهد الجزيرة للإعلام.