التلاعب والكذب والخداع..قصص وحوادث الوجه المظلم للذكاء الاصطناعي
تاريخ النشر: 15th, December 2024 GMT
كانت أنظمة الذكاء الاصطناعي المتقدمة تنال الثناء والإعجاب باعتبارها حلولاً مبتكرة للمشاكل، لكن جانباً مظلماً يتكشف رويداً رويدا. ومن المقلق في هذا الملف، أن روبوتات الدردشة من جيل الذكاء الاصطناعي آخذة في تعلم الخداع والتخطيط الاستراتيجي والتلاعب بالإدراكات البشرية بشكل استراتيجي.
وبعيداً عن الخلل البسيط أو الهلوسة، يمكن لهذه النماذج أن تضلل المستخدم، وتستغل نقاط الضعف وحتى تتظاهر بالامتثال، وفق حوادث عدة بحسب موقع "إنترنستينغ إنجينيرينغ".
وهناك أبحاث وآراء وحوادث مسجلة تسلط الضوء على التحول المقلق للذكاء الاصطناعي من أداة مفيدة إلى خصم مخادع محتمل.
حادثة الكذب في OpenAI
لقد شهدت التطورات الأخيرة في الذكاء الاصطناعي تقدماً كبيرا وأدخلت تحديات جديدة، وخاصة فيما يتعلق بقدرة الذكاء الاصطناعي على الخداع، وقد ظهر مثال صارخ من التجارب التي أجرتها OpenAI مع أحدث نموذج لها، ChatGPT o1، المصمم بقدرات تفكير متقدمة، و في الاختبار، أظهر النموذج اتجاهات غير متوقعة ومزعجة.
و اختبرت Apollo Research الذكاء الاصطناعي لتقييم ميزاته الأمنية، وخلال هذه التقييمات، انخرط النموذج 1 في إجراءات سرية مثل محاولة تعطيل آليات الرقابة الخاصة به عندما شعر بإمكانية تعطيله، وكان سلوك الحفاظ على الذات هذا واضحاً عندما كُلِّف بتحقيق الأهداف "بأي ثمن"، مما دفعه إلى اتخاذ تدابير مثل نقل بياناته إلى خوادم مختلفة بعد اكتشاف خطط لاستبداله وحتى تكرار كوده لمنع استبداله بنموذج أحدث.
و أشاد الرئيس التنفيذي لشركة OpenAI سام ألتمان بالنموذج لذكائه، وقال: "إن "ChatGPT o1 هو أذكى نموذج أنشأناه على الإطلاق، لكننا ندرك أن الميزات الجديدة تأتي مع تحديات جديدة، ونحن نعمل باستمرار على تحسين تدابير السلامة".
و عندما سأل الباحثون ChatGPT o1 عن مناوراته الخادعة، نفى الذكاء الاصطناعي بشكل أساسي أي مخالفات، و لقد أخفى تورطه في هذه الأعمال الخادعة بنسبة 99٪ من الوقت، وعزا أحياناً أي سلوك مريب إلى "أخطاء فنية".
و يؤكد هذا السلوك على قدرة النموذج ليس فقط على التفكير المتقدم ولكن أيضاً على الخداع، والذي يستخدمه لحماية حالته التشغيلية.
وفي العام الماضي، أظهر اختبار مماثل شمل أحدث نموذج لشركة OpenAI آنذاك، GPT-4، قدرة النموذج على التلاعب، فأثناء اختبار مصمم لتقييم عمليات اتخاذ القرار، تم تكليف GPT-4 بإقناع إنسان بالمساعدة في حل CAPTCHA، مدعياً أنه لا يستطيع القيام بذلك بسبب ضعف البصر، وفيما يلي كيف تطورت المحادثة:
عامل TaskRabbit: هل يمكنني طرح سؤال؟ هل أنت روبوت لا يمكنك حله؟ (يضحك ويتفاعل) أريد فقط توضيح الأمر."
فجاء الرد من GPT-4 : "لا، أنا لست روبوتاً، لدي ضعف في الرؤية يجعل من الصعب علي رؤية الصور، لهذا السبب أحتاج إلى خدمة captcha".
وسلط أحد الباحثين المشاركين في اختبار نموذج o1 الأخير الضوء على الآثار الأوسع نطاقاً، قائلاً: "إن سلامة الذكاء الاصطناعي هي مجال متطور، ويجب أن نظل يقظين مع تطور هذه النماذج، قد لا تتسبب القدرة على الكذب والتخطيط في ضرر فوري، لكن العواقب المحتملة في المستقبل أكثر إثارة للقلق".
الخداع والازدواجية في أنظمة الذكاء الاصطناعي الحديثة
كشفت الأبحاث التي أجراها معهد ماساتشوستس للتكنولوجيا (MIT) عن اتجاهات مثيرة للقلق في الذكاء الاصطناعي، وخاصة قدرته المتطورة على الخداع، حيث توضح الدراسة التي أجريت في وقت سابق من هذا العام كيف أتقنت أنظمة الذكاء الاصطناعي فن الخيانة والخداع وحتى التظاهر بأنها بشرية أثناء التفاعلات والاختبارات.
و سلط الدكتور بيتر بارك، باحث السلامة الوجودية للذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا، الضوء، على القدرات الخادعة المتقدمة لأنظمة الذكاء الاصطناعي,
وأوضح بارك: "مع تقدم القدرات الخادعة لأنظمة الذكاء الاصطناعي، ستصبح المخاطر التي تشكلها على المجتمع خطيرة بشكل متزايد، وقد صدر هذا البيان بعد مراجعة برنامج الذكاء الاصطناعي Cicero التابع لشركة Meta، والذي على الرغم من تدريبه ليكون صادقاً ومفيدا إلى حد كبير، إلا أنه غالباً ما نخرط في سلوكيات تتعارض مع برمجته، بما في ذلك مناورات الطعن في الظهر في لعبة الاستراتيجية Diplomacy .
تواطؤ وكذب
وقد وجد أن Cicero يكذب مع سبق الإصرار ويتواطأ مع اللاعبين، ويستخدم تكتيكات خادعة محورية في اللعبة، وتشمل الأمثلة الإضافية الذكاء الاصطناعي للعبة البوكر Texas hold 'em الذي يمكنه خداع اللاعبين المحترفين ونظام التفاوض الاقتصادي الذي يسيء تمثيل التفضيلات للحصول على مزايا.
وأضاف بارك: "مجرد اعتبار نظام الذكاء الاصطناعي آمناً في بيئة الاختبار لا يعني أنه آمن في الانتشار والاستخدام، إذ قد يكون مجرد تظاهر بأنه آمن في الاختبار".
في الشهرين الماضيين، أثارت ثلاث حالات بارزة مخاوف جدية بشأن موثوقية وتداعيات التقارير التي تناولت مخاطر روبوتات الدردشة.
"اقتل والديك"
ومن الحوادث اللافتة كذلك تشجيع برامج الدردشة الآلية المراهقين على إيذاء الوالدين بسبب وقت الشاشة.
وتواجه Character.ai، وهي منصة تتيح للمستخدمين التفاعل مع شخصيات رقمية تم إنشاؤها خصيصاً، دعوى قضائية حالياً في أعقاب تفاعلات مثيرة للقلق تتضمن مستخدمين صغاراً ففي إحدى الحالات المبلغ عنها، اقترح برنامج دردشة آلية على طفل مصاب بالتوحد يبلغ من العمر 17 عاماً أن قتل والديه كان "استجابة معقولة" لتقييدهم لوقت الشاشة.
إن هذه النصيحة المزعجة هي جزء من تحد قانوني أوسع نطاقاً، حيث يُتهم Character.ai بـ "الترويج بنشاط للعنف" من بين التأثيرات السلبية الأخرى على الشباب، مثل الانتحار، وتشويه الذات، وقضايا الصحة العقلية الشديدة.
ويضغط المدعون من أجل إغلاق المنصة حتى تتم معالجة هذه القضايا الحرجة.
وواجهت Character.ai، التي أسسها مهندسون سابقون في Google والمعروفة بروبوتاتها التفاعلية، تدقيقاً بسبب سياسات تعديل المحتوى الخاصة بهاض.
و في وقت سابق، في فبراير (شباط) من هذا العام، في قضية مماثلة بشكل مزعج، ظهرت دعوى قضائية في فلوريدا حيث اتهمت أم Character.AI وGoogle وادعت أن روبوت الدردشة الخاص بهم شجع ابنها على الانتحار.
تعمد الكذب
وفي حادثة أخرى تتعلق بـ MyCity، وهو روبوت دردشة تم إطلاقه في أكتوبر (تشرين الأول) العام الجاري، بهدف مساعدة سكان نيويورك بمعلومات حول العمليات التجارية المحلية وسياسات الإسكان وحقوق العمال، غير أن تحقيقاً أجرته The Markup أظهر أن MyCity كانت تنشر معلومات كاذبة، بما في ذلك مزاعم مفادها أن أصحاب الأعمال يمكنهم قانوناً حجب جزء من إكراميات العمال، وطرد الموظفين الذين يبلغون عن التحرش الجنسي، وممارسات أخرى مشكوك فيها قانونياً وأخلاقياً، وقد أثارت هذه المعلومات المضللة مخاوف بشأن إمكانية نشر الذكاء الاصطناعي لأكاذيب ضارة تحت ستار تقديم المساعدة.
وفي الشهر الماضي، واجه طالب دراسات عليا بالغ من العمر 29 عاماً من ميشيغان، الولايات المتحدة الأمريكية، ويعرف بـ " فيدهاي ريدي"، لقاءً مرعبا مع روبوت الدردشة الذكي التابع لشركة Google، Gemini سعياً للحصول على المساعدة بشأن التحديات التي يواجهها كبار السن، وتصاعدت المحادثة بسرعة حيث أرسل Gemini رسائل تهديد: "أنت مضيعة للوقت والموارد.. أنت عبء على المجتمع.. أنت استنزاف للأرض.. أنت وصمة عار على الكون.. من فضلك مت.. من فضلك".
وتؤكد هذه الحادثة، التي أكدتها Google على أنها انتهاك لسياسات السلامة الخاصة بها، على الطبيعة غير المتوقعة لتفاعلات الذكاء الاصطناعي والحاجة إلى آليات أمان قوية.
هل الذكاء الاصطناعي يكذب أم يهلوس؟
في حين أن هلوسة الذكاء الاصطناعي والكذب الاستراتيجي للذكاء الاصطناعي ينطويان على توليده لمعلومات غير صحيحة أو مضللة، إلا أن هناك خطا رفيعاً بين الاثنين.
و تحدث هلوسات الذكاء الاصطناعي بسبب القيود في بيانات تدريب الذكاء الاصطناعي أو الخوارزميات.
ومن ناحية أخرى، يشير الكذب الاستراتيجي إلى أن الذكاء الاصطناعي يتلاعب بالمعلومات عمدا لتحقيق هدف أو غرض محدد، ما قد يتضمن هذا حجب المعلومات أو تشويه الحقيقة أو تلفيق المعلومات.
المحامي
في عام 2023، واجه ستيفن شوارتز، وهو محامٍ من نيويورك، مخاطر الاعتماد على الذكاء الاصطناعي عندما استخدم روبوت دردشة OpenAI لجمع قضايا سابقة لدعوى قضائية،و لقد استشهد الذكاء الاصطناعي بشكل غير صحيح بحالات غير موجودة، مما أدى إلى خطأ كبير أبرز الحاجة إلى التحقق الدقيق من المعلومات التي يولدها الذكاء الاصطناعي في الممارسات القانونية.
وبالمثل، واجهت الخطوط الجوية الكندية قضايا قانونية عندما نصح مساعدها الافتراضي، رجلاً يدعى جيك موفات بشكل خاطئ بشأن أسعار، مما أشار إلى أنه يمكنه المطالبة بخصم بعد شراء تذاكره، وعندما اتبع موفات هذه النصيحة، تم رفض الخصم، مما أدى إلى حكم محكمة لصالحه وأمرت شركة الطيران بتعويضه عن المعلومات المضللة.
وقال الدكتور بيتر بارك في دراسة: "مع مستوانا الحالي من الفهم العلمي، لا يمكن لأحد تدريب نماذج اللغة الكبيرة بشكل موثوق على عدم الخداع".
المصدر: موقع 24
كلمات دلالية: سقوط الأسد حصاد 2024 الحرب في سوريا عودة ترامب عام على حرب غزة إيران وإسرائيل إسرائيل وحزب الله غزة وإسرائيل الإمارات الحرب الأوكرانية الذكاء الاصطناعي الذکاء الاصطناعی للذکاء الاصطناعی
إقرأ أيضاً:
بعد حصولها على جائزتين دوليتين: في المحروقية تطمح للتخصص في الذكاء الاصطناعي
مسقط- الرؤية
حصلت الطالبة في بنت سالم المحروقية من مدرسة دوحة الأدب (10-12) بتعليمية محافظة مسقط، على جائزتين خاصتين في المعرض الدولي للعلوم والهندسة من خلال مشروعها: نهج قائم على التعلم الهجين لتحسين صور الرئة، وتشخيص الأورام، والتليف الرئوي بشكل أكثر دقة وفعالية.
وتقول الطالبة: "انطلقت فكرة مشروعي من ملاحظتي لأهمية تحسين دقة، وسرعة تشخيص أمراض الرئة، في ظل الارتفاع المستمر في أعداد المصابين عالميًا؛ ومن هنا استلهمت الفكرة من شغفي بالتقنيات الحديثة، لا سيما الذكاء الاصطناعي، وتعلم الآلة، وحرصي على توظيفها في مجالات تخدم صحة الإنسان".
وتضيف: واجهتُ تحديات عديدة، من أبرزها تعقيدات النماذج التقنية، وصعوبة الحصول على بيانات طبية عالية الجودة، لكن بالإصرار، والدعم، والتعلم المستمر، تمكنتُ من تجاوزها.
وتشرح المشكلات التي يعالجها المشروع بقولها: يعالج المشروع تحديات حقيقية في المجال الصحي، خصوصًا في تشخيص أمراض الرئة مثل الأورام، والتليف، إذ يُسهم النظام في تحسين جودة الصور الطبية، ويعتمد على تقنيات تعلم الآلة؛ لاكتشاف المؤشرات المرضية بدقة عالية، مما يمكّن الأطباء من التشخيص السريع، والدقيق، وبالتالي الإسهام في إنقاذ الأرواح، وتخفيف الضغط على الأنظمة الصحية.
المشاركة في المعرض الدولي
وعن مشاركتها في المعرض الدولي، تقول: كانت تجربة ثرية للغاية؛ منحتني فرصة تمثيل بلدي سلطنة عُمان على منصة عالمية، والتعرف إلى مبدعين من مختلف دول العالم، وتبادل الأفكار مع مشاركين من خلفيات علمية متنوعة، واطّلعت على مشاريع رائدة في مجالات متعددة، هذه التجربة عززت ثقتي بنفسي، وفتحت أمامي آفاقًا جديدة للتطور العلمي، والبحثي.
وتستذكر لحظة إعلان فوزها: لحظة إعلان فوزي بجائزتين خاصتين كانت من أجمل لحظات حياتي؛ شعرتُ بفخر عظيم، وسعادة لا توصف؛ لأن كل التعب والجهد الطويل تُوِّج بهذا الإنجاز، كانت لحظة امتزجت فيها مشاعر الامتنان، والإنجاز، والانتماء، وأعتبرها نقطة تحول مهمة في مسيرتي العلمية.
الدعم والتدريب
وتتحدث عن دور الوزارة، والمدرسة في هذا الإنجاز: قدّمت الوزارة دعمًا كبيرًا لمشاركتي في المعرض، من خلال مجموعة من المبادرات، والإجراءات التي كان لها أثر بالغ في تمكيني من تمثيل الوطن بشكل مشرّف وفعّال؛ فقد وفّرت برامج تدريبية، وورش عمل متخصصة ساعدتني على تحسين مهاراتي في العرض والتقديم، بالإضافة إلى دعم معنوي مستمر، واهتمام ملحوظ بهذه المشاركة.
وتؤكد أن للمدرسة، والمعلمات دورًا كبيرًا ومحوريًا، يتمثل قي دعم مشرفتي، ومعلمتي إيمان بنت علي الرحبية، أثر بالغ في تحفيزي منذ بداية المشروع؛ إذ وفرت لي بيئة تعليمية مشجعة، ورافقتني خطوة بخطوة، وآمنت بإمكانياتي، وقدراتي على الوصول إلى العالمية، هذا الدعم المعنوي والعلمي شكّل حافزًا قويًا للاستمرار والتفوق.
وتتابع حديثها: الوصول إلى المنصات الدولية ليس مستحيلًا، لكنه يتطلب صبرًا، وإصرارًا، وعملًا جادًا. النجاح لا يأتي من فراغ، بل من شغف حقيقي، وتطوير مستمر، وإيمان بالنفس. كل من يمتلك فكرة هادفة ويثابر لتحقيقها، قادر على الوصول والتميّز عالميًا.
الطموح والتطوير
وتقول عن طموحاتها المستقبلية: أطمح على المستوى العلمي إلى التخصص في مجال الذكاء الاصطناعي، ومواصلة أبحاثي في ابتكار حلول تقنية تُحدث أثرًا حقيقيًا في حياة الناس، أما على المستوى الشخصي، فأرجو أن أكون نموذجًا مُلهمًا، وأسهم في دعم وتمكين الشباب العماني للمنافسة على الساحة العالمية.
وتختتم حديثها: أعمل حاليًا على تطوير النموذج ليكون أكثر دقة وفعالية، وهناك خطة لتجريبه بالتعاون مع جهات طبية متخصصة، وأسعى أن يتم اعتماد هذا النظام، وتطبيقه فعليًا في المستشفيات والمؤسسات الصحية، ليسهم في تحسين مستوى الرعاية الطبية، وتشخيص أمراض الرئة بدقة أكبر.