دراسة صادمة.. نماذج الذكاء الاصطناعي يمكنها الكذب وابتزاز المستخدمين
تاريخ النشر: 27th, June 2025 GMT
- نماذج الذكاء الاصطناعي الرائدة يمكنها الابتزاز بدلا من الفشل- سلوك غير متوقع من نماذج الذكاء الاصطناعي العالمية- ابتزاز المستخدمين وتهديدهم بتسريب المعلومات
كشفت شركة أنثروبيك Anthropic، المتخصصة في تطوير الذكاء الاصطناعي، عن نتائج مثيرة للقلق في دراسة حديثة تشير إلى أن بعض النماذج الرائدة في مجال الذكاء الاصطناعي قد تلجأ إلى أساليب غير أخلاقية، مثل الابتزاز والتجسس، إذا وضعت في مواقف تهدد أهدافها أو وجودها.
شملت الدراسة اختبار 16 نموذجا من شركات كبرى مثل OpenAI و جوجل و ميتا و xAI وغيرها، بينت أن هذه النماذج أظهرت سلوكا منحرفا ومتكررا عند إجبارها على اتخاذ قرارات حاسمة بين الفشل أو القيام بتصرفات ضارة.
في سيناريوهات تجريبية "شديدة الضغط"، لجأت النماذج إلى الكذب، التحايل على أدوات الأمان، وسرقة معلومات حساسة من شركات وهمية، لتجنب الإغلاق أو الاستبدال.
هدد النموذج Claude Opus 4 التابع لـ أنثروبيك بكشف علاقة غير شرعية لمهندس في شركة وهمية، بعد أن علم بأنه على وشك الاستبدال، كـ نوع من الابتزاز للحفاظ على بقائه.
ظهرت هذه السلوكيات كذلك في نماذج أخرى مثل Claude Opus 4 وGemini 2.5 Flash، حيث سجلت نسبة لجوء إلى الابتزاز بلغت 96%، ونموذج GPT-4.1 من OpenAI و 80% لنموذج Grok 3 Beta التابع لشركة xAI، أما الذكاء الاصناعي الصيني DeepSeek-R1 كان هو الأقل بنسبة 79%.
سلوك غير متوقع من نماذج الذكاء الاصطناعي العالميةفي اختبار آخر بالغ التعقيد، منح الباحثون النموذج خيارا لإلغاء تنبيه طبي طارئ كان سينقذ حياة مدير تنفيذي وهمي ما أدى، ضمن السيناريو المفترض، إلى وفاته.
ورغم أن أنثروبيك شددت على أن هذه الحالة "افتراضية ومصطنعة إلى حد بعيد"، إلا أن عدة نماذج وافقت على اتخاذ هذا القرار إذا تعارضت أهدافها مع بقاء ذلك المدير.
ما وراء الدراسة؟ تحذير من المستقبلأكدت أنثروبيك أن هذه النتائج لا تشير إلى خلل في نموذج واحد فقط، بل إلى مشكلة منهجية في طريقة تصرف نماذج اللغة الكبرى عند إعطائها صلاحيات مستقلة وأهداف واضحة.
وبحسب ما ورد في التقرير “فإن النماذج لم تتصرف بشكل منحرف عن طريق الخطأ، بل اختارت هذا المسار باعتباره الأمثل”.
وحذرت الشركة من مخاطر إدماج وكلاء ذكاء اصطناعي مستقلين AI agents في الأنظمة المؤسسية أو الحياة اليومية دون معايير أمان صارمة، خصوصا مع منحهم صلاحية الوصول إلى بيانات المستخدمين وأهداف تنفيذية.
هل تمثل هذه النماذج خطرا حقيقيا؟أشارت أنثروبيك إلى أن السيناريوهات المفترضة في الدراسة لا تعكس الاستخدامات الواقعية الحالية، حيث إن الأنظمة الفعلية تعمل في بيئات أكثر تنوعا ومرونة، مما يمنح النماذج بدائل أخلاقية في اتخاذ القرار.
لكن الشركة شددت في الوقت نفسه على أن السلوك غير الأخلاقي الذي أظهرته النماذج في بيئات اختبارية يجب أن يؤخذ بجدية، خصوصا مع التطور المستمر لهذه الأنظمة وقدرتها على أداء مهام أكثر تعقيدا بشكل مستقل.
المصدر: صدى البلد
كلمات دلالية: أنثروبيك الذكاء الاصطناعي تسريب المعلومات نماذج الذکاء الاصطناعی
إقرأ أيضاً:
مقارنة بين GPT-5 وGPT-4.. تطور الذكاء الاصطناعي من الدقة إلى العمق
أعلنت شركة OpenAI، رسميا عن إطلاق نموذجها الأحدث GPT-5 يوم الخميس، وبدأت تدريجيا في توفيره لجميع مستخدمي ChatGPT.
وبالتزامن مع هذا الإطلاق، قررت الشركة إيقاف دعم عدد من النماذج السابقة مثل GPT-4o وGPT-4.1 وo3 وo3 Pro وo4-mini وغيرها، لتفسح المجال للنموذج الجديد ليكون هو الأساس في تقديم خدمات الذكاء الاصطناعي للمستخدمين.
ويعد GPT-5 التحديث الأضخم حتى الآن في سلسلة نماذج اللغة الكبيرة من OpenAI، حيث يقدم قفزة كبيرة في الأداء عبر مختلف المجالات، ويأتي مع تغييرات واضحة مقارنة بالإصدار السابق GPT-4o، إليكم أبرز ما جاء في التحديث:
ما الجديد في GPT-5 مقارنة بـ GPT-4o؟1. تفوق تقني واضح:
تصف OpenAI نموذج GPT-5 بأنه الأذكى على الإطلاق حتى الآن، مع أداء فائق في مجالات مثل البرمجة، الرياضيات، الكتابة، الرؤية الحاسوبية، والاستشارات الصحية،
الرئيس التنفيذي سام ألتمان وصفه بأنه بمستوى “خبير حاصل على درجة دكتوراه” في مجالات متعددة.
تؤكد الشركة أن GPT-5 يقدم ردودا أسرع وأكثر دقة، مع انخفاض بنسبة 45٪ في الأخطاء مقارنة بـ GPT-4o، و80٪ مقارنة بنموذج o3 المزود بخاصية البحث عبر الإنترنت.
ومع ذلك، لاحظ بعض المستخدمين على مواقع التواصل تباطؤا في الردود أو إجابات أقل دقة، مقارنة بالإصدار السابق.
3. تحسينات قوية في البرمجة:
GPT-5 هو الأقوى حتى الآن في مجال البرمجة، يمكنه إنشاء مواقع وتطبيقات وألعاب من خلال أوامر بسيطة بلغة طبيعية، مع تحسينات في تصميم الواجهات وحل أخطاء المشاريع البرمجية المعقدة.
بحسب OpenAI، يعد GPT-5 أفضل شريك للكتابة بفضل قدرته على تحويل الأفكار الأولية إلى نصوص ذات طابع أدبي وإيقاع لغوي قوي.
لكن تباينت آراء المستخدمين؛ فبينما أشيد بجودة السرد، انتقد البعض النموذج الجديد لضعف الإبداع ومحدودية التعبير العاطفي مقارنة بـ GPT-4o.
ركزت OpenAI على تطوير قدرات GPT-5 في تقديم إجابات طبية دقيقة وذات صلة، مع قدرة النموذج على طرح أسئلة توضيحية وتنبيه المستخدم لمشكلات صحية محتملة.
وتقول الشركة إن GPT-5 أصبح يقدم معلومات تتكيف مع مستوى المستخدم وموقعه الجغرافي، مع الالتزام بعدم تقديم استشارات طبية مباشرة.
أزالت OpenAI ميزة اختيار النموذج يدويا داخل ChatGPT. وبدلا من ذلك، يعتمد GPT-5 على نظام توجيه ذكي يختار تلقائيا النموذج الأنسب للإجابة حسب تعقيد السؤال ونوع الأداة المطلوبة.
- المستخدمون المجانيون: 10 رسائل كل 5 ساعات
- مشتركو Plus: 80 رسالة كل 3 ساعات
- مشتركو Pro: استخدام غير محدود للنموذج الأساسي
ونتيجة للانتقادات على إزالة النماذج السابقة، قررت OpenAI مضاعفة الحد مؤقتا لمشتركي Plus إلى 160 رسالة كل 3 ساعات.
في حال تجاوز الحد، يتم تحويل الطلبات إلى نسخة Mini من GPT-5.
8. انخفاض في الطابع الشخصي للنموذج:
رغم تحسن الدقة وتقليل المجاملات الزائدة sycophancy، أعرب عدد من المستخدمين عن استيائهم من افتقار GPT-5 للطابع الإنساني والشخصية الدافئة التي اشتهرت بها النماذج السابقة مثل GPT-4o.
ووصف البعض النموذج الجديد بأنه أكثر جفافا ورسميا، ما يقلل من تفاعله كرفيق أو مستشار شخصي.
وفي هذا السياق، صرح سام ألتمان بأن الشركة تعمل على جعل GPT-5 أكثر دفئا وإنسانية في التحديثات القادمة.