ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
تاريخ النشر: 25th, April 2024 GMT
استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة، وفق روسيا اليوم.
ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.
وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.
وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.
وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.
وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.
ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.
وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.
وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.
المصدر: بوابة الوفد
كلمات دلالية: معهد ماساتشوستس للتكنولوجيا روبوتات الدردشة التعلم الآلی
إقرأ أيضاً:
ترامب يقلص المهلة التي منحها لبوتين لوقف الحرب
قال الرئيس الأميركي دونالد ترامب اليوم الاثنين إنه يعتزم تقصير الموعد النهائي الذي كان قد حدده لمدة 50 يوما للرئيس الروسي فلاديمير بوتين من أجل التوصل إلى اتفاق لإنهاء الحرب المستمرة منذ أكثر من ثلاث سنوات في أوكرانيا، وذلك بعدما واصلت روسيا قصف المدن الأوكرانية.
وقالت القوات الجوية الأوكرانية إن روسيا أطلقت خلال الليل أكثر من 300 طائرة مسيرة وأربعة صواريخ كروز وثلاثة صواريخ باليستية.
وكان ترامب قد قال قبل أسبوعين إنه سيفرض "رسوما جمركية قاسية" على روسيا إذا لم يتم التوصل إلى اتفاق سلام بحلول أوائل سبتمبر/أيلول، حيث أعرب عن استيائه من بوتين بسبب قصف المدن الأوكرانية وسط محاولات الرئيس الجمهوري لوقف القتال.
وقال ترامب إنه سيمنح بوتين 10 إلى 12 يوما اعتبارا من اليوم الاثنين، مما يعني أنه يريد أن تحقق جهود السلام تقدما بحلول 7 وحتى 9 أغسطس، وتتضمن الخطة عقوبات محتملة ورسوما جمركية ثانوية تستهدف شركاء روسيا التجاريين. وأشار إلى أن الإعلان الرسمي سيأتي في وقت لاحق اليوم الاثنين أو غدا الثلاثاء.
وعن الجدول الزمني الأقصر، قال ترامب "لا يوجد سبب للانتظار. نحن لا نرى أي تقدم".
وقال ترامب خلال زيارة إلى اسكتلندا إنه يتعين على بوتين أن "يبرم اتفاقا. الكثير من الناس يموتون".
ولم يصدر رد فوري من روسيا.
وكرر ترامب انتقاده لبوتين بسبب تحدثه عن إنهاء الحرب مع الاستمرار في قصف المدنيين الأوكرانيين. وقال "وأنا أقول، ليست هذه الطريقة للقيام بذلك. أنا أشعر بخيبة أمل من الرئيس بوتين".
وردا على سؤال في مؤتمر صحفي حول اجتماع محتمل مع الزعيم الروسي، قال ترامب: "لم أعد مهتما بالحديث".