ذكاء اصطناعي بلا تركيز.. روبوتات المحادثة تفتقد الدقة عند الإيجاز
تاريخ النشر: 9th, May 2025 GMT
كشفت دراسة جديدة أجرتها شركة Giskard الفرنسية، المتخصصة في اختبار أنظمة الذكاء الاصطناعي، أن طلب إجابات قصيرة من روبوتات المحادثة مثل ChatGPT قد يؤدي إلى زيادة احتمالات الهلوسة أي تقديم معلومات غير صحيحة أو مختلقة.
وذكرت الشركة في منشور عبر مدونتها، أن الإيجاز في الإجابة، خاصة عند التعامل مع مواضيع غامضة أو أسئلة مبنية على افتراضات خاطئة، قد يقلل من دقة النموذج، وفقا لـ"techcrunch".
أكد الباحثون أن تغييرا بسيطا في تعليمات النظام، مثل “كن موجزا”، قد يكون له تأثير كبير على ميل النموذج لتوليد معلومات غير دقيقة.
وقالت الدراسة: "تشير بياناتنا إلى أن التعليمات المباشرة للنظام تؤثر بشكل كبير على ميل النموذج للهلوسة، هذا الاكتشاف له تبعات مهمة عند نشر النماذج في التطبيقات الفعلية، حيث يفضل الإيجاز غالبا لتقليل استهلاك البيانات، وتحسين سرعة الاستجابة، وخفض التكاليف".
تكمن المشكلة بحسب Giskard، في أن النماذج تحتاج إلى "مساحة نصية" كافية لتفنيد الافتراضات الخاطئة أو التوضيح عند وجود معلومات مضللة، وهو ما لا يتوفر عند إجبارها على تقديم إجابات قصيرة، وبالتالي، تميل النماذج إلى اختيار الإيجاز على حساب الدقة.
وتطرقت الدراسة أيضا إلى أن النماذج تكون أقل ميلا لتفنيد الادعاءات المثيرة للجدل عندما تطرح بثقة من قبل المستخدم، كما أن النماذج التي يفضلها المستخدمون ليست دائما الأكثر صدقا.
وأشار الباحثون إلى وجود تناقض متزايد بين تحسين تجربة المستخدم والحفاظ على الدقة المعلوماتية، خصوصا عندما تتضمن استفسارات المستخدمين مغالطات أو معلومات خاطئة.
وتشمل النماذج المتأثرة بهذه الظاهرة: GPT-4o من OpenAI المستخدم حاليا في ChatGPT، إلى جانب نماذج أخرى مثل Mistral Large وClaude 3.7 Sonnet من شركة Anthropic، والتي أظهرت جميعها انخفاضا في الموثوقية عند مطالبتها بإجابات موجزة.
المصدر: صدى البلد
كلمات دلالية: الذكاء الاصطناعي هلوسة معلومات مضللة
إقرأ أيضاً:
هل تتغيّر كتب المدارس قريبا؟ أورانوس ونبتون قد يكونان كوكبين صخريين
لأكثر من نصف قرن، اعتدنا وضع أورانوس ونبتون في خانة واحدة، وهي "العمالقة الجليدية"، فهما ليسا مثل المشتري وزحل (غازيان بالأساس)، بل أغنى بالجليد، أي المواد المتطايرة مثل الماء والأمونيا والميثان في أعماق شديدة الضغط.
لكن دراسة جديدة في دورية "أسترونومي آند أستروفيزيكس" تقترح أن هذا التقسيم قد يكون مبسّطا أكثر من اللازم، فربما يحتوي الكوكبان على صخور أكثر وجليد أقل مما تفترضه الصورة التقليدية.
الدراسة لا تقول إن أورانوس ونبتون صخريان قطعا، لكنها تقول شيئا أكثر إزعاجا للعلماء، وهو أن المعطيات الحالية تسمح بأكثر من تفسير داخلي، وليس من حقنا أن نغلق الاحتمالات مبكرا.
ما يحدث داخل الكواكب العملاقة يظل لغزا، لأننا لا نستطيع رؤيته مباشرة. فلا توجد وسيلة تنظر إلى قلب أورانوس أو نبتون. لذلك يعتمد العلماء على أدلة غير مباشرة يمكن قياسها من بعيد، مثل كتلة الكوكب ونصف قطره، وخصوصا تفاصيل مجال جاذبيته. فاختلافات الجاذبية من مكان لآخر تكشف، بطريقة غير مباشرة، كيف تتوزع الكتلة في الداخل: هل هي مركزة في المركز أم موزعة في طبقات واسعة.
لكن النماذج القديمة التي تحاول رسم خريطة داخلية للكوكب كثيرًا ما تقع في فخّين، الفخ الأول هو النماذج الفيزيائية المثقلة بالافتراضات، حيث تبدأ بتقسيم جاهز للداخل يتضمن قلبا صخريا تليه طبقة جليدية يليه غلاف غازي، مثلا وبنِسب محددة مسبقا، ثم تحاول ضبط الحسابات لتناسب تلك الصورة.
أما الفخ الثاني فهو النماذج التجريبية المبسطة جدًا. هذه النماذج تكون مرنة في الشكل، لكنها قد تهمل أو تبسط سلوك المواد تحت الضغوط والحرارة الهائلين داخل هذه الكواكب.
في تلك الظروف تتغير خصائص الماء والغازات والمعادن بطرق غير مألوفة، وإذا لم يلتقط النموذج هذه الفيزياء بدقة فقد يصل إلى استنتاجات سهلة لكنها غير واقعية.
إعلان خوارزمية جديدةالحل الذي تقترحه الدراسة الجديدة هو طريقة هجينة تحاول الجمع بين المرونة والدقة. بدلا من فرض طبقات جاهزة، يبدؤون بـتوزيع كثافة ابتدائي عشوائي لداخل الكوكب (أي خريطة أولية تقول أين الكثافة أعلى وأين أقل)، دون أن يقرروا مسبقا هل هذه المنطقة صخر أم ماء أم غاز.
بعد ذلك يحسبون مجال الجاذبية المتوقع لهذا التوزيع، ويقارنونه بما رصدته القياسات فعلا. ثم يعدّلون توزيع الكثافة ويعيدون الحساب مرة بعد مرة، إلى أن يحصلوا على نماذج تطابق الرصد وفي الوقت نفسه تكون متسقة مع فيزياء المواد.
والنتيجة، بحسب الدراسة، ليست نموذجا واحدا قاطعا، بل مجموعة نماذج غير متحيزة تُظهر مدى الاحتمالات الواقعية لتركيب الداخل.
عندما تركت الخوارزمية مساحة للواقع بدلا من القوالب المسبقة، ظهرت مفاجئة، فالنماذج المقبولة لداخل أورانوس ونبتون تمتد من سيناريوهات غنية بالماء إلى سيناريوهات غنية بالصخور.
هذه السعة في الاحتمالات وحدها تقول إن وصف عملاق جليدي قد لا يكون إجابة علمية دقيقة بقدر ما هو تصنيف تعليمي مبسّط، لأنه يوحي بأن الداخل معروف ومهيمن عليه الجليد، بينما الواقع أن التركيب الداخلي ما زال مفتوحا على أكثر من سيناريو متوافق مع الرصد.