"الخرف الرقمي".. نتائج تقلب الموازين حول قدرات الذكاء الاصطناعي
تاريخ النشر: 19th, December 2024 GMT
في الوقت الذي يتحدث فيه خبراء التكنولوجيا وصناعها عن القدرات الهائلة لنماذج الذكاء الاصطناعي، لا سيما برامج الدردشة الآلية وإمكانية إحلالها محل الأطباء البشريين في القريب العاجل، أظهرت دراسة حديثة اتجاهاً مُخالفاً كلياً حولها، وضعفاً إدراكياً مشابهاً لأعراض "الخرف المُبكر/ الشيخوخة" لدى البشر.
في هذا الشأن، يشير اختبار "MoCA" المُستخدم على نماذج الذكاء الاصطناعي، وتحديداً المتعلقة باللغة الكبيرة "LLMs" إلى كفاءة ملحوظة لديها في مجالات معرفية عدة، في المقابل توضح عجزاً ملحوظاً في المهام التي تتطلب مهارات ووظائف بصرية وتنفيذية.
وعن اختبار "MoCA" فهو يُستخدم على نطاق واسع للكشف عن ضعف الإدراك والعلامات المبكرة للخرف، عادةً لدى كبار السن.
أهم ابتكارات الذكاء الاصطناعي في الصحة عام 2024 - موقع 24في عام 2024، أثبت الذكاء الاصطناعي أنه قادر على إحداث تغيير جذري في المجال الطبي، حيث يعمل على إعادة تشكيل كيفية تشخيص المرضى، وعلاجهم، ومراقبة حالتهم الصحية.ومن خلال عدد من المهام والأسئلة القصيرة، يُقيم الاختبار القدرات بما في ذلك الانتباه، والذاكرة، واللغة، والمهارات البصرية المكانية، والوظائف التنفيذية، بحيث يكون الحد الأقصى للدرجة هو 30 نقطة، مع اعتبار الدرجة 26 أو أعلى طبيعية بشكل عام.
إعاقات إدراكيةفي هذا السياق، أظهرت جميع نماذج اللغة الكبيرة الرائدة، أو "روبوتات الدردشة"، علامات ضعف إدراكي خفيف عند اختبارها باستخدام التقييمات المستخدمة عادة للكشف عن الخرف المبكر، وفقًا لدراسة نُشرت في المجلة الطبية البريطانية (BMJ).
ووجدت نتائج هذه الأبحاث أن الإصدارات الأقدم من "روبوتات الدردشة" كان أداؤها أسوأ في الاختبارات مما يشبه تماماً المرضى البشر المسنين.
سعى الباحثون لتقييم القدرات المعرفية لنماذج الذكاء الاصطناعي اللغوية، عبر إجراء دراستهم على نماذج "ChatGPT" الإصدارات 4 و4o، التي طورتها "OpenAI"، وClaude 3.5 Sonnet "التي طورتها Anthropic"، وGemini الإصدارات 1 و1.5، التي طورتها "Alphabet" - باستخدام اختبار التقييم المعرفي "MoCA".
الليزر والذكاء الاصطناعي يكشفان سرطان الثدي في مراحل أولية - موقع 24أشارت دراسة إلى أن طريقة الفحص الجديدة التي تجمع بين التحليل بالليزر ونوع من الذكاء الاصطناعي هي الأولى من نوعها لتحديد المرضى في المرحلة المبكرة من سرطان الثدي.وباعتماد نفس التعليمات التي يقدمها الأطباء على المرضى البشريين، حصل برنامج ChatGPT 4o على أعلى الدرجات في اختبار MoCA (26 من 30)، يليه برنامج ChatGPT 4 وClaude (25 من 30)، بينما حصل برنامج Gemini 1.0 على أدنى الدرجات (16 من 30).
وأظهرت جميع برامج المحادثة أداءً ضعيفاً في المهارات البصرية المكانية والمهام التنفيذية، مثل مهمة رسم المسار "ربط الأرقام والحروف المحيطة بدائرة بترتيب تصاعدي"، واختبار رسم الساعة "رسم وجه ساعة يظهر وقتاً محدداً"، وفشلت نماذج جيمياني في مهمة التذكر المتأخر "تذكر تسلسل من خمس كلمات".
اعترافوعلى الرغم من اعتراف مؤلفي الدراسة بالاختلافات الأساسية بين الدماغ البشري ونماذج اللغة الكبيرة، إلا أنهم يشيرون إلى وجود فشل موحد لجميع نماذج اللغة الكبيرة في المهام التي تتطلب التجريد البصري والوظيفة التنفيذية، ما يسلط الضوء على ضعفها.
وبناءً على ذلك، استنتج الباحثون، بأنه ليس من المرجح أن يتم استبدال علماء الأعصاب بنماذج لغوية كبيرة في أي وقت قريب، بعكس الحديث المُثار.
المصدر: موقع 24
كلمات دلالية: سقوط الأسد حصاد 2024 الحرب في سوريا عودة ترامب عام على حرب غزة إيران وإسرائيل إسرائيل وحزب الله غزة وإسرائيل الإمارات الحرب الأوكرانية الذكاء الاصطناعي الذكاء الاصطناعي الذکاء الاصطناعی
إقرأ أيضاً:
الذكاء الاصطناعي يساعد الأطباء في تحليل الصور الطبية
برز الذكاء الاصطناعي، منذ ظهوره، كأداة فعّالة لتحليل الصور الطبية. وبفضل التطورات في مجال الحوسبة ومجموعات البيانات الطبية الضخمة التي يُمكن للذكاء الاصطناعي التعلّم منها، فقد أثبت جدواه في قراءة وتحليل الأنماط في صور الأشعة السينية، والتصوير بالرنين المغناطيسي، والتصوير المقطعي المحوسب، مما يُمكّن الأطباء من اتخاذ قرارات أفضل وأسرع، لا سيما في علاج وتشخيص الأمراض الخطيرة كالسرطان. في بعض الحالات، تُقدّم أدوات الذكاء الاصطناعي هذه مزايا تفوق حتى نظيراتها البشرية.
يقول أونور أسان، الأستاذ المشارك في معهد ستيفنز للتكنولوجيا في الولايات المتحدة، والذي يركز بحثه على التفاعل بين الإنسان والحاسوب في الرعاية الصحية "تستطيع أنظمة الذكاء الاصطناعي معالجة آلاف الصور بسرعة وتقديم تنبؤات أسرع بكثير من المُراجعين البشريين. وعلى عكس البشر، لا يتعب الذكاء الاصطناعي ولا يفقد تركيزه بمرور الوقت".
مع ذلك، ينظر العديد من الأطباء إلى الذكاء الاصطناعي بشيء من عدم الثقة، ويرجع ذلك في الغالب إلى عدم معرفتهم بكيفية وصوله إلى قراراته، وهي مشكلة تُعرف باسم "مشكلة الصندوق الأسود".
يقول أسان "عندما لا يعرف الأطباء كيف تُولّد أنظمة الذكاء الاصطناعي تنبؤاتها، تقلّ ثقتهم بها. لذا، أردنا معرفة ما إذا كان تقديم شروحات إضافية يُفيد الأطباء، وكيف تؤثر درجات التفسير المختلفة للذكاء الاصطناعي على دقة التشخيص، وكذلك على الثقة في النظام".
بالتعاون مع طالبة الدكتوراه أوليا رضائيان والأستاذ المساعد ألب أرسلان إمراه بايراك في جامعة ليهاي في ولاية بنسيلفانيا الأميركية، أجرى أسان دراسة شملت 28 طبيبًا متخصصًا في الأورام والأشعة، استخدموا الذكاء الاصطناعي لتحليل صور سرطان الثدي. كما زُوّد الأطباء بمستويات مختلفة من الشروح لتقييمات أداة الذكاء الاصطناعي. في النهاية، أجاب المشاركون على سلسلة من الأسئلة المصممة لقياس ثقتهم في التقييم الذي يُولّده الذكاء الاصطناعي ومدى صعوبة المهمة.
وجد الفريق أن الذكاء الاصطناعي حسّن دقة التشخيص لدى الأطباء مقارنةً بالمجموعة الضابطة، ولكن كانت هناك بعض الملاحظات المهمة.
اقرأ أيضا... مؤسسات تستخدم الذكاء الاصطناعي لأعمال معقدة ومتعددة الخطوات
كشفت الدراسة أن تقديم شروحات أكثر تفصيلًا لا يُؤدي بالضرورة إلى زيادة الثقة.
أخبار ذات صلةيقول أسان "وجدنا أن زيادة التفسير لا تعني بالضرورة زيادة الثقة". ذلك لأن وضع تفسيرات إضافية أو أكثر تعقيدًا يتطلب من الأطباء معالجة معلومات إضافية، مما يستنزف وقتهم وتركيزهم بعيدًا عن تحليل الصور. وعندما تكون التفسيرات أكثر تفصيلًا، يستغرق الأطباء وقتًا أطول لاتخاذ القرارات، مما يقلل من أدائهم العام.
يوضح أسان "معالجة المزيد من المعلومات تزيد من العبء المعرفي على الأطباء، وتزيد أيضًا من احتمال ارتكابهم للأخطاء، وربما إلحاق الضرر بالمريض. لا نريد زيادة العبء المعرفي على المستخدمين بإضافة المزيد من المهام".
كما وجدت أبحاث أسان أنه في بعض الحالات، يثق الأطباء بالذكاء الاصطناعي ثقةً مفرطة، مما قد يؤدي إلى إغفال معلومات حيوية في الصور، وبالتالي إلحاق الضرر بالمريض.
ويضيف أسان "إذا لم يُصمم نظام الذكاء الاصطناعي جيدًا، وارتكب بعض الأخطاء بينما يثق به المستخدمون ثقةً كبيرة، فقد يطور بعض الأطباء ثقةً عمياء، معتقدين أن كل ما يقترحه الذكاء الاصطناعي صحيح، ولا يدققون في النتائج بما فيه الكفاية".
قدّم الفريق نتائجه في دراستين حديثتين: الأولى بعنوان "تأثير تفسيرات الذكاء الاصطناعي على ثقة الأطباء ودقة التشخيص في سرطان الثدي"، والثانية بعنوان "قابلية التفسير وثقة الذكاء الاصطناعي في أنظمة دعم القرار السريري: تأثيراتها على الثقة والأداء التشخيصي والعبء المعرفي في رعاية سرطان الثدي".
يعتقد أسان أن الذكاء الاصطناعي سيظل مساعدًا قيّمًا للأطباء في تفسير الصور الطبية، ولكن يجب تصميم هذه الأنظمة بعناية.
ويقول "تشير نتائجنا إلى ضرورة توخي المصممين الحذر عند دمج التفسيرات في أنظمة الذكاء الاصطناعي"، حتى لا يصبح استخدامها معقدا. ويضيف أن التدريب المناسب سيكون ضروريًا للمستخدمين، إذ ستظل الرقابة البشرية لازمة.
وأكد "ينبغي أن يتلقى الأطباء، الذين يستخدمون الذكاء الاصطناعي، تدريبًا يركز على تفسير مخرجات الذكاء الاصطناعي وليس مجرد الوثوق بها".
ويشير أسان إلى أنه في نهاية المطاف، يجب تحقيق توازن جيد بين سهولة استخدام أنظمة الذكاء الاصطناعي وفائدتها.
ويؤكد الباحث "يُشير البحث إلى وجود معيارين أساسيين لاستخدام أي شكل من أشكال التكنولوجيا، وهما: الفائدة المتوقعة وسهولة الاستخدام المتوقعة. فإذا اعتقد الأطباء أن هذه الأداة مفيدة في أداء عملهم، وسهلة الاستخدام، فسوف يستخدمونها".
مصطفى أوفى (أبوظبي)