العربية.. هل لغة الضاد عصية على الذكاء الاصطناعي؟
تاريخ النشر: 19th, December 2023 GMT
تعدّ اللغة العربية واحدة من أكثر اللغات شيوعا في العالم، مع أكثر من 400 مليون ناطق بها في أرجاء المعمورة، لكن لا تتوفر الكثير من التكنولوجيا التي تضعها باستخدام الذكاء الاصطناعي بشكل مواز، مقارنة مثلا باللغة الإنكليزية.
وخلص بحث في جامعة كورنويل، على تقييم شامل لبرنامج ChatGPT في البرمجة اللغوية العصبية العربية (يحمل توقيع محمد توكت، إسلام خوندكر عبد الواحد، المعتز بالله نقودي، ومحمد عبد المجيد) إلى أنه على الرغم من الأداء الممتاز لـ ChatGPT الذي يبشر بتحول في البرمجة اللغوية العصبية، لكن ما تزال فعالية النموذج عبر سياقات لغوية متنوعة، مجهولة إلى حد كبير.
وتشير نتائج البحث الذي يشمل 44 مهمة مختلفة لفهم اللغة وإنشائها في أكثر من 60 مجموعة بيانات مختلفة، إلى "تجاوز نماذج أصغر خضعت للتحسين في اللغة العربية الذكاء الاصطناعي (ممثلا بـ ChatGPT في سياق البحث) باستمرار، كما تكشف مقارنة دقيقة بين اللغة العربية الفصحى الحديثة، واللهجة العربية في ChatGPT وGPT-4، عن أوجه القصور النسبية لكلا النموذجين في التعامل مع اللهجات العربية مقارنة بالعربية الفصحى". فكيف هو الواقع وما هي الآفاق؟
"ارفع صوتك" سأل خبراء تكنولوجيا المعلومات ومواقع التواصل، للنظر في السيناريوهات المحتملة.
لغة معقدة وصعوبة الترميزوتضع اللغة العربية بما تتميز به من تعقيدات، الذكاء الاصطناعي أمام عدد من التحديات، ويتحدث عن ذلك الخبير في تكنولوجيا المعلوماتية ومواقع التواصل عمر قصقص قائلاً إن "أدوات الذكاء الاصطناعي، قادرة على التطور بفضل التدريب وفي حالة اللغة العربية، تكمن العقدة في عدم التدريب الكافي".
ويضيف: "حتى الساعة يبدو أن ذلك قد حصل، لكن ليس بالقدر الكافي أو الموازي للغات الأخرى، كالإنجليزية والإسبانية مثلاً، خصوصا بسبب الأبعاد الأدبية وعلامات التشكيل والترميز".
ويعدّ التشكيل من أكثر الأشياء التي تتميز بها العربية، وعلامات التشكيل كناية عن تلك الرموز الصغيرة التي تضاف إلى الحروف، أي الحركات. وتحدد الحركات طريقة لفظ ومعنى المفردات، وهي قادرة على تغيير طريقة فهم الكلام.
وبالتالي، بغياب التشكيل، قد يقع القارئ في نوع من الغموض، ومن الأمثلة على ذلك "كَتَبَ" و"كُتِبَ" التي تُغير الصيغة من المعلوم إلى المجهول. أما بالنسبة للترميز أو ما يعرف بـ Tokenization، يعتمد الذكاء الاصطناعي على تقسيم سلسلة من النصوص أو الكلام، إلى وحدات يمكن تحديدها، وفي حال لم تتوفر المعلومات الكافية كما يضيف قصقص، يلجأ لاصطناع الشكل المطلوب (بنية مقال مثلا)، لكن مع الوقوع في التكرار بسبب نقص المعلومات.
كما أن التصريفات تشكل عائقا جديدا، حيث يختلف نظام اللغة العربية عن الإنكليزية وسواها والأمثلة كثيرة، ففي اللغتين الفرنسية والإنكليزية، يستخدم المفرد والجمع بينما تنفرد اللغة العربية بالمثنى في كلمة واحدة فيقال مثلا: "نظام، نظامان، أنظمة" في ثلاث كلمات مختلفة تشير الإضافات فيها للعدد، بينما في الإنكليزية (system, systems)، وللمثنى يضاف العدد 2.
عدا عن ذلك، تمرّ المعلومات التي تنقلها أدوات الذكاء الاصطناعي عبر قنوات الترجمة، الأمر الذي قد يشكل عائقا آخر.
يبيّن قصقص: "لم تكن لنا على الدوام تجارب عظيمة على مستوى الترجمة، خصوصا وأن محركات البحث أو الأدوات المستخدمة فيها، غالبا ما تنقل الكلمات بشكل حرفي من لغة إلى أخرى، دون إيصال المعنى العام، وهذا الأمر يعني الوقوع في الخطأ، خصوصا على مستوى الأمثال الشعبية مثلا، والعبارات المجازية بشكل عام".
قابلنا الدكتور محمد ضاهر، الأستاذ الجامعي المحاضر في جامعة بيروت العربية، الباحث في مجال الذكاء الاصطناعي والأمن السيبراني ومشروع التوأمة الرقمية للسيارات ذاتية القيادة مع مختبرات Cristal بجامعة ليل الفرنسية.
يقول لـ"ارفع صوتك" إن "الفكرة تكمن دائما في كمية المعلومات المتوفرة، وإذا ما أخذنا على سبيل المثال محرك البحث (غوغل)، نلاحظ أن المصادر الموجودة باللغة الإنجليزية تفوق ٩٠٪ من مجموعة المصادر في العالم، وبالتالي هذا ما يفسر امتلاكه للكثير من الإجابات والمراجع والأرشيف الغني حول أي موضوع".
ويضيف: "هذا ما يفسر أيضا الدقة والسرعة في منح الإجابات المفصلة. أما في حالة اللغة العربية، غالبا ما تكون المراجع قليلة، والأمر شبيه بالبحث عن معلومة في كتب باللغة العربية، ولكن العائق هو عدم توفر الكثير من الكتب، فنضطر للبحث أكثر ومن الممكن أن نجد المعلومة أو العكس، أو قد نقع على معلومات غير موسعة، وهذا ما يؤثر على عناصر أخرى كالدقة في المعلومات وسرعة التسليم وسواها".
ويتابع ظاهر: "يعود ذلك إلى عدة أسباب أبرزها، كمية البيانات المتاحة للتدريب على اللغة العربية مقارنة بالإنجليزية. موديل اللغة دُرِب أساسًا بشكل رئيسي على اللغة الإنجليزية، وقد يقدم أداء أفضل في فهم وإنتاج النصوص بالإنجليزية. بالإضافة إلى ذلك، يمكن أن يؤدي نقص البيانات إلى انحياز في تطوير الذكاء الاصطناعي نحو اللغات التي تمتلك كميات أكبر من البيانات".
المشهد المستقبليولكن على الرغم من التحديات، يبدو أن الأدوات المتاحة تفتح آفاقا واعدة، حيث تعكف مؤسسات كبيرة على تصميم نماذج لغوية كبيرة، ومن الأمثلة على ذلك مركز "Inception" الذي أطلق في أكتوبر 2023 أداة "جيس" في الإمارات، والتي أنشئت بالتعاون بين جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) في أبوظبي، وشركة "Cerebras Systems"، ومقرّها "سيليكون فالي".
ويتضمن النموذج تدريبا على 13 مليار لمجموعة بيانات فريدة مكونة من 116 مليار رمز عربي، مصمم لالتقاط التعقيد والفروق الدقيقة وثراء اللغة العربية، بالإضافة إلى 279 مليار رمز للكلمات الإنجليزية، بهدف مضاعفة فعالية النموذج من خلال النقل بين اللغات.
يرى قصقص أن "هذا النموذج واعد لناحية الدمج في تطبيقات تولد الردود باللغة العربية من ضمن لغات أخرى، بالإضافة إلى التفاعل على مستوى النصائح والتوصيات والترجمات وسواها من الخدمات التي يقدمها الذكاء الاصطناعي".
من جهته يدعو الدكتور ظاهر، الناطقين باللغة العربية من باحثين وداعمين لإثراء المراجع والمعلومات المتاحة على الشبكة باللغة العربية.
ويختم قائلا: "لا بد من التشجيع على البحث والابتكار. يمكن أن تحفز زيادة البيانات باللغة العربية الباحثين والمبتكرين في المنطقة على تطوير حلول جديدة وابتكارات في مجال الذكاء الاصطناعي، مما يعزز التقدم التكنولوجي على أمل أن يسمح ذلك بالاستعاضة عن عدم المشاركة في التطوير بالمشاركة في التدريب".
المصدر: الحرة
كلمات دلالية: الذکاء الاصطناعی باللغة العربیة اللغة العربیة
إقرأ أيضاً:
كيف تستخدم مصر الذكاء الاصطناعي في مكافحة الجرائم؟
تواصل وزارة الداخلية في مصر مكافحة الجرائم، مستعينة بالتقنيات الحديثة للذكاء الاصطناعي، والتي أصبحت عنصرا رئيسا من عناصر التكنولوجيا الأمنية، ويتم استغلالها على عدد من المحاور الرئيسة، التي تظهر أهميتها وتدعم جهود ضبط الخارجين عن القانون.
وتتعدد المجالات التي يدخل الذكاء الاصطناعي عنصرا أساسيا من عناصر الكشف عن الجريمة والتصدي لها وحتى منعها قبل حدوثها، وذلك من خلال المراكز الفنية والتقنية التي أنشأتها الوزارة، متمثلة في "مركز العمليات الأمنية"، الذي يضم خبراء على مستوى عال من التدريب.
وتضمنت المجالات التي يدخل الذكاء الاصطناعي فيها لضبط واستعادة الأمن في مصر، كل من مكافحة الإرهاب وضبط جرائم المرور وتحليل سلوك الأفراد، بالإضافة إلى تحليل البيانات وتحديد بصمة جرائم الأفراد، بالإضافة إلى مراجعة الكاميرات وتحديد الوجوه بدقة فائقة.
أداة مهمة للكشف عن الجرائم
قال الخبير الأمني العميد سامح عز العرب، إن الذكاء الاصطناعي يعد أحد أهم أدوات وزارة الداخلية حاليا في الكشف عن الجرائم، وبعض تقنيات وبرامجه يمكنها التنبؤ بالجريمة، من خلال تحليل البيانات وتحديد الأماكن المؤهلة لوقوع الجرائم المتسلسلة أو المتكررة.
وأوضح، في تصريحات خاصة لـ"سكاي نيوز عربية"، أن الأمن تمكن من تحقيق الاستفادة من تقنيات الذكاء الاصطناعي على مدى العامين الأخيرين بشكل كبير، من خلال التوسع في استخدام أنظمته ودمجها في منظومة الأمن العام، لتحليل كميات ضخمة من البيانات في وقت قياسي.
وبحسب الخبير الأمني المصري، تستخدم الوزارة الذكاء الاصطناعي لربط المعلومات من عدد من القضايا المختلفة، بما يوصل الأجهزة إلى خيوط تتبع لعناصر الجريمة لا يمكن للذكاء البشري تحقيقها أو الوصول إليها بسهولة.
وأضاف: "بإمكان برامج الذكاء الاصطناعي التعرف على أنماط الجرائم والربط بين أساليبها والجناة المعتادين على ارتكاب هذا النوع، وهو ما يسهل على الأجهزة الأمنية عملية التنبؤ بأماكن الجريمة القادمة، وربما يسهل عملية تحديد موعدها أيضا، وبالتالي إحباطها قبل وقوعها".
وأكد عز العرب على أن الذكاء الاصطناعي أصبح أداة لا يمكن الاستغناء عنها لملاحقة الجرائم المختلفة، إلا أن هناك 5 محاور رئيسة يتم العمل لمواجهتها، وهي: جرائم الإرهاب، والجرائم الإلكترونية، وجرائم القتل المتسلسل، وعمليات النصب، وجرائم الترويج للمخدرات والآداب.
الاعتماد على الذكاء الاصطناعي لحل الجرائم
من جانبه، قال مصدر في "مركز العمليات الأمنية" الجديد التابع لوزارة الداخلية المصرية، إن هناك عدد من الجرائم التي استطاع المركز حلها بسرعة كبيرة معتمدا على تقنيات وبرامج الذكاء الاصطناعي، وفي مقدمتها الهجمات الرقمية ومحاولات الاختراق، بالإضافة إلى عمليات السرقة الإلكترونية باستعمال خوازميات ذكية.
ولفت، في حديث خاص لموقع "سكاي نيوز عربية"، إلى أن البرامج الذكية تساعد أيضا في التعرف على الوجوه وتحليل الصور، وهي خطوة مهمة لمكافحة الإرهاب والقتل، إذ يمكنها تعقب المشتبهين بدقة، حتى إذا تنكروا أو غيروا ملامحهم للهروب من المساءلة أو القبض عليهم.
وتساهم هذه التقنيات، حسب المصدر الأمني، في فحص تسجيلات كاميرات المراقبة وتحليلها بسرعة كبيرة، بما يختصر وقت ملاحقة المجرمين، بالإضافة إلى إمكان برمجة هذه التقنيات لإعطاء تنبيهات فورية فور وقوع حوادث معينة، أو اكتشاف أنشطة غير معتادة في أماكن معينة.
وتابع: "لذلك، يساعد الذكاء الاصطناعي ببرامجه المختلفة في زيادة معدلات ضبط الجرائم، والتوصل إلى حل العديد من الألغاز التي كانت تمثل مشكلة في الماضي، مثل جرائم السرقة والقتل والتحرش وجرائم السرقة الإلكترونية، وكذلك النصب الإلكتروني، وجرائم التشهير والابتزاز".
وأضاف أن هذه البرمجيات تدعم ضبط جرائم أخرى كالترويج للمواد المخدرة والأعمال المنافية للآداب، والأهم من ذلك دورها في ضبط محاولات تجنيد الشباب لارتكاب جرائم لصالح "الدارك ويب"، وهي جرائم جديدة على المجتمع المصري ولكنها مؤثرة بشدة من حيث خطورتها.
وقال إن أشهر العمليات مؤخرا كانت عمليات ضبط شبكة إجرامية تخصصت في بيع مخدر "الهيدرو" الشهير، إذ استطاع تجار هذا المخدر الهرب من الأجهزة الأمنية لمدة طويلة والتخفي، قبل أن تستخدم وزارة الداخلية تقنيات الذكاء الاصطناعي للوصول إليهم والقبض عليهم، خاصة أن المتهمين استخدموا بدورهم تقنيات ذكية للتخفي والهروب دائما.
زيادة جودة العمليات الأمنية
أما الخبير الأمني المتخصص في الجرائم الإلكترونية والمعلوماتية، العميد رامي غيط، فقد أكد أن مركز العمليات الأمنية التابع لوزارة الداخلية يؤدي دورا كبيرا وفعالا في فك الشفرات وتحليل البصمات، وفرز الهويات، والتعرف على المجرمين من خلال تحليل الوجوه ومراقبة تحركاتهم وتنقلاتهم.
وأشار إلى أن اعتماد وزارة الداخلية على برامج وخوارزميات الذكاء الاصطناعي أسهم في زيادة جودة العمليات الأمنية، وزيادة معدل التصدي للجريمة من خلال التوصل بسرعة فائقة إلى الجناة وتتبعهم، بما يحقق نتائج سريعة تصب في صالح أمن وسلم المجتمع المصري.