اللغة العربية في عصر الذكاء الاصطناعي.. الفرص والتحديات
تاريخ النشر: 24th, January 2024 GMT
سعيد بن محمد الكلباني
يشهد العالم تطورًا متسارعًا في مجال التكنولوجيا، ويبرز في خضمه الذكاء الاصطناعي كعنصر محوري مؤثر ودافع للتحولات في مجالات عدة، وبخاصة مجال معالجة اللغات. ومثل ما هو معلوم فإن النماذج اللغوية التوليدية قائمة على الحوار أو التحادث باللغات البشرية الطبيعية، إلا أن ذلك ليس بالأمر الإيجابي دائما بما يخدم اللغات؛ نتيجة لتمايز النماذج في دقتها مع لغة مقابل لغة أخرى، ولتفاوت المستخدمين في درجة تمكنهم من اللغة التي يتحدثونها واللغات الأخرى المستخدمة، وعامل اللهجات.
من هنا تبرز اللغة العربية بكل ثرائها وتعقيدها كحقل خصب للفرص والتحديات في مضمار الذكاء الاصطناعي، فلغة الضاد -بكل ما تحمله من تاريخ وعمق لغوي وغزارة كلمات ومضامين- تقف اليوم أمام أفق واسع من التحديات المتشكلة من قِبل المستخدمين لها، والبرمجيات المستخدمة فيها، قد يؤدي هذا في الأحوال الحسنة إلى تحويل الجيد إلى الأجود، وربما ينتقل الجيد إلى سيئ والسيئ إلى الأسوأ في أسوأ الأحوال، وتتخلف القافلة بذلك عن الركب.
تتجسد مشكلة اللغة العربية في عصر الذكاء الاصطناعي التوليدي في عملية جمع البيانات من المصادر الرقمية التي يمكن أن تصل لها أدوات الجمع، وما كتب فيما تم جمعه من تلك المصادر، إذ يشوب تلك العملية مجموعة من التحديات التي بشكل أو بآخر تحوّل فرص الاستفادة من الذكاء الاصطناعي في تطوير اللغة ونشر المحتوى بها حسب أصولها وقيمها ومبادئها إلى عقبات تتسبب في تأخيرها عن مقارعة اللغة الإنجليزية بغزارة المحتوى المنشور بها.
تتجلى تحديات اللغة العربية في ميدان الذكاء الاصطناعي التوليدي في تعقيد اللغة نفسها، فالعربية الكلاسيكية لغة إسماعيل بن إبراهيم عليهما السلام بإعرابها وتصريفها وتنوع معانيها، والعربية القياسية الحديثة، واللهجات العامية، جميعها تقدم لوحة فسيفسائية من التحديات أمام النماذج اللغوية الاصطناعية، حيث إن الفروق الدقيقة في استخدام الكلمات والتراكيب المنشورة على شبكة الإنترنت تحتاج إلى أدوات كشط دقيقة في جمعها من المصادر الرقمية، وعمليات متعددة مبنية في تركيبها ووظيفتها على فهم دقيق لخصائص اللغة ومكامنها، وتصنيفها. وفي سياق التعقيد ذاته، نجد أن المنشور بشكل عام عبر شبكات الإنترنت و-بخاصة في الصفحات الإخبارية التي اعتُمد عليها كثيرًا في تدريب نماذج الذكاء الاصطناعي- يتّجه نحو البساطة في الطرح اللغوي، ويتجنب كلمات اللغة القديمة، وبالتالي لن تظهر اللغة العربية بقوتها وتاريخها في النماذج، هذا يعني أن هذه التقنيات سوف تساهم في غروب شمس اللغة من خلال كلمات عريقة أصيلة لم تصل إليها، وبالتالي لن تقدمها للمستخدمين بأي حال من الأحوال.
تتلاحق التحديات كحلقات سلسلة يأزر بعضها البعض، فالحضور الضعيف للمحتوى العربي على شبكة الإنترنت الذي لا يتجاوز 3% حسب التقرير الصادر عن الاتحاد الدولي للاتصالات، والذي سلطت عليه الضوء شبكة بي بي سي الإعلامية في 9 يونيو 2023 يمكن أن يظهر تحديًا يتشكل في نقص البيانات المتاحة باللغة العربية كمًا، وجودةً، وهذا النقص يحد من قدرة الذكاء الاصطناعي على التعلم والتطور بالشكل المثالي، كما أن عامل تدريب نماذج الذكاء الاصطناعي المعتمد على اللغة الإنجليزية بشكل أساسي والتي بلغت نسبة 92.3% من مجموع النسبة العامة للمحتوى في تدريب نموذج GPT-3.5 المطور من شركة Open AI مقابل 7.7% موزعة على المحتوى لباقي اللغات، ومع نقص المحتوى العربي تتفاقم مشكلة نقص البيانات التي تتضمنها نماذج الذكاء الاصطناعي من المحتوى العربي.
تشكل اللهجات تحديًا آخر، حيث تشير عدد من التقارير إلى أن 550 مليون نسمة حول العالم يتحدثون باللسان العربي، وينقسمون إلى 300 مليون منهم تمثل اللغة العربية لغتهم الأم، وما تبقى يتخذونها لغة ثانية. إن هذا العدد والتفاوت فيه مؤشر على تنوع اللهجات والتي هي في الأساس تفرعات وتحويرات في اللغة العربية، نشأت وتأصلت حسب الأقطار والقبائل، والطوائف، والأنشطة، وغيرها.
وبالنظر إلى عدد المتحدثين باللسان العربي، وتنوع لهجاتهم التي تحمل كل منها خصوصيتها وتركيبتها اللغوية، المختلفة بدرجة كبيرة عن الفصحى وعن اللهجات الأخرى، يمكننا استقراء تنوع المحتوى المنشور والمتشرب بالكلمات غير الفصيحة، وكذلك استقراء مضمون الكلمات في نشاط التحادث بين المستخدم العربي ونماذج الذكاء الاصطناعي التوليدية، إذ أن المحتوى والتحادث سوف يحملان الكثير من الكلمات المنحازة في المعنى لقطاع جغرافي أو فئة معينة، والتي بذلك تكون مقطوعة من اللغة العربية، وتبقى مجهولة المعنى لقلة انتشارها. كما أن هناك عاملًا آخر يساهم في خلق التحدي، وهو أن اختلاف معنى الكلمة بين فئة وأخرى، وتأثير ذلك كتحدٍ يكون بعدم ظهور هذه الكلمات في نماذج الذكاء الاصطناعي، أو ظهورها الذي ينحصر فهمه للفئة التي تعرفها. إن ذلك الترادف أو التنوع يشبه التعامل مع النصوص ثنائية اللغة، وهو أيضًا أمر آخر لا يقل عن كونه تحديًا يتطلب من النماذج اللغوية القدرة على فهم ومعالجة هذا التنوع اللغوي بالتصنيف والضبط.
كقاعدة ترتبط بما سبق من تحديات، ينشأ تحدٍ مستقبلي يتمثل في سعي مطوري نماذج الذكاء الاصطناعي إلى تدريب تلك النماذج على المحادثات التي دارت بين المستخدمين العرب بلهجاتهم وأخطاءهم في الكتابة، والتعلم الآلي غير المشرف عليه من المحتوى عبر الشبكة أو أرشيف المحادثات، كل ذلك سوف يؤدي إلا طمس الكثير من الكلمات الأصيلة في اللغة العربية، وبروز كلمات من لهجات مختلفة، وأخطاء لغوية وغيرها، مما يعني أن المستخدم غير المتمكن من اللغة وغير المراعي لخصوصيتها واستخدام اللغة الفصيحة، سوف يساهم نفسه في تحويل الجيد إلى سيء والسيء إلى أسوأ.
إنَّ تحديات اللغة العربية في عصر الذكاء الاصطناعي لا تقتصر على اللغة نفسها ومستخدميها، ولكن تمتد إلى بناء النماذج اللغوية الاصطناعية. فمسألة التحيز والأخلاقيات في تدريب النماذج اللغوية قد تؤدي إلى نتائج مشوهة أو غير دقيقة، مما يشكل تحديًا يضاف إلى السلسلة التي تحوّل فرص اكتساب اللغة العربية من القوة والامتياز إلى تحديات.
يتوجب علينا اليوم كأفراد مواجهة لامبالاة البعض في نشر المحتوى عبر شبكة الإنترنت ووسائل التواصل بلهجات دراجة وبأخطاء لغوية، واستخدام اللهجات الدارجة مع نماذج الذكاء الاصطناعي، كما أن عدم التوازن في التواصل مع الشركات المطورة لنماذج الذكاء الاصطناعي التي تظهر بها أخطاء لغوية أو كلمات عربية غير مفهومة يمكن أن يكون حلًا ناجعًا يحافظ على فرص اللغة العربية في الاستفادة من الذكاء الاصطناعي.
أما على الصعيد المتقدم، فإنه على المؤسسات الكبرى والأكاديمية بناء نماذج ذكاء اصطناعي مخصصة للغة العربية، أو توفير محتوى عربي يمتاز بالجودة والشمول وتقديمه للمؤسسات غير العربية التي تبني النماذج، ويمكن النظر بإيجابية، والحذو بتجربة شركة Core42 إحدى شركات مجموعة G42 التكنولوجية الرائدة في الإمارات التي أطلقت نموذج Jais 30B الأكثر كفاءة في برامج اللغة العربية التي يمكنها تشغيل تطبيقات الذكاء الاصطناعي التوليدية، والذي تم تدريبه على مجموعة بيانات تتكون من 126 مليار رمز عربي، و251 مليار رمز باللغة الإنجليزية. مما يعطي دعمًا قويًا للمستخدم لإثراء المحتوى العربي وتجويده.
كما إنه يمكن جعل اللغة العربية تستغل فرصها من الذكاء الاصطناعي في تطويرها وجودتها وجودة مستخدميها في التعامل بها، من خلال استغلال مصدر الخوف أو المشكلة وجعلها مصدر قوة، فعلى سبيل المثال يمكن إنشاء برمجيات أو خوارزميات لتتبع الأخطاء ضمن نماذج الذكاء الاصطناعي سواء عند إدخالها من قبل المستخدم أو التي يحتمل أن يقدمها النموذج نفسه. وفي ذات سياق الأفكار المعتقد بأنها تدفع نحو الجودة في اللغة يمكن ضبط النماذج عند الاستجابة لمطالبات أو أوامر المستخدم على تقديم مجموعة من الكلمات عن المرادفة أو حتى التعرف على الكلمات في اللهجات والإشارة لها وحتى تقديم كلمات عربية فصيحة بدلًا من تلك الكلمات.
ختامًا.. اللغة العربية تتطلب اليوم حرصًا من الأفراد والمؤسسات للمحافظة عليها والسمو بها بين اللغات الأخرى، في ظل طوفان الذكاء الاصطناعي الذي يقوم جله على اللغة الإنجليزية، وفي ظل التوجهات المؤسسية لجعل اللغة الإنجليزية متطلبًا إلزاميًا للتوظيف والتواصل مع المحيط العالمي، الذي أصبح متقارب الأركان بفعل التكنولوجيا.
المصدر: جريدة الرؤية العمانية
إقرأ أيضاً:
«جونا عربي».. شعار «أيام العربية» ينبض بالحياة ببرنامج حافل
أبوظبي (الاتحاد)
كشف مركز أبوظبي للغة العربية اليوم عن برنامجه الكامل للدورة الثالثة من مهرجان «أيام العربية» الممتد لثلاثة أيام، محتفياً باللغة العربية وحيويتها وصلتها بالواقع المعاصر، فمن 13 إلى 15 ديسمبر 2025، تتحوّل منارة السعديات إلى فضاءٍ نابضٍ بالموسيقى والسينما وفنون السرد والتجارب التفاعلية، تحت شعار يتماهى مع روح الشباب هو «جونا عربي».وتقدم دورة عام 2025 أوسع برنامج لمهرجان «أيام العربية» حتى الآن، إذ يشهد عروضاً موسيقية تُقدم للمرة الأولى، وورش عمل للتطوير المهني، ومساحات مخصّصة للشباب والعائلات، مسلطاً الضوء على الدور المحوري لأبوظبي باعتبارها منصة عالمية للغة العربية والثقافة، بالتزامن مع اليوم العالمي للغة العربية الذي تحتفي به اليونسكو في 18 ديسمبر.
وقال الدكتور علي بن تميم، رئيس مركز أبوظبي للغة العربية: «إن مهرجان أيام العربية أكثر من مجرد احتفالية، إنه برنامج حي، يستفيد من مفهوم الصناعات الإبداعية، ليجعل اللغة نابضة بالحياة». وأضاف: «تدعو دورة هذا العام الجمهور إلى تذوق جماليات اللغة العربية بالحواس، رؤيتها، وسماعها، والتفاعل معها عبر الابتكارات في العلوم، والفنون، مع عناية خاصة بفئة الشباب، وابتكارات العالم الرقمي، تعزيزاً لرسالة شعار اليونسكو لاحتفالات هذا العام باليوم العالمي للغة العربية «آفاق مبتكرة للغة العربية: سياسات وممارسات ترسم مستقبلاً لغوياً أكثر شمولاً»، وتأكيداً لرسالة مركز أبوظبي للغة العربية بأن اللغة ليست إرثاً فحسب، بل قوة إبداعية متجددة».
عبر العروض الموسيقية والحوارات الثقافية الثرية، يصطحب المهرجان خلال أيامه الثلاث زواره في رحلة من الأمسيات الغنائية يحييها كل من فؤاد عبد الواحد، ورحمة رياض، وفرقة كايروكي. فيما تشهد الليلة الختامية احتفاء خاصاً بفن الموشحات، بمشاركة لينا شاماميان، وريما خشيش، وزينة عماد.
وضمن فقرتها الفنية، ستقدم خشيش ألبومها الجديد «يا من إذا» تكريماً للشاعر والموسيقار المصري فؤاد عبد المجيد، إذ يشهد الألبوم عرضه الحي الأول، وإطلاقه الرسمي على مسرح المهرجان بعد إصداره الرقمي العالمي.
جلسات حوارية
تستضيف قاعة المهرجان يومياً جلسات حوارية تستكشف عمق التعبير الثقافي العربي وتطوره، إذ تُفتتح فعاليات اليوم الأول بجلسة تحمل عنوان «النغمة والقصيدة: التراث مصدراً للإبداع المعاصر»، تتناول العلاقة الراسخة بين الموسيقى والشعر، والأساليب التي يواصل بها التراث الثقافي العربي التأثير في الممارسات الإبداعية الحديثة. وتجمع الجلسة رؤى كل من لينا شماميان، والباحث والشاعر الدكتور مهدي منصور.أما اليوم الثاني فيتضمن جلسة بعنوان «الشباب وصناعة المحتوى العربي»، بمشاركة المخرجين ماجد الزبيدي، وندى جاهد، يستعرضان خلالها تجربتهما في دخول عالم السينما، والدروس التي اكتسباها خلال إخراج أفلامهما.
يختتم المهرجان فعالياته في اليوم الأخير، بالشراكة مع مجموعة أبوظبي للثقافة والفنون، بجلسة بعنوان «أصوات وجماليات: العربية مصدراً للإلهام»، تسلط الضوء على دور اللغة العربية بوصفها محدداً للهوية، وأساساً للتعبير الأدبي والفني. ويشارك في الجلسة كل من المؤلف الموسيقي إيهاب درويش رئيس جمعية الموسيقيين الإماراتيين، والناقدة الأدبية مريم الهاشمي، والشاعر عبدالرحمن الحميري، الفائز بمسابقة «أمير الشعراء» لعام 2025.
رؤية معاصرة
وفي دورته الثالثة، تعود جلسات «الحكايات حول موقدة النار» برؤية معاصرة تعيد سرد التقاليد العربية، حيث تلتقي الحكايات الكلاسيكية بفنون السرد الحديث، والموسيقى، والشعر ضمن أجواء رائعة في الهواء الطلق. ويشارك في الجلسات كلٌ من الفنان فايز السعيد، والشاعر علي الخوَّار، وعازف العود عبدالعزيز المدني، وعازف الناي ناصر أمير، إلى جانب خبير الخيل العالمي علي العامري.
وانطلاقاً من رسالته الثقافية، يستضيف المهرجان، بالتعاون مع جامعة نيويورك أبوظبي، مؤتمراً بعنوان «الذكاء الاصطناعي وتعليم اللغة العربية»، بهدف تمكين معلمي اللغة العربية، ودعم تطوير نماذج مبتكرة للمناهج الدراسية المدعومة بالذكاء الاصطناعي. كما توفّر الدورة التدريبية للسرد القصصي المقدمة من (سي إن إن بالعربية) فرصةً للمواهب الناشئة من صناع المحتوى لتعزيز قدراتهم في السرد ومهارات الإنتاج الرقمي.
تجارب تفاعلية
ويقدم المهرجان أنشطة متنوعة مُصممة لتناسب جميع الأعمار، مع تجارب تفاعلية، وجدار غرافيتي للرسم الحي، وورش عمل حول كيفية توظيف وسائل التواصل الاجتماعي لبناء مسارات مهنية إبداعية. إضافة إلى عرض باقة مختارة من الأفلام العربية لصناع أفلام موهوبين، يقدمها استوديو الفيلم العربي، إحدى مبادرات المختبر الإبداعي، ذراع تطوير المواهب لهيئة الإعلام الإبداعي في أبوظبي، علاوة على ذلك، يتضمن البرنامج مجموعة من الأنشطة المناسبة للعائلات تتضمن مسرح الدمى والجوقة العربية، ومجموعة متنوعة من ألعاب الطاولة التقليدية.