“جي42” تطلق 20 نموذجًا للذكاء الاصطناعي لدعم معالجة اللغة الطبيعية القائمة على العربية
تاريخ النشر: 5th, August 2024 GMT
أطلقت شركة إنسبشن، إحدى شركات “جي42″، والمتخصصة في تطوير نماذج وتطبيقات الذكاء الاصطناعي المتقدمة، اليوم، أحدث نموذج لغة كبير “جيس 70B”، بالإضافة إلى 20 نموذجاً آخر للذكار الاصطناعي لدعم معالجة اللغة الطبيعية القائمة على اللغة العربية.
وقالت الشركة، في بيان اليوم، إنه تم تصميم نموذج “جيس 70B”، الذي يحتوي على 70 مليار بارامتر، لمطوري حلول معالجة اللغة الطبيعية القائمة على اللغة العربية، ويعد بتسريع تكامل خدمات الذكاء الاصطناعي التوليدي عبر مختلف القطاعات، مما يعزّز القدرات في مجالات مثل خدمة العملاء وإنشاء المحتوى وتحليل البيانات.
وكشفت الشركة أيضًا عن مجموعة شاملة من نماذج “جيس” الأساسية والمدربة بدقة ؛ تضم 20 نموذجًا، عبر 8 أحجام، تتراوح من 590 مليون إلى 70 مليار بارامتر، والمدربة بدقة خصيصاً لتطبيقات الدردشة، حيث تم تدريب هذه النماذج على ما يصل إلى 1.6 تريليون وحدة لغوية بالعربية والإنجليزية وبيانات البرمجة.
وتستوعب هذه المجموعة من نماذج “جيس” عددًا واسعًا من الاستخدمات، وتهدف إلى تسريع فرص الابتكار والتطوير والبحث للعديد من التطبيقات المستقبلية للمجتمع العربي الناطق باللغة العربية وثنائي اللغة.
وقال الدكتور أندرو جاكسون، الرئيس التنفيذي لشركة إنسبشن: “اليوم، أصبح الذكاء الاصطناعي قوة مُضافة للِقيمة، وكانت نماذج اللغة الكبيرة في طليعة ارتفاع تبني الذكاء الاصطناعي، مشيرا إلى أنه تم إنشاء ‘جيس‘ للحفاظ على التراث والثقافة واللغة العربية، ولجعل الوصول إلى الذكاء الاصطناعي متاحًا للجميع”.
وأضاف: “أن إصدار ‘جيس 70B‘ وهذه العائلة الجديدة من النماذج يعزز التزامنا بتقديم نموذج أساسي للذكاء الاصطناعي عالي الجودة للدول العربية، منوها إلى أنّ تقنيات التدريب والتكيف التي نقدمها بنجاح لنماذج اللغة العربية قابلة للتوسع لتشمل لغات أخرى غير مخدومة بشكل كافٍ”.
من جهتها قالت نيها سينغوبتا، عالمة تطبيبقية رئيسية في شركة إنسيبشن: “بالنسبة للنماذج التي تصل إلى 30 مليار بارامتر، فقد نجحنا في تدريب جيس من الصفر متفوقين باستمرار على النماذج المعدلة في المجتمع ، لافتة إلى أنه بالنسبة للنماذج التي تحتوي على 70 مليار بارامتر وما فوق، كانت تعقيدات الحوسبة والأثر البيئي لتدريبها من الصفر كبيرة”.وام
المصدر: جريدة الوطن
كلمات دلالية: الذکاء الاصطناعی اللغة العربیة
إقرأ أيضاً:
نقلة نوعية تعالج ظاهرة الإجابات «الواثقة غير الدقيقة»
أبوظبي (الاتحاد)
أخبار ذات صلةكشف باحثون من جامعة محمد بن زايد للذكاء الاصطناعي عن نهج مبتكر يُعيد تشكيل عملية التحقق التلقائي من مخرجات نماذج اللغة الكبرى (LLMs)، موفراً حلاً أكثر كفاءة وأقل تكلفة لمعالجة ظاهرة «الهلوسة» التي تُنتج إجابات واثقة لكنها غير دقيقة. الدراسة، التي نُشرت على الموقع الإلكتروني للجامعة، عُرضت في المؤتمر السنوي لعام 2025 للأميركتين في رابطة اللغويات الحسابية (NAACL).
وفقاً للموقع الإلكتروني للجامعة، طوّر الفريق البحثي، بقيادة الباحث ما بعد الدكتوراه تشُووهان شيه، إطار عمل جديداً يُسمى FIRE (التحقق من الحقائق مع الاسترجاع والتحقق التكراري). يعتمد هذا النهج على تقييم مستوى ثقة النموذج في الادعاءات التي يقدمها، ليحدد ما إذا كانت هناك حاجة للبحث عبر الإنترنت أم يمكن الاعتماد على المعرفة الداخلية للنموذج. هذا الأسلوب لا يقلل فقط من التكاليف المرتبطة بالبحث الخارجي، بل يعزز كفاءة التحقق عبر تخزين المعلومات المستردة لدعم تقييم ادعاءات أخرى ضمن النص نفسه.
يقول شيه: «العديد من الادعاءات بسيطة بما يكفي لعدم الحاجة إلى بحوث إضافية، مما يجعل إطارنا أكثر ديناميكية وقابلية للتوسع». وأظهرت الاختبارات على مجموعات بيانات معيارية أنه تم تقليص تكاليف البحث بمعدل 16.5 مرة، مع الحفاظ على أداء مشابه للأطر الأخرى.
وأشار الباحثون، ومنهم روي شينج وبريسلاف ناكوف
، إلى أن النماذج المتقدمة مثل o1-preview من OpenAI، رغم دقتها العالية، قد لا تكون ضرورية دائماً، حيث حقق FIRE مع نماذج أقل تكلفة توازناً مثالياً بين الأداء والتكلفة. كما كشفت الدراسة عن أخطاء في مجموعات البيانات المعيارية، مما يبرز الحاجة إلى تحسين هذه المعايير لضمان دقة أعلى في العالم الحقيقي، حسبما جاء في تقرير موقع الجامعة.
ويفتح FIRE آفاقاً واعدة لمكافحة المعلومات المغلوطة، ليس فقط في النصوص، بل أيضاً في الصور والفيديوهات، مع إمكانية تطويره لدعم التحقق متعدد الوسائط. ويؤكد شيه أن هذا الابتكار قد يُصبح مصدر معرفة إضافياً يعزز قدرات نماذج اللغة الكبرى، مما يُحدث ثورة في معالجة اللغة الطبيعية.