تطور نماذج الذكاء الاصطناعي يعود لتحسن جودة مدربيها البشر
تاريخ النشر: 28th, September 2024 GMT
في السنوات الأولى للذكاء الاصطناعي التوليدي، كان الحصول على نماذج تعمل به مثل "تشات جي.بي.تي" أو منافسه "كوهيري" للوصول إلى ما يشبه الاستجابات البشرية يتطلب فرق عمل كبيرة من أفراد منخفضي الأجور لمساعدة النماذج على التمييز بين الحقائق الأساسية مثل ما إذا كانت الصورة لسيارة أو جزرة.
لكن التحديثات الأكثر تطورا لنماذج الذكاء الاصطناعي التوليدي في ساحة تشهد منافسة شرسة تتطلب الآن شبكة سريعة التوسع من المدربين البشريين ذوي المعرفة المتخصصة، بداية من المؤرخين إلى الخبراء بل والحاصلين على درجات الدكتوراه أحيانا.
وقال إيفان تشانج المؤسس المشارك لشركة "كوهيري" في كلمة عن المدربين البشريين الداخليين "قبل عام واحد، كان بوسعنا أن ننجح عبر توظيف طلاب جامعيين لتعليم (نماذج) الذكاء الاصطناعي بشكل عام كيف تحسن أداءها".
وأضاف: "الآن لدينا أطباء يحملون تراخيص يعلمون النماذج كيفية التصرف في المواقف المتعلقة بالطب، أو محللون ماليون أو محاسبون".
وللمزيد من التدريب تتعاون "كوهيري"، التي قُدرت قيمتها في الآونة الأخيرة بأكثر من خمسة مليارات دولار، مع شركة "إنفيزيبل تك" الناشئة.
و"كوهيري" من المنافسين الرئيسيين لشركة "أوبن إيه.آي"، وهي متخصصة في توفير نماذج الذكاء الاصطناعي للشركات.
وتوظف شركة "إنفيزيبل تك" آلاف المدربين الذين يعملون عن بعد، وصارت من الشركاء الرئيسيين لشركات الذكاء الاصطناعي بداية من "إيه.آي21" إلى "ميكروسوفت"، إذ تعمل على تدريب نماذج الذكاء الاصطناعي التي تطورها هذه الشركات لتقليل الأخطاء المعروفة في عالم الذكاء الاصطناعي بـ"الهلوسة".
وتصل أجور العاملين لدى "إنفيزيبل" إلى 40 دولارا في الساعة، اعتمادا على موقع الموظف وصعوبة المهمة. وتدفع بعض الشركات مثل "أوتلاير" ما يصل إلى 50 دولارا في الساعة، بينما قالت شركة أخرى تسمى "ليبل بوكس" إنها تدفع ما يصل إلى 200 دولار في الساعة للمواد "التي تتطلب خبرة كبيرة" مثل الفيزياء الكمية، لكن الأجور لديها تبدأ من 15 دولارا للساعة بالنسبة للمهام المتعلقة بالمحتوى العادي.
وتقدم نماذج الذكاء الاصطناعي التوليدي محتوى جديدا بناء على البيانات المستخدمة سابقا في تدريبها. ومع ذلك ففي بعض الأحيان لا يمكنها التمييز بين المعلومات الحقيقية والكاذبة وبالتالي تقدم مخرجات كاذبة تُعرف بـ"الهلوسة".
ودخل المدربون البشريون لأول مرة إلى مجال تدريب نماذج الذكاء الاصطناعي من أجل مهام تصنيف البيانات والتي تتطلب مؤهلات أقل وكانوا يتقاضون أجرا أقل أيضا، أحيانا تصل إلى دولارين فقط في الساعة، وكانوا في الغالب من دول أفريقية وآسيوية.
ومع إطلاق شركات الذكاء الاصطناعي لنماذج أكثر تقدما، يتزايد الطلب على المدربين المتخصصين وبعشرات اللغات، وبالتالي ارتفعت الأجور وصار بإمكان أفراد من مجالات متنوعة أن يصبحوا مدربين لنماذج الذكاء الاصطناعي دون حتى معرفة كيفية البرمجة.
المصدر: عربي21
كلمات دلالية: سياسة اقتصاد رياضة مقالات صحافة أفكار عالم الفن تكنولوجيا صحة تفاعلي سياسة اقتصاد رياضة مقالات صحافة أفكار عالم الفن تكنولوجيا صحة تفاعلي تكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا البشرية الذكاء الاصطناعي تكنولوجيا بشر ذكاء اصطناعي المزيد في تكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا سياسة سياسة تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا سياسة اقتصاد رياضة صحافة أفكار عالم الفن تكنولوجيا صحة نماذج الذکاء الاصطناعی فی الساعة
إقرأ أيضاً:
الذكاء الاصطناعي يوجه المسيّرات رغم العوائق الطبيعية
في مهمة لإطفاء حرائق الغابات في سلسلة جبال سييرا نيفادا، قد تجد طائرة مسيّرة ذاتية التحكم نفسها تواجه رياح «سانتا آنا» العاتية التي تهدد بإخراجها عن مسارها. التكيف السريع مع مثل هذه التقلبات الجوية غير المتوقعة أثناء الطيران يمثل تحديًا هائلًا لأنظمة التحكم في وضع الطيران الخاصة بهذه الطائرات.
ولمواجهة مثل هذه التحديات، طوّر باحثون في معهد ماساتشوستس للتكنولوجيا «MIT» خوارزمية تحكم تفاعلي جديدة تعتمد على تقنيات تعلّم الآلة، قادرة على تقليل انحراف الطائرة عن مسارها المحدد حتى في مواجهة عوائق مفاجئة مثل هبوب الرياح.
وعلى عكس الطرق التقليدية، لا تتطلب هذه التقنية من المبرمج أن يكون على دراية مسبقة ببنية أو نمط هذه الاضطرابات. بدلاً من ذلك، يتعلم نموذج الذكاء الاصطناعي المستخدم في نظام التحكم كل ما يحتاجه من خلال بيانات ملاحظة تُجمع خلال 15 دقيقة فقط من الطيران.
الميزة الأبرز لهذه التقنية تكمن في أنها تحدد تلقائيًا خوارزمية التحسين الأمثل للتكيف مع هذه الاضطرابات، مما يعزز من دقة تتبع المسار. إذ تختار الخوارزمية الأنسب بحسب طبيعة الاضطرابات التي تواجهها الطائرة في كل حالة.
وقد درّب الباحثون نظامهم على تنفيذ هذين الأمرين معًا، التكيّف وتحديد الخوارزمية باستخدام تقنية تُعرف باسم التعلم الفوقي «meta-learning»، والتي تُعلّم النظام كيفية التكيّف مع أنواع مختلفة من الاضطرابات.
النتائج جاءت واعدة، إذ سجل النظام الجديد نسبة خطأ في تتبع المسار أقل بنسبة 50% مقارنة بالطرق التقليدية، سواء في المحاكاة أو في الظروف الحقيقية، كما أثبت كفاءته في التعامل مع سرعات رياح لم يسبق له مواجهتها أثناء التدريب.
يأمل الباحثون أن يُسهم هذا النظام مستقبلاً في تحسين كفاءة الطائرات المسيّرة في توصيل الطرود الثقيلة رغم الرياح القوية، أو في مراقبة المناطق المعرضة للحرائق في المحميات الطبيعية.
يقول نافيد عزيزيان، الأستاذ المساعد في قسم الهندسة الميكانيكية ومعهد البيانات والنظم والمجتمع «IDSS» بمعهد «MIT»، والباحث الرئيسي للدراسة: «قوة طريقتنا تكمن في التعلم المتزامن لمكونات النظام. من خلال الاستفادة من التعلم الفوقي، يتمكن نظامنا من اتخاذ قرارات تلقائية تحقق أفضل تكيف ممكن في وقت قصير».
شارك عزيزيان في إعداد الورقة البحثية كل من سونبوتشين تانغ، طالب دراسات عليا في قسم الطيران والفضاء، وهاويان صن، طالب دراسات عليا في قسم الهندسة الكهربائية وعلوم الحاسوب. وقد عُرض البحث مؤخراً في مؤتمر «التعلم للديناميكيات والتحكم»
التعلم على التكيف
تتغير سرعات الرياح التي قد تواجهها الطائرة في كل رحلة، لكن من المفترض أن تبقى الشبكة العصبية ودالة الانحدار المستخدمة ثابتتين، لتجنّب إعادة التدريب في كل مرة.
لتحقيق هذه المرونة، اعتمد الباحثون على التعلم الفوقي، ودربوا النظام على مجموعة من سيناريوهات الرياح المختلفة أثناء مرحلة التدريب.
يوضح تانغ: «الهدف ليس فقط أن يتكيف النظام، بل أن يتعلم كيف يتعلم. عبر التعلم الفوقي، يمكننا إنشاء تمثيل مشترك من بيانات متعددة السيناريوهات بسرعة وكفاءة».
في التطبيق العملي، يقوم المستخدم بتغذية نظام التحكم بمسار الطيران المطلوب، ويقوم النظام بحساب قوة الدفع اللازم في الزمن الحقيقي لإبقاء الطائرة على المسار رغم أي اضطرابات جوية.
وقد أثبت النظام كفاءته سواء في المحاكاة أو في اختبارات حقيقية، حيث تفوق على جميع الطرق التقليدية في تتبع المسار، حتى في الظروف الجوية القاسية.
يضيف عزيزيان: «حتى عندما تجاوزت قوة الرياح مستويات لم نشهدها في التدريب، أثبتت تقنيتنا قدرتها على التعامل معها بكفاءة».
واللافت أن تفوق النظام على الطرق الأخرى ازداد كلما زادت شدة الرياح، مما يدل على قدرته على التكيف مع البيئات الصعبة.
ويجري الفريق الآن تجارب ميدانية على طائرات مسيّرة حقيقية لاختبار النظام في مواجهة ظروف جوية متنوعة.
كما يسعى الفريق لتوسيع قدرات النظام ليتعامل مع اضطرابات متعددة المصادر في وقت واحد. فعلى سبيل المثال، تغير سرعة الرياح قد يغيّر من توزيع وزن الحمولة أثناء الطيران، خصوصاً عند حمل مواد سائلة.
كما يطمح الباحثون إلى تطوير خاصية التعلم المستمر، بحيث يتمكن النظام من التكيف مع اضطرابات جديدة دون الحاجة إلى إعادة تدريبه على البيانات السابقة.
وفي تعليق على البحث، قال بروفيسور باباك حسّیبي من معهد كاليفورنيا للتكنولوجيا «Caltech»، والذي لم يشارك في المشروع: «نجح نافيد وزملاؤه في الجمع بين التعلم الفوقي والتحكم التكيفي التقليدي، لتعلم الخصائص غير الخطية من البيانات. واستخدامهم لخوارزميات الانحدار المرآتي مكّنهم من استغلال البنية الجيومترية الكامنة للمشكلة بشكل لم تفعله الطرق السابقة. وهذا العمل قد يساهم بشكل كبير في تصميم أنظمة ذاتية التشغيل تعمل بكفاءة في بيئات معقدة وغير مؤكدة».
وقد حصل هذا البحث على دعم من عدة جهات، منها شركة «MathWorks»، ومختبر «MIT-IBM Watson» للذكاء الاصطناعي، ومركز «MIT-Amazon» للعلوم، وبرنامج «MIT-Google» للابتكار في الحوسبة.