من مختبرات ديب مايند إلى الذكاء الخارق.. قراءة في تجربة ريفليكشن إيه آي
تاريخ النشر: 6th, December 2025 GMT
في العام الماضي، خرج باحثان من عباءة "غوغل ديب مايند" (Google DeepMind) ليؤسسا شركة صغيرة تحمل اسما رمزيا هو "ريفليكشن إيه آي" (Reflection AI).
ولكن هذا الاسم ليس مجرد شعار، بل تعبير عن فلسفة تقنية جديدة تسعى إلى عكس المسار الحالي للذكاء الاصطناعي، وإعادته من المختبرات المغلقة إلى فضاء الانفتاح والمعرفة التشاركية.
وفي جوهر رؤيتها، تسعى الشركة إلى إعادة الذكاء الاصطناعي إلى جذوره المفتوحة، لأن التعاون العلمي لا يقل أهمية عن الابتكار التقني.
وكما بني الإنترنت على الانفتاح، وازدهر "لينكس" بفضل المشاركة المجتمعية، تؤمن الشركة بأن الذكاء الفائق لن يتحقق إلا إذا ظل علمه متاحا ومفتوحا أمام الجميع.
وتعرف "ريفليكشن إيه آي" نفسها بصفتها البديل المفتوح المصدر للمختبرات المغلقة، مثل "أوبن إيه آي" و "أنثروبيك"، وهي أيضا النسخة الأميركية من "ديب سيك".
ومن خلال وكلاء البرمجة المستقلين، تسعى الشركة إلى تحويل الذكاء الاصطناعي إلى نظام قادر على العمل الذاتي.
تأسست الشركة على يد اثنين من أبرز العلماء في مجال الذكاء الاصطناعي، وهما ميشا لاسكين ويوانيس أنتونوغلو، حيث ساهم أنتونوغلو في تطوير "ألفا غو" (AlphaGo) الذي هزم بطل العالم في لعبة "غو" (Go) عام 2016 بحركة غير تقليدية عرفت بـالحركة 37.
وكانت هذه الحركة دليلا بارزا على قدرة الذكاء الاصطناعي على الإبداع، وبرهنت بشكل عملي على قدرة الذكاء الاصطناعي على التفوق في المهام البشرية المتقدمة.
كما طور أنتونوغلو "ألفا زيرو" (AlphaZero) الذي أتقن الشطرنج والشوجي من خلال اللعب الذاتي ودون توجيه بشري، ومن ثم "مو زيرو" (MuZero) الذي تغلب على ألعاب، مثل "غو" والشطرنج وغيرها بدون معرفة مسبقة بالقوانين.
إعلانفي حين قاد لاسكين نمذجة المكافآت في مشروع "جيميناي" من "ديب مايند"، وركز على تحسين الأداء من خلال التعلم التعزيزي لجعل النماذج أكثر دقة وأمانا، ولعب دورا محوريا في إطلاق نسختيه "1" و"1.5″.
وركز الثنائي ضمن فريق "جيميناي" على تطوير نماذج كبيرة تتكيف مع السيناريوهات من خلال ضبطها عبر التعليم التعزيزي.
وبدافع الاعتقاد بأن شركة مستقلة يمكنها تسريع التطور، ظهرت "ريفليكشن إيه آي"، تتمحور مهمتها حول هدف تطوير وكلاء مستقلين قادرين على الارتقاء مستقبلا إلى مستوى الذكاء الفائق.
ومن أجل بلوغ هذا الهدف المستقبلي، اختارت الشركة نقطة انطلاق واضحة ومحددة، وهي التركيز على وكيل برمجة مستقل، الذي تراه خطوة ضرورية نحو الذكاء الفائق.
وبدأت الشركة مسيرتها كشركة ناشئة، ولكن سرعان ما ارتفعت قيمتها السوقية بعد جولة تمويل كبيرة بقيادة "إنفيديا" ومشاركة إريك شميدت، الرئيس التنفيذي السابق لشركة "غوغل"، مما يعكس الثقة في رؤيتها لبناء ذكاء فائق.
وتركز الشركة على دمج التعلم التعزيزي مع النماذج اللغوية الكبيرة من أجل إنشاء أنظمة مستقلة قادرة على أداء المهام المعقدة دون تدخل بشري، مستمدة قوتها من خبرة فريقها في مشاريع، مثل "بالم" (PaLM) و"شات جي بي تي" (ChatGPT) و"ألفا كود" (AlphaCode) و"ألفا بروف" (AlphaProof) و"كاراكتر إيه آي" (Character AI).
من التجارب في "غوغل ديب مايند"، استخلص المؤسسان أن التعلم من التجربة قد ينتج أداء يفوق القدرات البشرية، وأن الانتقال من المهام المحددة إلى البيئات العامة يتطلب تجميع العمق مع الاتساع.
ونجحت النماذج اللغوية الكبيرة في تحقيق مجموعة واسعة جدا من القدرات، ولكن الكفاءة كانت سطحية، حيث حلت هذه النماذج مشكلة الاتساع، دون أن تحل مشكلة العمق.
وبات واضحا أن هذين المسارين البحثيين هما حجر الأساس لبناء الذكاء الفائق، حيث إن النماذج اللغوية الكبيرة والتعلم التعزيزي هي العناصر اللازمة لبناء وكيل ذكاء فائق يحدث تأثيرا.
ويساعد التعلم التعزيزي في زيادة قدرة الوكيل على التحسن في مهام محددة من خلال تقسيم المشكلات المعقدة إلى خطوات تسمح بمعالجتها بفعالية.
وبخلاف بيانات تدريب النماذج المدرَبة مسبقا، التي قد تنفد، فإن بيانات تدريب التعلم التعزيزي تنشأ إلى حد كبير بواسطة الوكيل نفسه في تفاعلاته مع بيئته.
وبطريقة تشبه التعلم من الأخطاء، فإن الوكيل ينجح في بعض الأمور ويفشل في بعضها الآخر، ويزيد تركيزه على الأمور التي نجح فيها ويقلل تركيزه على الأمور التي فشل فيها، وتؤدي هذه الآلية البسيطة إلى سلوك ذكاء فائق إذا طُبِقت بشكل صحيح.
ويتشابه هذا النهج مع ميزة "ديب ريسيرش" (Deep Research) من "غوغل" أو "أوبن إيه آي"، التي تفحص آلاف المصادر من جميع أنحاء الويب لإنشاء تقارير شاملة حول أي موضوع تقريبا.
"أسيموف".. وكيل البرمجة المستقليقضي المبرمجون نحو 10% من الوقت في كتابة التعليمات البرمجية، في حين يخصصون 70% من الوقت لتعلم الأدوات الجديدة وتصحيح الأخطاء ومراجعة التعليمات البرمجية وتحديث الوثائق.
إعلانوتنظر الشركة إلى البرمجة بصفتها المجال الأمثل لتطوير الذكاء الفائق، وتسعى إلى ابتكار وكلاء برمجة مستقلين قادرين على إنجاز المهام الشاملة بدقة مع التركيز على الموثوقية.
ونتيجة لذلك، ظهر "أسيموف" (Asimov)، وهو وكيل ذكاء اصطناعي لفهم التعليمات البرمجية مخصص لفرق الهندسة.
وتركز معظم أدوات البرمجة بالذكاء الاصطناعي الحالية على توليد التعليمات البرمجية بسرعة بدلا من فهمها، في حين تركز "ريفليكشن إيه آي" على الموثوقية.
ولا يعد "أسيموف" مهندس برمجيات شاملا، بل وكيل مصمم لفرق الهندسة من أجل التعامل مع مجموعات محددة من المهام والأعمال بأداء موثوق به.
وتشمل هذه المهام قراءة وكتابة التعليمات البرمجية، وإدارة البنية التحتية، وإعادة تصميم التعليمات البرمجية القديمة، وإنشاء حالات اختبار وتشغيلها تلقائيا، وتحسين استخدام الذاكرة، وغيرها من الأمور.
وطبقت الشركة التعلم التعزيزي على "أسيموف"، ولكن بدلا من تعليمه كيفية لعب لعبة "غو"، ركزت على تحسين كفاءته في البرمجة من خلال الفهم العميق لمعرفة كل شيء عن كيفية إنشاء التطبيق وسببه.
وعلى عكس المساعدين التقليديين، لا يكتفي "أسيموف" بتوليد التعليمات البرمجية، بل يفهم البيئة بأكملها، ويقرأ البريد الإلكتروني، والمحادثات، والوثائق، ليبني صورة متكاملة عن سياق التطوير قبل كتابة أي سطر برمجي.
وبحسب الشركة، فإن الذكاء الحقيقي لا يكتب التعليمات البرمجية فقط، بل يفهم لماذا وجدت هذه التعليمات البرمجية في الأصل.
ويسعى "أسيموف" إلى بناء ذاكرة دائمة من خلال استيعاب المعلومات من جميع المصادر، وبدلا من مجرد كونه مساعدا لإكمال التعليمات البرمجية، فإنه يندمج في العمل ويتعامل بشكل مستقل مع المهام الواسعة النطاق من البداية إلى النهاية.
ويعتمد "أسيموف" على بنية معالجة متعددة الوكلاء مصممة للتعامل مع كميات كبيرة من المعلومات، حيث يجمع الوكلاء الصغار المعلومات ذات الصلة، في حين يقدم وكيل كبير الإجابات المستندة إلى المصادر.
وتتوقع الشركة أن يتطور "أسيموف" ليصبح بمثابة مرشد برمجي للشركات، مستفيدا من معرفته الشاملة بكل ما تفعله الشركات لبناء برامج ومنتجات جديدة بشكل مستقل نيابة عنها.
ويميز "أسيموف" نفسه بالتركيز على الفهم من خلال اعتماده على نهج التعلم التعزيزي، ويسعى إلى إعادة تعريف مجال البرمجة بالطريقة نفسها التي أعاد فيها "ألفا غو" تعريف مجال الألعاب.
ختاما، من خلال الجمع بين بناء الوكلاء الفائقين ونماذج اللغة الكبيرة والتعلم التعزيزي، تهدف "ريفليكشن إيه آي" إلى حل مشكلة نقطة البداية الصحيحة، مع سعيها إلى تحويل البرمجة إلى بوابة نحو الذكاء الفائق الذي يعزز جميع نواحي الحياة.
المصدر: الجزيرة
كلمات دلالية: دراسات شفافية غوث حريات النماذج اللغویة الکبیرة التعلیمات البرمجیة الذکاء الاصطناعی الذکاء الفائق دیب مایند من خلال فی حین
إقرأ أيضاً:
التجارة: ضبط مصنع يتلاعب بأعداد المناديل الورقية داخل العبوات
ضبطت الفرق الرقابية المشتركة لوزراتي التجارة والصناعة والثروة المعدنية، مصنعاً مخالفاً للمواصفات والمقاييس يقوم بإنقاص أعداد المناديل الورقية داخل العبوات.
جاء ذلك أثناء زيارة مشتركة نفذتها الفرق الرقابية لأحد المصانع في منطقة الرياض، استهدفت الوقوف على جودة المنتجات المصنعة ومطابقتها للمواصفات والمقاييس، وتم سحب عينات من خطوط الإنتاج، وإحالتها إلى مختبرات الفحص المتخصصة تحت إشراف الهيئة السعودية للمواصفات والمقاييس والجودة.
وأظهرت التقارير الفنية الصادرة من مختبرات الهيئة مخالفة المصنع للمواصفات القياسية المعتمدة في المملكة لعدم تطابق عدد المناديل داخل العبوة مع العدد المعلن على المنتج، وجاري اتخاذ الإجراءات النظامية بحق المخالفين لإيقاع العقوبات الرادعة بحقهم.
وتؤكد وزارتا التجارة والصناعة والثروة المعدنية والهيئة السعودية للمواصفات والمقاييس والجودة استمرار جهودها الرقابية التشاركية للحفاظ على جودة المنتجات المتداولة في السوق السعودية، ومكافحة أي ممارسات مضللة، بما يعزز ثقة المستهلك في المنتجات المصنعة محلياً.
الرياضالتجارةأخبار السعوديةآخر أخبار السعوديةقد يعجبك أيضاًNo stories found.