كشفت Google يوم الخميس النقاب عن Gemini 1.5 Pro، والذي تصفه الشركة بأنه يقدم "أداء محسنًا بشكل كبير" مقارنة بالطراز السابق. يتبع مسار الذكاء الاصطناعي للشركة - الذي يُنظر إليه داخليًا على أنه بالغ الأهمية لمستقبلها - الكشف عن Gemini 1.0 Ultra الأسبوع الماضي، إلى جانب تغيير العلامة التجارية لـ Bard chatbot (إلى Gemini) لتتماشى مع قدرات النموذج الجديد الأكثر قوة وتنوعًا.

في منشور مدونة إعلاني، يحاول ساندر بيتشاي، الرئيس التنفيذي لشركة Google، وديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، تحقيق التوازن بين طمأنة جمهورهما حول السلامة الأخلاقية للذكاء الاصطناعي مع الترويج لقدرات نماذجهما سريعة التطور. ولخص بيتشاي قائلاً: "تواصل فرقنا دفع حدود أحدث موديلاتنا مع مراعاة السلامة في جوهرها".

تحتاج الشركة إلى التأكيد على سلامة المتشككين في الذكاء الاصطناعي (بما في ذلك أحد المديرين التنفيذيين السابقين لشركة جوجل) والجهات التنظيمية الحكومية. ولكنها تحتاج أيضًا إلى التأكيد على الأداء المتسارع لنماذجها لمطوري الذكاء الاصطناعي والعملاء المحتملين والمستثمرين الذين يشعرون بالقلق من أن الشركة كانت بطيئة جدًا في الاستجابة لنجاح OpenAI مع ChatGPT.

يقول Pichai وHassabis إن Gemini 1.5 Pro يقدم نتائج مماثلة لـ Gemini 1.0 Ultra. ومع ذلك، يعمل Gemini 1.5 على هذا المستوى بكفاءة أكبر، مع انخفاض المتطلبات الحسابية. تتضمن إمكانيات الوسائط المتعددة معالجة النصوص أو الصور أو مقاطع الفيديو أو الصوت أو التعليمات البرمجية. مع تقدم نماذج الذكاء الاصطناعي، ستستمر في تقديم مجموعة أكثر تنوعًا من الإمكانات في مربع مطالبة واحد (مثال حديث آخر هو دمج OpenAI لإنشاء صور DALL-E 3 في ChatGPT).
يمكن لـ Gemini 1.5 Pro أيضًا التعامل مع ما يصل إلى مليون رمز مميز، أو يمكن لوحدات نماذج البيانات التي تعمل بالذكاء الاصطناعي معالجتها في طلب واحد. تقول Google إن Gemini 1.5 Pro يمكنه معالجة أكثر من 700000 كلمة وساعة من الفيديو و11 ساعة من الصوت وقواعد التعليمات البرمجية مع أكثر من 30000 سطر من التعليمات البرمجية. وتقول الشركة إنها "اختبرت بنجاح" إصدارًا يدعم ما يصل إلى 10 ملايين رمز مميز.

تقول الشركة إن Gemini 1.5 Pro يحافظ على دقة عالية في الاستعلامات ذات أعداد الرموز المميزة الأكبر عندما يكون لديه المزيد من البيانات الجديدة ليتعلمها. يُقال أن النموذج أعجب بتقييم Needle In a Haystack. في هذا الاختبار، يقوم المطورون بإدراج جزء صغير من المعلومات داخل كتلة نصية طويلة لمعرفة ما إذا كان نموذج الذكاء الاصطناعي يمكنه التقاطها. قالت Google إن Gemini 1.5 Pro يمكنه العثور على النص المضمن بنسبة 99 بالمائة من الوقت في كتل البيانات التي يصل طولها إلى مليون رمز مميز.

تقول Google إن Gemini 1.5 Pro يمكنه التفكير في تفاصيل مختلفة من نصوص مهمة القمر Apollo 11 المؤلفة من 402 صفحة. بالإضافة إلى ذلك، يمكنه تحليل نقاط الحبكة والأحداث من فيلم صامت مدته 44 دقيقة تم تحميله من بطولة باستر كيتون. كتب هاسابيس: "نظرًا لأن نافذة السياق الطويلة لـ 1.5 Pro هي الأولى من نوعها بين النماذج واسعة النطاق، فإننا نعمل باستمرار على تطوير تقييمات ومعايير جديدة لاختبار قدراتها الجديدة".

تطلق Google برنامج Gemini 1.5 Pro بقدرات 128000 رمز، وهو نفس العدد الذي تصل إليه نماذج GPT-4 الخاصة بـ OpenAI (المعلن عنها علنًا). يقول هاسابيس إن جوجل ستقدم في النهاية مستويات تسعير جديدة تدعم ما يصل إلى مليون استعلام مميز.
يعد Gemini 1.5 Pro أيضًا بارعًا في تعلم مهارات جديدة من المعلومات في مطالبات طويلة - دون ضبط إضافي ("التعلم في السياق"). وفي اختبار قياسي يسمى الترجمة الآلية من كتاب واحد، تعلم النموذج دليلًا نحويًا للغة كالامانج، وهي لغة يتحدث بها أقل من 200 متحدث على مستوى العالم ولم يتم التدريب عليها من قبل. وتقول الشركة إن Gemini 1.5 Pro تعلم الأداء بمستوى مماثل حيث يتعلم الإنسان نفس المحتوى عند ترجمة اللغة الإنجليزية إلى Kalamang.

وفي جزء من الإعلان الذي سيلفت انتباه المطورين، تقول Google إن Gemini 1.5 Pro يمكنه أداء مهام حل المشكلات عبر كتل تعليمات برمجية أطول. كتب هاسابيس: "عندما تُعطى مطالبة تحتوي على أكثر من 100000 سطر من التعليمات البرمجية، يمكنها التفكير بشكل أفضل عبر الأمثلة، واقتراح تعديلات مفيدة وتقديم تفسيرات حول كيفية عمل أجزاء مختلفة من التعليمات البرمجية".

وعلى صعيد الأخلاقيات والسلامة، تقول جوجل إنها تتبع "نفس النهج تجاه المسئولين".

"العمل" الذي استغرقته نماذج Gemini 1.0. ويتضمن ذلك تطوير وتطبيق تقنيات الفريق الأحمر، حيث تعمل مجموعة من المطورين الأخلاقيين في الأساس كمدافعين عن الشيطان، ويختبرون "مجموعة من الأضرار المحتملة". بالإضافة إلى ذلك، تقول الشركة إنها تقوم بتدقيق شديد في مجالات مثل سلامة المحتوى والأضرار التمثيلية. وتقول الشركة إنها تواصل تطوير اختبارات أخلاقية وسلامة جديدة لأدوات الذكاء الاصطناعي الخاصة بها.

تطلق Google إصدار Gemini 1.5 للوصول المبكر للمطورين وعملاء المؤسسات. وتخطط الشركة لجعله متاحًا على نطاق أوسع في نهاية المطاف. يتوفر Gemini 1.0 حاليًا للمستهلكين، إلى جانب الإصدار Pro الذي يكلف 20 دولارًا شهريًا.

المصدر: بوابة الوفد

إقرأ أيضاً:

هل يُعلن الذكاء الاصطناعي نهاية الفأرة ولوحة المفاتيح؟

مع تسارع تطور تقنيات الذكاء الاصطناعي، أصبح بإمكان المستخدم تنفيذ مهام معقدة عبر الأوامر الصوتية فقط، من حجز تذاكر السفر وحتى التنقل بين نوافذ المتصفح. غير أن هذا التقدم اللافت يثير سؤالًا جوهريًا: هل يمكن للذكاء الاصطناعي أن يستغني بالفعل عن لوحة المفاتيح والفأرة؟ يبدو أن الإجابة تكمن في ما يُعرف بـ"الخطوة الأخيرة" تلك اللحظة الحاسمة التي تتطلب تأكيدًا نهائيًا بكلمة مرور أو نقرة زر، حيث يعود زمام التحكم إلى الإنسان.

حدود الثقة

رؤية مساعد ذكي مثل Gemini من Google وهو يحجز تذاكر مباراة في ملعب أنفيلد أو يملأ بيانات شخصية في نموذج على موقع ويب، قد تبدو أقرب إلى السحر الرقمي. لكن عندما يتعلق الأمر بلحظة إدخال كلمة المرور، فإن معظم المستخدمين يتراجعون خطوة إلى الوراء. في بيئة عمل مفتوحة، يصعب تخيل أحدهم يملي كلمة سر بصوت مرتفع أمام زملائه. في تلك اللحظة الدقيقة، تعود اليد البشرية إلى لوحة المفاتيح كضمان أخير للخصوصية والسيطرة.


 

اقرأ أيضاً..Opera Neon.. متصفح ذكي يُنفّذ المهام بدلاً عنك

الخطوة الأخيرة

رغم ما وصلت إليه المساعدات الذكية من كفاءة، إلا أن كثيرًا من العمليات لا تزال تتعثر عند نهايتها. إدخال كلمة مرور، تأكيد عملية دفع، أو اتخاذ قرار حساس — كلها لحظات تتطلب لمسة بشرية نهائية. هذه المعضلة تُعرف بين الخبراء بمشكلة "الميل الأخير"، وهي العقبة التي تؤخر الوصول إلى أتمتة كاملة وسلسة للتجربة الرقمية.

سباق الشركات نحو تجاوز العجز

تحاول شركات التكنولوجيا الكبرى كسر هذا الحاجز عبر مشاريع طموحة. كشفت  Google عن Project Astra وProject Mariner، وهي مبادرات تهدف إلى إلغاء الحاجة للنقر أو الكتابة يدويًا وذلك بحسب تقرير نشره موقع Digital Trends. في المقابل، يعمل مساعد Claude من شركة Anthropic على تنفيذ الأوامر من خلال الرؤية والتحكم الذكي، حيث يراقب المحتوى ويتفاعل كما لو كان مستخدمًا بشريًا.

أخبار ذات صلة Perplexity تطلق نماذج ذكاء اصطناعي متطورة للمشتركين مليار مستخدم لأداة «ميتا» الذكية

أما Apple فتعوّل على تقنية تتبع العين في نظارة Vision Pro، لتتيح للمستخدم التنقل والتفاعل بمجرد النظر. بينما تراهن Meta على السوار العصبي EMG، الذي يترجم الإشارات الكهربائية من المعصم إلى أوامر رقمية دقيقة، في محاولة لصياغة مستقبل دون لمس فعلي.


 

 

ثورة سطحية


رغم هذا الزخم، ما يتم تقديمه حتى الآن لا يبدو كاستبدال حقيقي للأدوات التقليدية، بل أقرب إلى إعادة صياغة شكلية لها. لوحة المفاتيح أصبحت افتراضية، والمؤشر تحوّل إلى عنصر يتحكم به بالبصر أو الإيماءات، لكن جوهر التفاعل بقي على حاله. هذه التقنية تحاكي الوظائف التقليدية بواجهات جديدة دون أن تتجاوزها كليًا.

 

الطموح يصطدم بالواقع


تجدر الإشارة إلى أن معظم هذه التقنيات لا تزال إما في طور التطوير أو محصورة في أجهزة باهظة الثمن ومحدودة الانتشار. كما أن المطورين لم يتبنّوا بعد واجهات تتيح الاعتماد الكامل على الأوامر الصوتية أو التفاعل بالإشارات داخل التطبيقات الشائعة، ما يجعل الانتقال الكامل بعيدًا عن أدوات الإدخال التقليدية حلمًا مؤجلًا في الوقت الراهن.

 

 

الذكاء الاصطناعي.. شريك لا بديل


في نهاية المطاف، لا يبدو أن الذكاء الاصطناعي سيقضي على لوحة المفاتيح أو الفأرة في القريب العاجل. هو بالتأكيد يقلل من اعتمادية المستخدم عليهما، ويقدّم بدائل ذكية وسريعة، لكنه لا يلغي الحاجة إلى التحكم اليدوي، خاصة في المواقف التي تتطلب دقة أو خصوصية أو مسؤولية مباشرة. ربما نصل يومًا إلى تجربة صوتية كاملة تتفاعل مع نظراتنا وحركاتنا، لكن حتى ذلك الحين، سنبقى نضغط الأزرار ونحرّك المؤشرات بحذر وثقة.



إسلام العبادي(أبوظبي)

مقالات مشابهة

  • برلمانية: نحتاج معهد عالي للذكاء الاصطناعي
  • سامسونج قد تدمج تقنيات Perplexity للذكاء الاصطناعي في هواتفها المقبلة
  • لا للاعتماد على الذكاء الاصطناعي في الأحكام الشرعية بماليزيا
  • الأكاديمية العربية تستضيف اجتماع فريق العمل العربي للذكاء الاصطناعي
  • من غير نِت.. جوجل تطلق تطبيقا لتشغيل الذكاء الاصطناعي على هاتفك
  • فيلم «الرمز 8».. الذكاء الاصطناعي يشعل الصراع بين ذوي القدرات الخارقة
  • هل يصبح الخليج قوة عظمى في الذكاء الاصطناعي؟
  • خبراء: الذكاء الاصطناعي لا يهدد الوظائف
  • الإمارات تطلق البرنامج التدريبي للرؤساء التنفيذيين للذكاء الاصطناعي
  • هل يُعلن الذكاء الاصطناعي نهاية الفأرة ولوحة المفاتيح؟