صحيفة الاتحاد:
2025-12-09@05:51:41 GMT

الذكاء الاصطناعي يحدد الأشياء في الصور بدقة

تاريخ النشر: 16th, October 2025 GMT

طور باحثون أميركيون طريقة تدريب جديدة تُعلّم نماذج الذكاء الاصطناعي المولدة للرؤية واللغة تحديد موقع كائن مخصص، مثل قطة أو جهاز داخل غرفة في مشهد جديد.
يسهل على صاحب كلب، مثلا، تحديد هوية كلبه من بين كلاب أخرى في موقع. لكن إذا أراد شخص ما استخدام نموذج ذكاء اصطناعي توليدي مثل GPT-5 لمراقبة حيوانه الأليف أثناء وجوده في العمل، فقد يفشل النموذج في التعرف على الحيوان.

غالبًا ما تتفوق نماذج الرؤية واللغة في التعرف على الأشياء العامة، مثل كلب أو قط أو سيارة في مشهد، لكنها لا تُجيد تحديد مواقع الأشياء المُخصّصة، مثل كلب بعينه.
لمعالجة هذا القصور، قدّم باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) ومختبر الذكاء الاصطناعي MIT-IBM Watson طريقة تدريب جديدة تُعلّم نماذج الرؤية واللغة تحديد مواقع الأشياء والحيوانات المُخصصة في مشهد ما.
تستخدم طريقتهم بيانات تتبع فيديو مُعدّة بعناية، حيث يتم تتبّع الشيء نفسه عبر إطارات متعددة. صمموا مجموعة البيانات بحيث يركز النموذج على الأدلة السياقية لتحديد الكائن المُخصَّص، بدلاً من الاعتماد على المعرفة التي حفظها سابقًا.
عند عرض بعض الصور النموذجية التي تُظهر كائنًا مُخصَّصًا، مثل حيوان أليف لشخص ما، يكون النموذج المُعاد تدريبه أكثر قدرة على تحديد موقع الحيوان الأليف نفسه في صورة جديدة.
تفوقت النماذج المُعاد تدريبها باستخدام طريقتهم على الأنظمة الحديثة في هذه المهمة. والأهم من ذلك، أن أسلوبهم لا يمسّ بقية القدرات العامة للنموذج.
يمكن أن يساعد هذا النهج الجديد أنظمة الذكاء الاصطناعي المستقبلية على تتبع كائنات مُحددة عبر الزمن، مثل حقيبة ظهر طفل، أو تحديد مواقع كائنات مهمة، مثل نوع من الحيوانات قيد الرصد البيئي. كما يُمكن أن يُسهم في تطوير تقنيات مُساعدة تعتمد على الذكاء الاصطناعي تُساعد ضعاف البصر في العثور على عناصر مُحددة في الغرفة.
اقرأ أيضا... الذكاء الاصطناعي ينجح في تصنيف الأجرام النجمية
يقول جيهانزيب ميرزا، باحث في معهد ماساتشوستس للتكنولوجيا ومؤلف رئيسي لورقة بحثية حول هذه التقنية "في نهاية المطاف، نريد أن تكون هذه النماذج قادرة على التعلم من السياق، تمامًا كما يفعل البشر. إذا استطاع النموذج القيام بذلك بشكل جيد، فبدلاً من إعادة تدريبه لكل مهمة جديدة، يمكننا فقط تقديم بعض الأمثلة، وسيستنتج كيفية أداء المهمة من هذا السياق. هذه قدرة فعّالة للغاية".
وجد الباحثون أن نماذج اللغة الكبيرة تتفوق في التعلم من السياق. إذا زودوا نموذج لغة كبير ببعض الأمثلة على مهمة ما، مثل مسائل الجمع، سيتمكن من تعلم حل مسائل جديدة بناءً على السياق المُقدم.
نموذج الرؤية واللغة (VLM) هو في الأساس نموذج لغة كبير مُتصل به مكون بصري. لذلك، اعتقد باحثو معهد ماساتشوستس للتكنولوجيا أنه سيتحلى بقدرات التعلم السياقية لنموذج لغة كبير. لكن هذا ليس صحيحًا.
يقول ميرزا "لم يتمكن مجتمع البحث من إيجاد إجابة قاطعة لهذه المشكلة تحديدًا حتى الآن".
شرع الباحثون في تحسين قدرات نماذج الرؤية واللغة على تحديد المواقع السياقية، والذي يتضمن العثور على كائن محدد في صورة جديدة. ركزوا على البيانات المستخدمة لإعادة تدريب نماذج الرؤية واللغة الحالية لمهمة جديدة، وهي عملية تُسمى "الضبط الدقيق".
تُجمع بيانات الضبط الدقيق النموذجية من مصادر عشوائية، وتُمثل مجموعات من الأشياء اليومية. قد تحتوي إحدى الصور على سيارات متوقفة في الشارع، بينما تحتوي صورة أخرى على باقة أزهار.
يضيف ميرزا "لا يوجد ترابط حقيقي في هذه البيانات. لذا، لا يتعلم النموذج أبدًا التعرف على الشيء نفسه في صور متعددة".
ولحل هذه المشكلة، طوّر الباحثون مجموعة بيانات جديدة من خلال تجميع عينات من بيانات تتبع الفيديو الموجودة. هذه البيانات عبارة عن مقاطع فيديو تُظهر الشيء نفسه وهو يتحرك في مشهد ما، مثل نمر يمشي عبر أرض عشبية.
قاموا بقص إطارات من هذه الفيديوهات وهيكلة مجموعة البيانات بحيث يتكون كل مُدخل من صور متعددة تُظهر الشيء نفسه في سياقات مختلفة، مع أمثلة على أسئلة وأجوبة حول موقعه.
ويوضح ميرزا "باستخدام صور متعددة لنفس الشيء في سياقات مختلفة، نشجع النموذج على تحديد موقع الشيء محل الاهتمام باستمرار من خلال التركيز على السياق".
مصطفى أوفى (أبوظبي)

أخبار ذات صلة احفظ صورك على سناب شات مجاناً وبخطوة بسيطة! سورا 2.. يحول صورك وصوتك إلى فيديوهات إبداعية بالذكاء الاصطناعي

المصدر: صحيفة الاتحاد

كلمات دلالية: الصور الذكاء الاجتماعي الذکاء الاصطناعی الشیء نفسه فی مشهد

إقرأ أيضاً:

يشبه الألماس.. هذا المبنى في الصين صُمم بمساعدة الذكاء الاصطناعي

دبي، الإمارات العربية المتحدة (CNN) -- شيّدت على ضفاف نهر "هوانغبو" في مدينة شنغهاي الصينية بنية داكنة تشبه الألماس. تتلألأ نهارًا وتغدو سوداء بعد غروب الشمس، وتستحضر واجهتها الزجاجية هندسة الأحجار الكريمة المنحنية. لكن هذا الشكل النحتي ليس متجذرًا في الطبيعة ولا حتى من تصميم البشر بشكل كامل.

إنه جزئيًا، على الأقل، نتاج الذكاء الاصطناعي.

ويعد مركز مؤتمرات "ويست بوند" تحفة جديدة في حي كان صناعيًا سابقًا بشنغهاي، ويشكل الآن محور جهود الصين نحو التفوق في مجال الذكاء الاصطناعي. 

ويستضيف حي "ويست بوند" بالفعل ناطحة السحاب المسماة بشكل مناسب "برج الذكاء الاصطناعي"، و"وادي الذكاء الاصطناعي" الذي يمتد على مساحة 92،903 متر مربع، الذي من المتوقع أن يضم يومًا ما شركات تقنية بقيمة إجمالية تبلغ 14 مليار دولار.

لذلك، عندما تم تكليف مكتب العمارة الأمريكي Skidmore, Owings & Merrill (SOM) بتصميم مقر هناك للمؤتمر السنوي العالمي للذكاء الاصطناعي، أحد أكبر الفعاليات في هذا المجال، بدا من الطبيعي استخدام الذكاء الاصطناعي في التصميم.

وقال شريك التصميم سكوت دانكان في مكالمة فيديو من شيكاغو، حيث مقر الشركة: "كان لدينا الرؤية لاستخدام الذكاء الاصطناعي بالفعل كعامل رئيسي للتعبير عن المبنى". 

واستضاف المكان أول مؤتمر للذكاء الاصطناعي في يوليو/ تموز الماضي، رغم أنه كان لا يزال قيد الإنشاء، وتم الانتهاء منه في أكتوبر/ تشرين الأول الماضي.

لأسباب عملية وأخلاقية على حد سواء، كان قطاع العمارة، حتى الآن، محافظًا تجاه التصميم المدعوم بالذكاء الاصطناعي. لكن شركة "SOM" التي صممت بعضًا من أشهر ناطحات السحاب في الصين، هي بين عدد متزايد من الممارسات التي تستخدم هذه التقنية لتوفير الوقت، وتقليل الهدر، وحل المشاكل التصميمية المعقدة.

بعض من مئات المقترحات التي تم توليدها بواسطة الذكاء الاصطناعي، كل منها يقدم حلاً مختلفًا بشكل طفيف لأهداف التصميم التي وضعها المعماريون للمبنىCredit: SOM

وعوض منح الذكاء الاصطناعي الحرية الإبداعية الكاملة، يقوم المعماريون بتكليفه بمهام محددة جدًا، مع وضع معايير ثابتة، ثم يتركونه لإنتاج مئات، بل آلاف، الحلول الممكنة.

بالنسبة لواجهة مركز مؤتمرات "ويست باند"، على سبيل المثال، بدأ فريق التصميم بتحديد القيود التي عملت كـ"قواعد" للذكاء الاصطناعي بدءًا من أبعاد الموقع إلى ارتفاع غرف الاجتماعات. ثم قام المعماريون بتطوير خوارزميات حول 6 أهداف رئيسية هي تحسين مناظر السكان، وزيادة مساحة الطبقات، وزيادة كمية ضوء الشمس الذي يصل إلى الواجهة، من بين أمور أخرى.

ويمكن أن تتعارض مثل هذه الأهداف مع بعضها. فمثلاً، قد يؤدي تغيير زاوية لوح زجاجي إلى تحسين المناظر، لكنّه قد يُقلّل أيضًا من التعرّض لأشعة الشمس. لكن من خلال عملية تسمى "التحسين متعدد الأهداف"، يمكن للذكاء الاصطناعي أن يُحلّل أفضل التسويات الممكنة. 

وبعد ترك الخوارزميات "لتفكر" طوال الليل، استيقظ معماريو "SOM" ليجدوا مئات المقترحات المختلفة بشكل طفيف، كل واحدة منها مُقيّمة وفق أهدافهم. 

مقالات مشابهة

  • قطر تطلق شركة متخصصة في تكنولوجيا الذكاء الاصطناعي
  • ترامب: سأوقع أمرًا تنفيذيًا حول الذكاء الاصطناعي قريبًا
  • الإمارات تقود المنطقة في تبنِّي الذكاء الاصطناعي بالمتاجر الإلكترونية
  • بالأسود اللامع.. سارة سلامة بجلسة تصوير جديدة في عيد ميلادها
  • الذكاء الاصطناعي يحوّل أوامر صوتية إلى أشياء واقعية
  • فحوصات جديدة لنجم الزمالك قبل تحديد موعد عودته
  • عراب الذكاء الاصطناعي يؤكد: غوغل سوف تفوز بسباق الذكاء الاصطناعي
  • ملخص صور جوجل يعرض ذكريات 2025 عبر الذكاء الاصطناعي
  • كيف تستخدم مصر الذكاء الاصطناعي في مكافحة الجرائم؟
  • يشبه الألماس.. هذا المبنى في الصين صُمم بمساعدة الذكاء الاصطناعي