نموذج ذكاء اصطناعي يتعلم كالبشر عبر الصوت والصورة
تاريخ النشر: 29th, May 2025 GMT
يتميز البشر بقدرتهم الطبيعية على التعلم من خلال الربط بين حاستي السمع والبصر. على سبيل المثال، يمكننا مشاهدة عازف تشيلو وندرك أن الحركات التي يؤديها تولّد الموسيقى التي نسمعها.
وفي هذا السياق، طور باحثون من معهد «MIT» للتكنولوجيا بالتعاون مع مؤسسات أخرى نهجًا جديدًا يُمكّن نماذج الذكاء الاصطناعي من التعلم عبر الربط بين الصوت والصورة، تمامًا كما يفعل البشر.
النموذج الجديد، المسمى «CAV-MAE Sync»، يعتمد على تدريب خالٍ من الإشراف البشري، حيث يتعلم مطابقة الإطارات المرئية مع الأصوات المصاحبة بدقة أكبر. وقد أدت تعديلات معمارية على النموذج إلى تحسين أدائه في تصنيف المشاهد واسترجاع الفيديوهات بناءً على استعلامات صوتية.
تؤكد النتائج أن النموذج الجديد يتفوق على نماذج أخرى أكثر تعقيدًا، ما يشير إلى إمكانية توسيع استخداماته مستقبلاً، خاصة مع دمجه بقدرات معالجة نصوص تمهيدًا لتطوير نماذج لغوية متعددة الوسائط.
وقد تم دعم هذا العمل من قبل وزارة التعليم والبحث الفيدرالية الألمانية، ومختبر MIT-IBM Watson للذكاء الاصطناعي. أخبار ذات صلة
المصدر: صحيفة الاتحاد
كلمات دلالية: المحتوى الرقمي السينما الذكاء الاصطناعي الصحافة صناعة الأفلام التكنولوجيا
إقرأ أيضاً:
كيف تحرك أشباه البشر الأوائل بين الأشجار؟.. دروس من شمبانزي تنزانيا
#سواليف
تابع #علماء من معهد ماكس بلانك للأنثروبولوجيا التطورية مجموعة برية من #الشمبانزي في وادي عيسى بتنزانيا.
ويشير العلماء إلى أن هذه المجموعة هي الوحيدة المعروفة التي تعيش في بيئة تذكرنا بالظروف التي عاش فيها #أشباه_البشر الأوائل قبل 6 إلى 7 ملايين سنة.
وينقسم وادي عيسى إلى منطقة صغيرة من الغابات الكثيفة تحيط بضفاف نهر، بالإضافة إلى غابة متفرقة. يبحث الشمبانزي عن الطعام في الغابة خلال موسم الجفاف، عندما يتوفر الغذاء بكثرة. ويشبه موطنهم ونظامهم الغذائي ما كان عليه بعض أشباه البشر الأوائل.
مقالات ذات صلةوقد راقب العلماء 13 فردا بالغا من الشمبانزي. كانوا يختارون الأشجار العالية ذات التيجان الواسعة للبحث عن الطعام، ويبقون لفترات أطول على الأغصان الرقيقة البعيدة، إذا وجدوا طعاما أكثر عصارة، خاصة الفواكه والأوراق والأزهار. ولم يتنقلوا على هذه الأغصان زحفا، بل تحركت المجموعة بحركات بهلوانية؛ معلقة بأيديها تحت الأغصان أو واقفة، ممسكة بالأغصان المجاورة بأيديها. ويتطلب هذا النمط من الحركة تنسيقا وقوة، ما قد يفسر احتفاظ أشباه البشر الأوائل بخصائص تشريحية متكيفة مع التسلق لفترة طويلة.
ووفقا للعلماء، استمر المشي المنتصب لدى أسلافنا في التطور على الأرض وعلى الأشجار أيضا. لذلك تستطيع القردة العليا الحديثة المشي بضع خطوات على الأرض، لكنها غالبا ما تقف على أرجلها الخلفية على أغصان الأشجار للوصول إلى الطعام أو للحفاظ على التوازن، ممسكة بالأغصان المجاورة.
وبناء عليه، من المنطقي افتراض أن أشباه البشر الأوائل استخدموا هذه الطريقة أيضا. فإذا كان سلوك شمبانزي وادي عيسى مشابها بالفعل لسلوك أسلافنا، فإن القدرة على التحرك على طول الأغصان معلقة بأيديها وواقفة على أقدامها كانت مفتاحا للبقاء في بيئات مفتوحة، وإن كانت لا تزال شجرية جزئيا.