طورت شركة "مايكروسوفت" نموذج ذكاء اصطناعي، يحول صور وجه الشخص ومقاطع الصوت إلى فيديو مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكل مناسب.

وتم تطوير نموذج الذكاء الاصطناعي الجديد بواسطة فريق من العلماء في مجال الذكاء الاصطناعي في Microsoft Research Asia، ويسمى VASA-1.

7. Potencia de desentrañamiento 1

Ejemplo de la misma secuencia de movimiento con diferentes fotos pic.

twitter.com/vStLKyyGEN

— Adam (@Adamaestr0_) April 19, 2024

وقال الفريق في ورقة بحثية: "لقد قدمنا VASA، وهو إطار عمل لتوليد وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة (VAS) من خلال صورة ثابتة واحدة ومقطع صوتي للكلام. إن نموذجنا الأول، VASA-1، قادر ليس فقط على إنتاج حركات الشفاه المتزامنة بشكل رائع مع الصوت، ولكن أيضا التقاط مجموعة كبيرة من الفروق الدقيقة في الوجه وحركات الرأس الطبيعية التي تساهم في إدراك الأصالة والحيوية".

Microsoft acaba de lanzar VASA-1.

Esta IA puede hacer que una sola imagen cante y hable a partir de una referencia de audio de forma expresiva. Similar a EMO de Alibaba

10 ejemplos salvajes ↓

1. Mona Lisa rapeando a Paparazzi pic.twitter.com/74mZH9fTQO

— Adam (@Adamaestr0_) April 19, 2024

ويدعي الفريق أن طريقتهم لا توفر جودة فيديو عالية مع ديناميكيات واقعية للوجه والرأس فحسب، بل تدعم أيضا إنشاء مقاطع فيديو بحجم 512 × 512 عبر الإنترنت بسرعة تصل إلى 40 إطارا في الثانية مع زمن انتقال لا يكاد يذكر.

إقرأ المزيد Meta تختبر الذكاء الاصطناعي في "إنستغرام"

وهذا يمهد الطريق للتفاعلات في الوقت الفعلي مع الصور الرمزية النابضة بالحياة التي تحاكي سلوكيات المحادثة البشرية، وفقا لما ذكره العلماء.

ويشار إلى أن VASA هو اختصار لـ Visual Affective Skills Animator (بمعنى الرسوم المتحركة للمهارات البصرية العاطفية)، وهو نموذج قادر على تحويل أي صور ثابتة سواء تم التقاطها بواسطة الكاميرا، أو رسمها، إلى رسوم متحركة "متزامنة بشكل رائع".

ويمكن لـ VASA إنشاء فيديو حقيقي "مخيف"، حيث تحاكي "الوجوه الناطقة الواقعية" سلوكيات المحادثة البشرية من خلال إيماءات الوجه وحركة العين والرأس الطبيعية، وكل ذلك من صورة ثابتة واحدة للرأس.

واستخدم الفريق مجموعة بيانات VoxCeleb2 المتاحة للجمهور والتي تحتوي على مقاطع فيديو لأكثر من 6000 من المشاهير الواقعيين.

وبعد التخلص من المقاطع التي تتضمن عدة أفراد وذات جودة منخفضة، قام الفريق بتدريب نموذجهم على مجموعة البيانات المعالجة.

ومن اللافت للنظر أن نموذجهم يمكنه التعامل مع المدخلات خارج مجموعة التدريب، مثل الصور الفنية والكلام بغير الإنجليزية.

إقرأ المزيد الذكاء الاصطناعي يصل إلى تطبيقات "واتس آب"

غناء الموناليزا

وباستخدام مقطع صوتي لأغنية Paparazzi بصوت آن هاثاواي، أجرى العلماء تجارب على الموناليزا.

وادعى الفريق أن نظام الذكاء الاصطناعي يمكن أن يعمل في الوقت الفعلي، حيث أظهروا مقطعا يوضح الأداة وهي تقوم على الفور بتحريك الصور باستخدام تعبيرات الوجه وحركات الرأس. كما يوفر النموذج التحكم في النظرة والمسافة والعواطف في الفيديو الذي تم إنشاؤه.

مخاوف انتحال الشخصية

في حين أن قدرات النموذج تثير مخاوف انتحال الشخصية، فإن العلماء يصرون على أن هدفهم من الأداة ليس تعزيز التزييف العميق.

وكتبوا في منشور: "نحن نستكشف توليد المهارات العاطفية البصرية للشخصيات الافتراضية والتفاعلية، وليس انتحال شخصية أي شخص في العالم الحقيقي".

ويؤكد فريق البحث أن النموذج سيتم استخدامه للتعليم وتوفير الرفقة. وقد رفضوا أيضا إصدار الكود الذي يدعم النموذج.

وأكد الفريق اهتمامه بتطبيق التقنية الجديدة لتعزيز اكتشاف التزوير. وأكدوا: "ليس لدينا أي خطط لإصدار عرض توضيحي عبر الإنترنت أو واجهة برمجة تطبيقات أو منتج أو تفاصيل تنفيذ إضافية أو أي عروض ذات صلة حتى نتأكد من استخدام التكنولوجيا بشكل مسؤول ووفقا للوائح المناسبة".

المصدر: Interesting Engineering

المصدر: RT Arabic

كلمات دلالية: جديد التقنية ذكاء اصطناعي مايكروسوفت MicroSoft معلومات علمية الذکاء الاصطناعی

إقرأ أيضاً:

جوجل تعزز تجربة الطلاب التعليمية بميزات ذكاء اصطناعي جديدة

أعلنت شركة جوجل عن مجموعة من الميزات الجديدة ضمن تحديث خاص بوضع الذكاء الاصطناعي AI Mode، يهدف إلى مساعدة الطلاب في التحضير للاختبارات وتعميق فهمهم الأكاديمي من خلال أدوات ذكية وتفاعلية.

أدوات ذكية لإنشاء أدلة دراسية تفاعلية

ضمن التحديث، سيتمكن الطلاب من إنشاء أدلة دراسية ذكية عبر سحب المعلومات إلى الشريط الجانبي في المتصفح، ثم طرح أسئلة إضافية لفهم المحتوى بشكل أعمق والحصول على نتائج مخصصة.

6 منتجات جديدة من جوجل.. كل ما تحتاج معرفته عن حدث Made by Google 2025؟"دليل الويب".. جوجل تعيد ابتكار نتائج البحث بالذكاء الاصطناعي رفع الصور وطرح الأسئلة عبر الذكاء الاصطناعي
 

ومن بين أبرز الإضافات إمكانية رفع الصور إلى وضع الذكاء الاصطناعي على أجهزة الكمبيوتر، حيث يمكن للمستخدمين طرح أسئلة حول محتوى الصورة، سواء كانت مسألة رياضية من الواجبات المنزلية أو نبتة يريدون معرفة المزيد عنها.

كما تختبر جوجل أيضا ميزة جديدة تتيح مشاركة الكاميرا في الوقت الفعلي ضمن AI Mode، وهي مبنية على ميزة البحث المباشر Search Live، تتيح هذه الخاصية للمستخدمين توجيه كاميرا الهاتف نحو سؤال معين وطرحه شفهيا باستخدام الصوت، دون الحاجة إلى كتابة أو البحث التقليدي. 

هذه الميزة متوفرة حاليا بشكل تجريبي للمستخدمين في الولايات المتحدة المشاركين في تجربة AI Mode Labs.

تحسينات على Lens داخل متصفح كروم

وتسعى جوجل أيضا إلى تبسيط الوصول إلى ميزة Google Lens عبر عرض خيار جديد بعنوان اسأل جوجل عن هذه الصفحة عند الضغط على شريط العنوان في متصفح كروم.

عند تفعيل هذا الخيار، يمكن للمستخدم اختيار جزء معين من الصفحة للبحث عنه، ثم الحصول على نظرة شاملة مدعومة بالذكاء الاصطناعي في الشريط الجانبي، كما يمكن طرح أسئلة متابعة باستخدام زر AI Mode ثم المتابعة عبر خيار استكشاف أعمق.

AI Mode في البحث ملخصات وتفاعلات ذكية


وكانت جوجل قد أطلقت في مايو ميزة AI Mode في محرك البحث داخل الولايات المتحدة، والتي تقوم بتلخيص نتائج البحث تلقائيا، مع إمكانية طرح أسئلة متابعة وإجراء حوار تفاعلي مع الأداة.

وفي أبريل الماضي، بدأت الشركة اختبار ميزة رفع الصور في AI Mode، والآن مع توسعها إلى نسخة سطح المكتب، قد يصبح من الأسهل على الطلاب الحصول على مساعدة فورية في إنجاز المشاريع أو حل الواجبات.

هذه التحديثات تعكس جهود جوجل المستمرة في دمج الذكاء الاصطناعي في التعليم، لتوفير أدوات مساعدة أكثر ذكاء وفعالية للطلاب حول العالم.

طباعة شارك جوجل الذكاء الاصطناعي AI Mode

مقالات مشابهة

  • «جوجل» تطلق نموذج الذكاء الاصطناعي «Deep Think» لعموم المشتركين
  • نموذج ذكاء اصطناعي يعزز دقة تشخيص سرطان الغدة الدرقية
  • بدء تطبيق قواعد الاتحاد الأوروبي على نماذج الذكاء الاصطناعي
  • المطرف: يجب التعامل مع الذكاء الاصطناعي بتوازن ووعي..فيديو
  • تسريبات: إصدار نموذج ذكاء اصطناعي جديد من أوبن إيه آي قريبا
  • لا تسخر... قد تقع في حب ذكاء اصطناعي دون أن تدري!
  • فوتوشوب يزداد ذكاءً.. ميزات جديدة تعتمد على «الذكاء الاصطناعي» لتسهيل تعديل الصور
  • مايكروسوفت تنضم إلى نادي الأربعة تريليونات.. وتتفوق على آبل في سباق الذكاء الاصطناعي
  • جوجل تعزز تجربة الطلاب التعليمية بميزات ذكاء اصطناعي جديدة
  • خالد عبد الرحمن يتعرض لموقف محرج بسبب سؤال عن الذكاء الاصطناعي.. فيديو