ميتا تكشف عن أداة ذكاء اصطناعي تنتج مقاطع صوت وصورة
تاريخ النشر: 5th, October 2024 GMT
أعلنت شركة ميتا المالكة لفيسبوك اليوم الجمعة أنها أنشأت نموذج ذكاء اصطناعي جديدا أطلقت عليه اسم (موفي جين) يمكنه إنشاء مقاطع مصورة مصحوبة بالصوت لتبدو واقعية وفقا لطلبات المستخدم.
وقالت ميتا إن بإمكان هذا النموذج منافسة أدوات من شركات ناشئة رائدة في مجال إنشاء الوسائط مثل أوبن إيه.آي وإليفن لابز.
وتضمنت عينات من إنتاج موفي جين كشفت عنها ميتا مقاطع مصورة لحيوانات تسبح وتطفو، وأخرى تستخدم صورا حقيقية لأشخاص لتصويرهم وهم مثلا يرسمون على قماش.
وقالت ميتا في منشور على مدونتها إن موفي جين يمكنه أيضا إنشاء موسيقى خلفية وتأثيرات صوتية متزامنة مع عرض محتوى المقطع المصور، مع إمكانية استخدام الأداة لإجراء تعديلات على المقاطع.
وفي أحد المقاطع من إنتاج موفي جين، طلبت ميتا من الأداة وضع كرات تستخدم للزينة في يدي رجل يركض بمفرده في الصحراء، بينما في مقطع آخر غيرت موقف سيارات حيث كان رجل يتزلج على أرض جافة إلى أخرى تغطيها بركة مياه.
وقالت ميتا إن مدة المقطع المصور الذي ينتجه موفي جين يمكن أن تصل إلى 16 ثانية بينما يمكن أن يصل طول المقطع الصوتي إلى 45 ثانية.
البيان
إنضم لقناة النيلين على واتسابالمصدر: موقع النيلين
كلمات دلالية: موفی جین
إقرأ أيضاً:
آبل تغيّر قواعد اللعبة!.. تغيير شامل في تصميم “آيفون” وميزات ذكاء اصطناعي غير مسبوقة
الولايات المتحدة – كشفت آبل عن مجموعة واسعة من التحديثات البرمجية والتقنية خلال مؤتمرها السنوي العالمي للمطورين (WWDC)، الذي عُقد هذا الأسبوع في مقر Apple Park.
وركّزت الشركة هذا العام على تحسينات تدريجية تمس تجربة المستخدم اليومية، مع إدخال تغييرات جذرية في تصميم الواجهات وأنظمة التشغيل، وإطلاق تقنيات ذكاء اصطناعي جديدة تحت مظلة “Apple Intelligence”.
وأطلقت آبل تصميما بصريا جديدا يحمل اسم “الزجاج السائل”، سيُعتمد في جميع منتجاتها البرمجية، ويمنح الواجهات طابعا شفافا وتفاعليا. ويأتي هذا التصميم مستوحى من واجهة VisionOS المستخدمة في جهاز الواقع المعزز Vision Pro، ويتميز بقدرته على التكيف مع الوضعين الفاتح والداكن، بالإضافة إلى تفاعله الديناميكي مع الحركة من خلال تقنية العرض الفوري.
وسيشمل هذا التصميم جميع عناصر الواجهة، من الأزرار وأشرطة التمرير، إلى عناصر التحكم في الوسائط والأشرطة الجانبية وأشرطة علامات التبويب وأشرطة الأدوات المعاد تصميمها بالكامل. وستوفّر آبل واجهات برمجة تطبيقات (APIs) محدثة للمطورين لتكييف تطبيقاتهم مع التصميم الجديد قبل إطلاقه لاحقا هذا العام.
وضمن تغييراتها التنظيمية، أعلنت آبل عن تعديل شامل في تسمية أنظمة التشغيل. فبدلا من التسميات المتسلسلة السابقة، ستعتمد الشركة تسمية تشير إلى سنة الإصدار. فعلى سبيل المثال، سيحمل نظام “آيفون” الجديد اسم iOS 26 بدلا من iOS 19. ويهدف هذا التغيير إلى توحيد أسماء أنظمة التشغيل عبر مختلف أجهزة الشركة.
وأحد أبرز إعلانات المؤتمر كان إطلاق منظومة “Apple Intelligence”، التي تجمع بين قدرات الذكاء الاصطناعي والأمان المحلي. وأعلنت الشركة أنها ستتيح للمطورين الوصول إلى نموذج الذكاء الاصطناعي الأساسي الذي تستخدمه في عدد من ميزاتها، ما يمكّنهم من دمجه في تطبيقاتهم.
وأكد كريغ فيديريغي، نائب الرئيس الأول لهندسة البرمجيات في آبل، أن بعض الميزات، مثل تحسينات المساعد الصوتي “سيري”، ما تزال قيد التطوير، مشيرا إلى أن “الوصول إلى مستوى الجودة العالية تطلّب وقتا أطول مما كان متوقعا”.
وكجزء من توسيع قدرات تطبيقاتها، أعلنت آبل عن دمج ميزة إنشاء الصور عبر ChatGPT (من شركة OpenAI) في تطبيق Image Playground. وشدّدت آبل على أن بيانات المستخدم لن تُشارك مع OpenAI دون إذن صريح منه.
كما طرحت الشركة ميزة “فحص المكالمات”، والتي تتيح لهاتف “آيفون” الرد تلقائيا على المكالمات من أرقام مجهولة، وطلب توضيح سبب الاتصال من المتصل. ويعرض الهاتف بعد ذلك نصا مكتوبا لغرض المكالمة، ويصدر رنينا لتنبيه المستخدم.
وكشفت آبل أيضا عن إضافة ميزة الترجمة الفورية للمكالمات الهاتفية، مع إمكانية دمجها في تطبيقات أخرى، دون الحاجة لأن يكون الطرف الآخر يستخدم هاتف “آيفون”.
وسيتم توسيع قدرات “الذكاء البصري” في أجهزة “آيفون”، بحيث يمكن تحليل العناصر الظاهرة على الشاشة وربطها بالتطبيقات ذات الصلة. فعلى سبيل المثال، يمكن للمستخدم رؤية سترة على موقع ويب واستخدام الكاميرا أو الميزة لتحصيل اقتراحات شراء مماثلة من تطبيقات مثبتة مسبقا على الهاتف.
ورغم هذه الإعلانات الكبيرة، شهد سهم آبل انخفاضا بنسبة 1.5% فور بدء المؤتمر، بعد استقرار نسبي في التداولات السابقة. ويأتي ذلك في ظل تحديات تنظيمية وتقنية متزايدة تواجه الشركة، وسط منافسة محتدمة في مجال الذكاء الاصطناعي والتقنيات السحابية.
المصدر: إندبندنت