سورا أداة جديدة ستحدث ثورة في عالم إنشاء مقاطع الفيديو عبر الذكاء الاصطناعي
تاريخ النشر: 17th, February 2024 GMT
أعلنت شركة "أوبن ايه آي" مبتكرة برنامج "تشات جي بي تي" ومولّد الصور "دال-اي"، عن أداة جديدة أطلقت عليها اسم "سورا" (Sora)، تُستخدَم لإنشاء مقاطع فيديو واقعية تصل مدتها إلى دقيقة واحدة بمجرد إدخال طلب نصّي، وهو ابتكار كبير في مجال الذكاء الاصطناعي.
وأوضحت الشركة الناشئة المتحالفة مع "مايكروسوفت" أن هذه المنصة الجديدة التي تستند إلى أبحاث سابقة أُجريَت على برنامجي "دال-اي" و"جي بي تي"، لا تزال قيد الاختبار، لكنّها عرضت مع ذلك بعض مقاطع الفيديو وشرحت طريقة نشوئها.
وشرحت "أوبن ايه آي" على موقعها الإلكتروني أن البرنامج يستطيع إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة "مع الحفاظ على الجودة المرئية واحترام طلب المستخدم".
وأضافت أنه في إمكان "سورا" إنشاء "مشاهد معقدة تضمّ شخصيات عدة وأنواعاً محددة من الحركات وتفاصيل دقيقة".
كذلك يتيح "سورا" إنشاء فيديو من صورة ثابتة، أو توسيع مقاطع الفيديو الموجودة، بحسب "أوبن ايه آي".
وأشار رئيس "أوبن ايه آي" سام ألتمان عبر منصة "إكس" إلى أن الشركة ستتيح استخدام الأداة الجديدة "لعدد محدود" من مبتكري المحتوى، في إطار مرحلة تجريبية.
كذلك دعا المستخدمين إلى تقديم مقترحات تتعلق بإنشاء مقاطع فيديو، تم عرض أبرزها على المنصة.
ومن بين هذه المقاطع واحد يظهر فيها كلبان يتعاركان وسط الثلج في منطقة جبلية، ويظهر مقطع فيديو آخر حيواناً وهمياً يطير، نصفه بطة ونصفه تنين، في مشهد رائع لغروب الشمس، وعلى ظهره حيوان قداد (هامستر) يرتدي ملابس رياضية.
وتشكّل أداة "سورا" أساساً لـ"برامج قادرة على فهم ومحاكاة العالم الحقيقي"، بحسب الشركة الناشئة التي تأمل في أن تكون "خطوة مهمة في تحقيق الذكاء الاصطناعي العام"، وهو نظام شديد الاستقلالية تفوق قدراته ما يستطيعه البشر في معظم المهام المربحة اقتصاديا.
ونبّهت "أوبن ايه آي" إلى أن ثمة "عيوباً" في "النموذج الحالي" للمنصة، ومنها الالتباس بين اليسار واليمين أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو.
وأوضحت الشركة أن شخصاً في مقطع فيديو "قد يأكل جزءاً من قطعة بسكويت، لكنّ آثار القضمة قد لا تظهر على قطعة البسكويت" في مشهد ثانٍ من مقطع الفيديو.
وأكدت الشركة أن مسألة الأمن ستكون أساسية في ما يتعلق بهذه الأداة، مشيرة إلى أنها ستنظم عمليات محاكاة لتحديد حدود المنصة بشكل أفضل.
وأضافت "أوبن ايه آي": "سنعمل على إشراك صناع السياسات والمعلمين والفنانين في مختلف أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة".
وسبق لمجموعات "ميتا" و"غوغل" و"رَنواي إيه آي" أن عرضت نماذج عن تطبيقات مماثلة تسمى "text-to-video" (تحويل النصوص إلى مقاطع فيديو)، تسعى إلى ابتكارها.
المصدر: عربي21
كلمات دلالية: سياسة اقتصاد رياضة مقالات صحافة أفكار عالم الفن تكنولوجيا صحة تفاعلي سياسة اقتصاد رياضة مقالات صحافة أفكار عالم الفن تكنولوجيا صحة تفاعلي تكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا سورا الذكاء الاصطناعي ذكاء اصطناعي سورا مقاطع مصورة المزيد في تكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا سياسة سياسة تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا سياسة اقتصاد رياضة صحافة أفكار عالم الفن تكنولوجيا صحة
إقرأ أيضاً:
كيف غيّر الذكاء الاصطناعي حياة المكفوفين في جامعة باريس؟
في حرم لوي براي الجامعي في باريس، تعمل نحو خمس عشرة شركة ناشئة بمساعدة الذكاء الاصطناعي، على تحسين الحياة اليومية لمليوني شخص يعانون إعاقات بصرية، كأن يعثروا بسهولة على مقعد شاغر في الحافلة أو أن يقرأوا اللافتات في الشارع.يقول المشارك في تأسيس شركة «إيزيموب» روبن لو غال في حديث إلى وكالة فرانس برس في المعهد الوطني للشباب المكفوفين (INJA) الذي يضم قسماً من الحرم الجامعي الذي افتُتح مطلع ديسمبر 2024، إنّ «هدفنا هو جعل مدينة الغد في المتناول».
ويوفّر التطبيق الذي ابتكرته «إيزيموب» ويغطي أربع مناطق فرنسية (من ليون إلى جزيرة ريونيون في المحيط الهندي) ويستخدمه حالياً 12 ألف شخص، ميزات كثيرة بينها تحديد موقع أبواب المركبات، ومواقف السيارات الشاغرة، وحتى عدّ التوقفات عن طريق تنبيه المستخدمين عند نزولهم.
ويقول روبن لو غال «في الواقع، إذا صعد شخص ما إلى الحافلة، يُدرك بالضبط أين عليه الجلوس أو ما إذا كان هناك مقعد شاغر، ويُصدر التطبيق صوت تنبيه وإشارة اهتزازية في حال وجود مقعد شاغر».
ويضيف «لقد دمجنا خوارزمية ذكاء اصطناعي تُحلل الصورة وتُحدد مواقع البنية التحتية الرئيسية للنقل، مثل بوابات دوارة وأبواب ومقاعد. يسمع المستخدم مثلاً أن الباب مفتوح على بُعد خمسة أمتار اتجاه معيّن».
ويستضيف مجمع لوي براي 17 شركة ناشئة تسعى إلى هدف واحد هو «تطوير حلول ملموسة»، على ما يؤكد مديره تيبو دو مارتيمبري، وهو أيضا من ذوي الإعاقة البصرية.
ويضيف «لسنا مستشفى، بل تركز الأبحاث هنا على تحسين الحياة اليومية للأشخاص ذوي الإعاقة البصرية والمكفوفين: كيف سنُسهّل عليهم التنقل، وكيف يُمكنهم شراء الخبز بأنفسهم، أو الذهاب إلى السينما، أو مشاهدة مباراة كرة قدم. الأمر كله يتعلق بعدم الإقصاء وبسهولة الوصول».
- قراءة لافتات الشوارع -
بدأ عدد من هذه الشركات الناشئة يحقق شهرة على غرار «آرثا فرانس». يشكل جهازها الذي فاز بمسابقة «ليبين» للابتكار عام 2024، نظارة مزوّدة بكاميرا صغيرة تنقل البيانات البصرية إلى أحاسيس لمسية عبر حزام قطني.
تُترجم الصور التي تلتقطها الكاميرا، بفضل حزام قطني في ظهر المستخدم، إلى نبضات تُمكّن الشخص ضعيف البصر أو المكفوف من إدراك بيئته بدقة أكبر، على ما يوضح المشارك في تأسيس الشركة لوي دو فيرون لوكالة فرانس برس.
ويضيف أن «الذكاء الاصطناعي يتيح إعادة إنتاج كل عمليات معالجة الصور التي يُجريها الدماغ». وبالمثل، «نستخدم الذكاء الاصطناعي أيضاً لتمكين الشخص من قراءة لافتات الشوارع. وهذه ميزة مطلوبة بشدة من المكفوفين».
وبالإضافة إلى تحسين الحياة اليومية، تسعى الشركات الناشئة إلى تسهيل إتاحة الأنشطة الثقافية والترفيهية. تبتكر شركة «غيف فيجن» البريطانية الناشئة خوذ رأس قائمة على الواقع المعزز تُتيح لمَن يعانون ضعاف بصر «تجربة حدث رياضي من قُرب».
في حديث إلى وكالة فرانس برس، تقول مديرة تطوير الأعمال الفرنسية في الشركة الناشئة سيسيه دوكوريه التي تعاني من إعاقة بصرية، «هناك أجهزة كثيرة في فرنسا مصممة للمكفوفين، مزودة بأجهزة لوحية تعمل باللمس وميزات صوتية، ولكن حتى اليوم لا يوجد أي جهاز مخصص لمَن يعانون ضعفا في البصر».
وتضيف «إذا لم تكن لدينا معدات، فسنرى أشخاصا يركضون، لكننا لن نتمكن من تحديد هوية الفريق، سواء كانوا رجالاً أم نساء. من المهم أن نكون جميعاً على قدم المساواة».
وبحسب التقديرات الرسمية، يعاني نحو 1.7 مليون شخص في فرنسا من إعاقة بصرية، من بينهم أكثر من 200 ألف كفيف.