بدأ إدخال تقنيات المعالجة الرقمية ضمن الأفلام الروائية الطويلة، عام 1973 مع فيلم وست وورلد (Westworld)، الذي يعتبر أول فيلم روائي طويل استخدم الصور المولدة بالحاسوب (Computer-generated imagery) واختصارا "سي جي آي" (CGI). عالج الفيلم بعض الصور الفوتوغرافية المتحركة رقميا بحيث تظهر منقطة، من أجل محاكاة ما تراه الروبوتات التي تظهر في الفيلم.

طبعا كانت المعالجة بسيطة وبدائية.

تمثل ثلاثية سيد الخواتم (The Lord of the Rings) التي بدأ عرضها عام 2001، نقطة انعطاف في تاريخ السينما من حيث استخدام تقنيات حاسوبية متقدمة، أبرزها إصدارة متطورة من تقنية الصور المولدة بالحاسوب "سي جي آي" (CGI) لإنشاء العديد من المشاهد والشخصيات التي لا تنسى في هذه الثلاثية.

واستخدمت الثلاثية أيضا برنامج ماسيف (MASSIVE) الذي تم تطويره خصيصا لها، لتوليد مشاهد المعارك الضخمة التي تضم آلاف الشخصيات الفردية، والتي تسمح لكل شخصية رقمية في هذه الجيوش بأن تفكر وتتفاعل وتقاتل بشكل مستقل.

وكان تطوير شخصية غولوم (Gollum) في الفيلم نقطة بارزة في تاريخ المؤثرات البصرية واستخدام تقنية التقاط الحركة (Motion Capture) في الأفلام. شملت العملية مزيجا من التمثيل الحي، وتقنيات متقدمة في التقاط الحركة، ومهارات عالية في الرسوميات الحاسوبية، حيث ارتدى الممثل العراقي الأصل آندي سركيس بزة مجهزة بمجسات استشعار تسجل حركات جسمه وتعابير وجهه وتنقلها إلى الشخصية الرقمية غولوم.

تحويل النصوص إلى صور (Text to Image)

جاءت القفزة الحقيقية نحو "تحويل النص إلى صورة" باستخدام الذكاء الاصطناعي والتعلم الآلي عام 2016، حينما قام سكوت ريد وفريقه بتطوير نموذج يمكنه توليد صور معقولة من أوصاف نصية مفصلة.

استخدم هذا النموذج مزيجا من الشبكات العصبية الالتفافية (CNNs) التي تحلل الصور إلى بكسلات تعطى كل منها قيمة تصنيفية، والشبكات العصبية المتكررة (RNNs)، جنبا إلى جنب مع تقنية التعزيز المشروط (Conditioning Augmentation) لتحسين جودة وتنوع الصور التي تم إنشاؤها.

أظهر عمل هذا الفريق إمكانية توليد صور متماسكة ومتنوعة للطيور والزهور من الأوصاف النصية، وهو ما كان جهدا رائدا في تحويل النص إلى الصورة.

مهدت أعمال هذه الفريق الطريق أمام تطوير أنظمة أكثر تقدماً مثل "دال إي" (DALL-E) من "أوبن إيه آي" (OpenAI) في عام 2021، من خلال إنشاء صور إبداعية ودقيقة للغاية من أوصاف نصية معقدة.

الفيديو التوليدي نقطة انعطاف جديدة في تاريخ السينما

في منتصف فبراير/شباط 2024، دعت شركة أوبن إيه آي مجموعة من صانعي الأفلام وخبراء التكنولوجيا لتجربة نموذج الفيديو التوليدي الجديد الذي طورته عبر تقنية تحويل النص إلى فيديو (Text-to-Video)، وأطلقت عليه اسم "سورا" (Sora)، وذلك بهدف تجربته والتعرف على إمكانياته ومزاياه وعيوبه.

أدهش سورا الحاضرين ووصفه المدير التنفيذي للتكنولوجيا في مايكروسوفت، مارك روسينوفيتش، بأنه "مذهل ومخيف في الوقت نفسه"، وأضاف "أعتقد أنه يمثل نهاية الواقع كما نعرفه".

ومنذ ذلك الحين وحتى اليوم" أتاحت الشركة للجمهور مشاهدة العديد من مقاطع الفيديو التي أنشأها سورا، منها مقطع دعائي لفيلم يعرض مغامرات رجل فضاء بالغ من العمر (30 عاما)، وموقع بناء مملوء بالعمال والمعدات والآلات الثقيلة، وكنغر يرقص الديسكو، ومدينة طوكيو وهي مكسوة بالثلج وتعج بالحركة، وجراء تلعب في الثلج، وغيرها.

يمكنكم الاطلاع عليها عبر حساب سام ألتمان على موقع إكس (تويتر سابقا)، أو على موقع يوتيوب.

ظهرت الدفعة الأولى من النماذج التي يمكنها تحويل النص إلى فيديو في أواخر عام 2022، من شركات ميتا وغوغل ورنواي (Runway) وغيرها، لكن نتائجها كانت مشوشة، ومشوهة، ولم يستغرق الفيديو الواحد منها سوى بضع ثوان.

توليد الفيديو من النص أو تحويل النص إلى فيديو عملية معقدة تتطلب دمج تقنيات الذكاء الاصطناعي التوليدي، والتعلم الآلي، ومعالجة الوسائط المتعددة. ويعتقد الخبراء أن سورا هو الأفضل حتى الآن، نظرا لوضوحه العالي وواقعيته المذهلة لدرجة توقع معها بعض المراقبين المتحمسين وفاة هوليود كما نعرفها.

يمكن أن تصل مدة مقاطع الفيديو التي يولدها سورا حاليا إلى دقيقة واحدة، وتتكون من مشاهد معقدة وشخصيات متعددة وأنواع مختلفة من الحركة مع تفاصيل دقيقة.

أزمات قانونية وأخلاقية حالية ومستقبلية

تواجه كل من أوبن إيه آي وغوغل والشركات الأخرى التي تطور نماذج الذكاء الاصطناعي التوليدي مشكلات قانونية تتعلق باستخدام بيانات المواقع الإخبارية، ومواقع الفيديو، ووسائل التواصل الاجتماعي، والمنتديات، وقواعد بيانات الكتب، لتدريب برمجيات الذكاء الاصطناعي التوليدي على إنتاج النصوص والصور والفيديوهات، دون الحصول على إذن مسبق، مما يمثل انتهاكا للخصوصية وحقوق النشر.

وكان رد هذه الشركات على هذه الاتهامات بأن البيانات التي تستخدمها للتدريب متاحة للجمهور، لكن هذا لم يقنع صحيفة نيويورك تايمز التي رفعت دعوى قضائية ضد شركة أوبن إيه آي، زاعمة أنها استخدمت أعمالها لتدريب برمجياتها، وانتهكت بذلك حقوقها في النشر والطباعة.

وتوجد مشكلة أخرى تواجه هذه الشركات هي التزييف العميق الذي نما بسرعة مع تطور الذكاء الاصطناعي التوليدي، إذ تزداد المخاوف من احتمال إضافة مقاطع فيديو مزيفة في مجالات عديدة تؤثر على الانتخابات والأسواق المالية، بل الحياة الشخصية.

مستقبل صناعة الترفيه

عقد سام ألتمان في شهر مارس/آذار الماضي سلسلة من الاجتماعات مع المدراء التنفيذيين في هوليود حاول إقناعهم فيها بأن سورا لن يدمر صناعة السينما، خاصة مع تزايد المخاوف بشأن فقدان الوظائف لصالح الذكاء الاصطناعي، والذي كان أحد أسباب إضرابات الممثلين والكتاب العام الماضي، وأدى حينها إلى تعطل الإنتاج التلفزيوني لبعض الوقت.

ويبدو أن بعض الأستوديوهات تقبلت فكرة أن استخدام هذه الأداة بعناية في الإنتاج، يمكنها أن توفر الوقت.

لكن الممثل والمخرج الأميركي تايلر بيري قال إنه يخشى تأثير الذكاء الاصطناعي على الصناعات الإبداعية، وإنه أوقف التوسع الذي سبق وخطط له في أحد أستوديوهات الإنتاج الخاصة به بسبب سورا.

تتفوق سورا حاليا على البرامج المنافسة في مجال إنشاء الفيديو عبر النص. لكن العديد من الشركات الأخرى تعمل حاليا على تحسين تقنياتها المشابهة، حيث يتوقع أن تطرح برامج منافسة لسورا خلال الأشهر المقبلة.

المصدر: الجزيرة

كلمات دلالية: ترجمات حريات الذکاء الاصطناعی التولیدی أوبن إیه آی

إقرأ أيضاً:

حلقة عمل حول الذكاء الاصطناعي لتعزيز الترويج السياحي

العُمانية: نظّمت وزارة التراث والسياحة اليوم حلقة عمل متخصصة بعنوان "الذكاء الاصطناعي في الترويج السياحي"، بهدف تعزيز كفاءة القطاع السياحي ومواكبة التطورات التقنية العالمية، وقد شارك فيها عدد من موظفي التسويق والمبيعات في الفنادق وشركات السفر ومنظمي الرحلات السياحية.

وهدفت الحلقة إلى تمكين شركاء القطاع السياحي من توظيف تقنيات الذكاء الاصطناعي لتحسين الأداء الترويجي وتعزيز تنافسية الوجهات السياحية في سلطنة عمان، وذلك من خلال التعريف بأدوات الذكاء الاصطناعي العملية مثل إنشاء المحتوى الترويجي، تحليل المشاعر، والاستهداف التنبؤي، بالإضافة إلى استعراض نماذج استخدام ناجحة على المستويين الإقليمي والدولي، وتسهم هذه الأدوات في رفع كفاءة العاملين في القطاع، وتمكينهم من تبني أفضل الممارسات العالمية في الترويج السياحي، مما يعزز مكانة سلطنة عمان كوجهة سياحية متميزة.

وركزت محاور الحلقة على الاستخدام الأخلاقي والفعال لأدوات الذكاء الاصطناعي، وتحليل البيانات السياحية لتعزيز فعالية الحملات الترويجية، وتصميم حملات تسويقية مبتكرة تتماشى مع أهداف العلامات السياحية العمانية.وستعلن الوزارة قريبًا عن إطلاق البرنامج التدريبي للاستدامة عبر منصة دعم الشركاء.

يهدف هذا البرنامج إلى بناء قدرات العاملين في القطاع في مجالات السياحة المستدامة، وتزويدهم بالمعارف والمهارات التي تسهم في تحقيق التوازن بين النمو السياحي والحفاظ على الموارد الطبيعية والثقافية.وتأتي هذه الحلقة ضمن سلسلة من المبادرات التي تنفذها الوزارة لتطوير القطاع السياحي، وتعزيز جاهزيته للتعامل مع أدوات المستقبل بما يخدم أهداف رؤية "عُمان 2040".

مقالات مشابهة

  • حلقة عمل حول الذكاء الاصطناعي لتعزيز الترويج السياحي
  • بي بي سي تختار مديرة تنفيذية من ميتا لإدارة الذكاء الاصطناعي
  • وضع الذكاء الاصطناعي يصل إلى الشاشة الرئيسية في هواتف أندرويد
  • عائدات AT&T تتضاعف نتيجة استثماراتها في الذكاء الاصطناعي
  • حوارٌ مثيرٌ مع الذكاء الاصطناعي
  • هل تنفجر معدلات النمو الاقتصادي في زمن الذكاء الاصطناعي؟
  • القبض على فتي بتهمة تزوير صور عارية لزميلاته باستخدام الذكاء الاصطناعي
  • دعوة لمقاربة شاملة لتنظيم الذكاء الاصطناعي
  • جوجل تطلق خاصية جديدة لتنظيم نتائج البحث باستخدام الذكاء الاصطناعي
  • تمكنك من قياس الملابس افتراضيًا.. «جوجل» تكشف عن ميزة باستخدام الذكاء الاصطناعي