سورا أداة جديدة ستحدث ثورة في عالم إنشاء مقاطع الفيديو عبر الذكاء الاصطناعي
تاريخ النشر: 17th, February 2024 GMT
أعلنت شركة "أوبن ايه آي" مبتكرة برنامج "تشات جي بي تي" ومولّد الصور "دال-اي"، عن أداة جديدة أطلقت عليها اسم "سورا" (Sora)، تُستخدَم لإنشاء مقاطع فيديو واقعية تصل مدتها إلى دقيقة واحدة بمجرد إدخال طلب نصّي، وهو ابتكار كبير في مجال الذكاء الاصطناعي.
وأوضحت الشركة الناشئة المتحالفة مع "مايكروسوفت" أن هذه المنصة الجديدة التي تستند إلى أبحاث سابقة أُجريَت على برنامجي "دال-اي" و"جي بي تي"، لا تزال قيد الاختبار، لكنّها عرضت مع ذلك بعض مقاطع الفيديو وشرحت طريقة نشوئها.
وشرحت "أوبن ايه آي" على موقعها الإلكتروني أن البرنامج يستطيع إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة "مع الحفاظ على الجودة المرئية واحترام طلب المستخدم".
وأضافت أنه في إمكان "سورا" إنشاء "مشاهد معقدة تضمّ شخصيات عدة وأنواعاً محددة من الحركات وتفاصيل دقيقة".
كذلك يتيح "سورا" إنشاء فيديو من صورة ثابتة، أو توسيع مقاطع الفيديو الموجودة، بحسب "أوبن ايه آي".
وأشار رئيس "أوبن ايه آي" سام ألتمان عبر منصة "إكس" إلى أن الشركة ستتيح استخدام الأداة الجديدة "لعدد محدود" من مبتكري المحتوى، في إطار مرحلة تجريبية.
كذلك دعا المستخدمين إلى تقديم مقترحات تتعلق بإنشاء مقاطع فيديو، تم عرض أبرزها على المنصة.
ومن بين هذه المقاطع واحد يظهر فيها كلبان يتعاركان وسط الثلج في منطقة جبلية، ويظهر مقطع فيديو آخر حيواناً وهمياً يطير، نصفه بطة ونصفه تنين، في مشهد رائع لغروب الشمس، وعلى ظهره حيوان قداد (هامستر) يرتدي ملابس رياضية.
وتشكّل أداة "سورا" أساساً لـ"برامج قادرة على فهم ومحاكاة العالم الحقيقي"، بحسب الشركة الناشئة التي تأمل في أن تكون "خطوة مهمة في تحقيق الذكاء الاصطناعي العام"، وهو نظام شديد الاستقلالية تفوق قدراته ما يستطيعه البشر في معظم المهام المربحة اقتصاديا.
ونبّهت "أوبن ايه آي" إلى أن ثمة "عيوباً" في "النموذج الحالي" للمنصة، ومنها الالتباس بين اليسار واليمين أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو.
وأوضحت الشركة أن شخصاً في مقطع فيديو "قد يأكل جزءاً من قطعة بسكويت، لكنّ آثار القضمة قد لا تظهر على قطعة البسكويت" في مشهد ثانٍ من مقطع الفيديو.
وأكدت الشركة أن مسألة الأمن ستكون أساسية في ما يتعلق بهذه الأداة، مشيرة إلى أنها ستنظم عمليات محاكاة لتحديد حدود المنصة بشكل أفضل.
وأضافت "أوبن ايه آي": "سنعمل على إشراك صناع السياسات والمعلمين والفنانين في مختلف أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة".
وسبق لمجموعات "ميتا" و"غوغل" و"رَنواي إيه آي" أن عرضت نماذج عن تطبيقات مماثلة تسمى "text-to-video" (تحويل النصوص إلى مقاطع فيديو)، تسعى إلى ابتكارها.
المصدر: عربي21
كلمات دلالية: سياسة اقتصاد رياضة مقالات صحافة أفكار عالم الفن تكنولوجيا صحة تفاعلي سياسة اقتصاد رياضة مقالات صحافة أفكار عالم الفن تكنولوجيا صحة تفاعلي تكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا سورا الذكاء الاصطناعي ذكاء اصطناعي سورا مقاطع مصورة المزيد في تكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا علوم وتكنولوجيا سياسة سياسة تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا تكنولوجيا سياسة اقتصاد رياضة صحافة أفكار عالم الفن تكنولوجيا صحة
إقرأ أيضاً:
البشر يتبنون لغة الذكاء الاصطناعي دون أن يشعروا
في ظاهرة تبدو كأنها خرجت من قصص الخيال العلمي، كشفت دراسة حديثة أن البشر بدؤوا بالفعل تبني أسلوب لغوي يشبه إلى حد كبير أسلوب الذكاء الاصطناعي التوليدي مثل تشات جي بي تي.
هذا التحول الصامت، الذي رصده باحثون في معهد "ماكس بلانك لتنمية الإنسان" في برلين، لم يقتصر على المفردات فحسب، بل امتد إلى بنية الجمل والنبرة العامة للحديث، مما يثير تساؤلات عميقة حول مستقبل اللغة والتنوع الثقافي في عصر هيمنة الآلة ومنطقها في التفكير.
اقرأ أيضا list of 2 itemslist 1 of 2"كل ما نريده هو السلام".. مجتمع مسالم وسط صراع أمهرة في إثيوبياlist 2 of 2سيرة أخرى لابن البيطار بين ضياع الأندلس وسقوط الخلافةend of list تسلل إلى حواراتنا اليوميةاعتمدت الدراسة، التي لم تنشر بعد في مجلة علمية وتتوفر حاليا كنسخة أولية على منصة (arXiv)، على تحليل دقيق لمجموعة ضخمة من البيانات اللغوية، شملت ما يقرب من 360 ألف مقطع فيديو من منصة يوتيوب الأكاديمية و771 ألف حلقة بودكاست. وقام الباحثون بمقارنة اللغة المستخدمة في الفترة التي سبقت إطلاق" تشات جي بي تي" في أواخر عام 2022 وما بعدها، وكانت النتائج لافتة.
لاحظ الفريق البحثي زيادة حادة في استخدام ما أطلقوا عليه "كلمات جي بي تي"، وهي مفردات يفضلها النموذج اللغوي، مثل "delve" (يتعمق)، "meticulous" (دقيق)، "realm" (عالم/مجال)، "boast" (يتباهى/يتميز)، و"comprehend" (يستوعب). هذه الكلمات، التي كانت نادرة نسبيا في الحوار اليومي العفوي، شهدت طفرة في الاستخدام. على سبيل المثال، ارتفع استخدام كلمة "delve" وحدها بنسبة 48% بعد ظهور تشات جي بي تي.
وللتأكد من هذه "البصمة اللغوية"، قام الباحثون باستخلاص المفردات التي يفضلها النموذج عبر جعله يعيد صياغة ملايين النصوص المتنوعة. ووجدوا أن استخدام هذه الكلمات في كلام البشر المنطوق ارتفع بنسبة قد تصل إلى أكثر من 50%، مما يؤكد أن التأثير لم يقتصر على النصوص المكتوبة، بل امتد إلى المحادثات اليومية.
تغير في الأسلوب والنبرةالمفاجأة الكبرى في الدراسة لم تكن في المفردات فحسب، بل في النبرة الأسلوبية العامة. لاحظ الباحثون أن المتحدثين بدؤوا يتبنون أسلوبا أكثر رسمية وتنظيما، وجملا أطول، وتسلسلا منطقيا يشبه إلى حد كبير المخرجات المنظمة للذكاء الاصطناعي، بعيدا عن الانفعالات العفوية والخصوصية اللغوية. هذه الظاهرة تعني أننا نشهد مرحلة غير مسبوقة: البشر يقلدون الآلات بطريقة واضحة.
إعلانيصف الباحثون ما يحدث بأنه "حلقة تغذية ثقافية مغلقة" (closed cultural feedback loop)؛ فاللغة التي نعلمها للآلة تتحول، بشكل غير واع، إلى اللغة التي نعيد نحن إنتاجها.
يقول ليفين برينكمان، أحد المشاركين في الدراسة: "من الطبيعي أن يقلد البشر بعضهم بعضا، لكننا الآن نقلد الآلات"، في مشهد يؤكد تحول الذكاء الاصطناعي إلى مرجعية ثقافية قادرة على التأثير في الواقع البشري.
تآكل التنوع اللغويرغم الطابع الطريف الذي قد تبدو عليه هذه الظاهرة، فإن الدراسة تحمل في طياتها تحذيرا جادا حول مستقبل التنوع الثقافي واللغوي. يلفت الباحثون الانتباه إلى أن اعتمادنا المفرط على أسلوب لغوي موحد، حتى لو بدا أنيقا ومنظما، قد يؤدي إلى تآكل الأصالة والتلقائية والخصوصية التي تميز التواصل الإنساني الحقيقي.
وفي هذا السياق، يحذر مور نعمان، الأستاذ في معهد "كورنيل تك"، من أن اللغة عندما تكتسب طابع الذكاء الاصطناعي قد تفقد الآخرين ثقتهم في تواصلنا، لأنهم قد يشعرون بأننا نسعى لتقليد الآلة أكثر من التعبير عن ذواتنا الحقيقية.
تشير الدراسة إلى أن ما بدأ كأداة للمساعدة في الكتابة والبحث قد تحول إلى ظاهرة ثقافية واجتماعية مرشحة للتوسع. فإذا كان الإنترنت قد أدخل على لغتنا اختصارات تقنية مثل "LOL"، فإن ما يحدث اليوم هو انعكاس مباشر لعلاقة أعمق وأكثر تعقيدا بين الإنسان والذكاء الاصطناعي.
وتؤكد هذه النتائج أن اللغة ليست مجرد كلمات، بل هي مرآة للسلطة الثقافية ومنبع للهوية. ومع تحول الذكاء الاصطناعي إلى جزء من هذه السلطة، فإن تبنينا لأسلوبه قد يعني أننا، وبشكل غير محسوس، نفقد جزءا من شخصيتنا وهويتنا اللغوية الفريدة في ساحة معركة هادئة تكتب فيها فصول جديدة من تاريخ التواصل البشري.