استمع إلى المقال

شركة “OpenAI” للبحوث في مجال الذكاء الاصطناعي أعلنت عن نموذج جديد يسمى “سورا” (Sora)، يمكنه توليد مقاطع فيديو عالية الدقة تصل إلى دقيقة واحدة في الطول من نصوص وصفية؛ “سورا”، وهو اسم يعني “السماء” باللغة اليابانية، لن يكون متاحاً للجمهور العام في الوقت الحالي؛ بدلاً من ذلك، ستجعل “OpenAI” النموذج متاحاً لمجموعة صغيرة من الأكاديميين والباحثين الذين سيقيمون الضرر وإمكانية سوء استخدامه.

يمكن لـ “سورا” توليد مشاهد معقدة تحتوي على شخصيات متعددة وأنواع محددة من الحركة وتفاصيل دقيقة عن الموضوع والخلفية، وقالت الشركة في هذا السياق على موقعها الإلكتروني، “يفهم النموذج ليس فقط ما طلبه المستخدم في النص، ولكن أيضاً كيف توجد تلك الأشياء في العالم الحقيقي”.

أحد مقاطع الفيديو التي تم إنشاؤها بواسطة “سورا” والتي شاركتها “OpenAI” على موقعها الإلكتروني تظهر زوجين يمشيان في شارع ثلجي في طوكيو مع تطاير بتلات الكرز والثلوج حولهما، ويظهر آخر مشاهد واقعية للماموث الصوفي (حيوان منقرض)، وهو يمشي في مرج ثلجي أمام سلسلة جبال مكسوة بالثلوج.

“OpenAI” تقول إن النموذج يعمل نتيجة لـ “الفهم العميق للغة”، الذي يتيح له تفسير النصوص الوصفية بدقة؛ ومع ذلك، مثل جميع نماذج الذكاء الاصطناعي التي تولد الصور والفيديو التي رأيناها، “سورا” ليس مثالياً، في بعض الأمثلة، وقد حذرت “OpenAI” أيضاً من أن النموذج قد يواجه صعوبة في فهم السبب والنتيجة – فهو يمكنه توليد فيديو لشخص يأكل بسكويت، على سبيل المثال، ولكن البسكويت قد لا يكون له علامات العض.

“سورا” ليس أول نموذج يحول النص إلى فيديو، حيث قامت شركات أخرى مثل”ميتا” و”جوجل” و”Runway” بإطلاق أدوات تحويل النص إلى الفيديو أو جعلها متاحة للجمهور؛ ومع ذلك، لا يوجد أي أداة أخرى قادرة حالياً على توليد مقاطع فيديو تصل إلى 60 ثانية، كما أن “سورا” يولد مقاطع الفيديو بالكامل في آن واحد، بدلاً من وضعها معاً إطاراً بإطار مثل النماذج الأخرى، مما يضمن بقاء الموضوعات نفسها حتى عندما تختفي مؤقتاً من الرؤية.

انتشار أدوات تحويل النص إلى الفيديو أثار مخاوف بشأن إمكانية استخدامها بسهولة أكبر لإنشاء لقطات مزيفة واقعية، “أنا مرعوب تماماً من أن هذا النوع من الأشياء، والتي ستؤثر في انتخابات القريبة”، قال أورين إتزيوني، أستاذ في جامعة واشنطن متخصص في الذكاء الاصطناعي، ومؤسس شركة “True Media”، وهي شركة تعمل على تحديد المعلومات المضللة في الحملات السياسية، لصحيفة “نيويورك تايمز”، وقد أثار الذكاء الاصطناعي التوليد أيضاً ردود فعل سلبية من الفنانين والمحترفين الإبداعيين المهتمين باستخدام التكنولوجيا لاستبدال الوظائف.

“OpenAI” قالت إنها تعمل مع خبراء في مجالات مثل مكافحة المعلومات المضللة والمحتوى الكراهية والتحيز لاختبار الأداة قبل جعلها متاحة للجمهور، كما تقوم الشركة ببناء أدوات قادرة على اكتشاف مقاطع الفيديو التي تم إنشاؤها بواسطة “سورا” وتضمين بيانات وصفية في مقاطع الفيديو المولدة لتسهيل الكشف عنها، ورفضت الشركة الإفصاح عن كيفية تدريب “سورا”، باستثناء الإشارة إلى أنها استخدمت كلاً من “مقاطع الفيديو المتاحة للجمهور” بالإضافة إلى مقاطع الفيديو المرخصة من أصحاب حقوق النشر.

هل أعجبك المحتوى وتريد المزيد منه يصل إلى صندوق بريدك الإلكتروني بشكلٍ دوري؟
انضم إلى قائمة من يقدّرون محتوى إكسڤار واشترك بنشرتنا البريدية.
0 0 أصوات
قيم المقال
Subscribe
نبّهني عن
0 تعليقات
Inline Feedbacks
مشاهدة كل التعليقات