علومشمال أمريكا

إنتاج الفيديوهات بالذكاء الاصطناعي.. تقدم مذهل ومخاوف مشروعة

عماد حسن

٢٤ فبراير ٢٠٢٤

كشفت شركة اوبن إيه آي للذكاء الاصطناعي عن نموذج جديد أطلق عليه اسم "سورا" يمكنه إنتاج الفيديوهات من خلال النصوص المكتوبة. النتائج المذهلة للنموذج الجديد فتحت الباب أمام تساؤلات حول خصوصية البيانات ومستقبل صناعة الترفيه.

رسم توضيحي لإطلاق شركة OpenAI أول نموذج لتوليد الفيديو Sora من خلال النصوص المكتوبة ، 16 فبراير 2024 — مع الإعلان عن "سورا" بدأ صناع محتوى الفيديو بشعرون بالقلق على مستقبلهم من وجود أداة تقوم بعمل ما يقومون بهصورة من: CFOTO/picture alliance

إعلان

تطور مذهل يشهده الذكاء الاصطناعي المستخدم في إنتاج مقاطع الفيديو بعد الكشف عن سورا Sora، مولّد تحويل النص إلى فيديو باستخدام الذكاء الاصطناعي من شركة اوبن إيه آي OpenAI.

تستخدم الأداة، التي كشفت عنها الشركة قبل أيام، الذكاء الاصطناعي التوليدي لإنشاء مقاطع فيديو قصيرة على الفور بناءً على أوامر مكتوبة. وكانت النتائج الأولية مذهلة حتى أن البعض خُدع في الفيديوهات المنتجة، معتقداً أنها مشاهد حقيقية من أرض الواقع كما في الفيديو التالي:

والواقع أن "سورا" ليس الأداة الوحيدة التي تستخدم هذا النوع من التكنولوجيا المتقدمة، لكن الخبراء يشيرون إلى الجودة العالية لمقاطع الفيديو التي تعرضها "سورا" حتى الآن، مؤكدين أن كشف الستار عنها يمثل قفزة كبيرة سواء للشركة أو لمستقبل إنشاء تحويل النص إلى فيديو بشكل عام.

ومع ذلك، وكما هو الحال مع كل الأشياء في مجال الذكاء الاصطناعي سريع النمو في هذه الأيام، تثير هذه التكنولوجيا أيضًا مخاوف بشأن الآثار الأخلاقية والمجتمعية المحتملة.

كيف يعمل "سورا"؟

تقوم الأداة الجديدة "سورا" بإنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية (حتى الآن!) بناءً على طلبات مكتوبة باستخدام الذكاء الاصطناعي التوليدي، كما يمكن للنموذج أيضًا إنشاء فيديو من صورة ثابتة.

والذكاء الاصطناعي التوليدي هو فرع من الذكاء الاصطناعي يمكنه إنشاء شيء جديد تماماً. تشمل الأمثلة روبوتات الدردشة، مثل ChatGPT من OpenAI، ومولدات الصور مثل DALL-E وميد جيرني Midjourney.

قامت شركة اوبن إيه آي بتغذية "سورا" بمقاطع فيديو وصور وتم تدريبه على تحويل الصور الثابتة والنصوص بما يعرف باسم "محولات الانتشار"، لتحويل ما تمت تغذيته به من معلومات إلى فيديوهات ومشاهد متحركة.

كما تم تدريب "سورا" على إنتاج الفيديوهات بجودات ودرجات وضوح وأطوال مختلفة، آخذاً في الاعتبار النسب المنطقية للأبعاد وتدرجات الألوان وغيرها من العوامل، وفق ما ذكر موقع "ماشابل" التقني المتخصص.

متى يمكن أن يتاح "سورا" للعامة؟

حتى الآن فإن "سورا" ليس متاحًا للاستخدام العام. تقول اوبن ايه آي إنها تتواصل مع صانعي السياسات والفنانين قبل إطلاق الأداة رسميًا، لكن في الحقيقة فإن الكثير من الجوانب المحيطة بالأداة نفسها يحيطها الكثير من الغموض.

وبحسب موقع "تك. كو" التقني المتخصص فإن نموذج الذكاء الاصطناعي الجديد يتم إخضاعه في الوقت الحالي للفحص الدقيق من قبل باحثين أمنيين مسؤولين عن ضمان سلامته وأمانه، إضافة إلى تقييم "المخاطر الحرجة" الناشئة عن استخدامه وذلك قبل إصداره للجمهور.

ومنحت الشركة مجموعة محدود للغاية من الفنانين وصانعي الأفلام والمصممين إمكانية الوصول إلى "سورا" بهدف تجربته بكامل إمكانياته والتعرف على المزايا والعيوب. لكن يبدو أن بعض الحسابات المعروفة في منتدى OpenAI تشير إلى أنه ستكون هناك قائمة انتظار طويلة سيتم طرحها في مرحلة ما لضم المزيد من الأشخاص، دون تحديد موعد واضح لإمكانية عمل ذلك.

ومنذ إعلان إطلاق "سورا"، نشرت الشركة عددًا من الأمثلة لمقاطع الفيديو التي أنشأها النظام لإظهار إمكانياته، وهو ما فعله سام التمان الرئيس التنفيذي للشركة على حسابه بموقع "اكس" والذي طلب من المتابعين ارسال أفكار لفيديوهات يرغبون في إنتاجها وقام بنشر الفيديوهات لاحقاً:

أدوات أخرى لصناعة الفيديو بالذكاء الاصطناعي

لم تكن "سورا" هي الأداة الأولى من نوعها التي تقوم بإنتاج الفيديوهات من خلال أوامر أو نصوص مكتوبة، فشركات مثل غوغل، وميتا، والشركة الناشئة Runway ML تُعد من بين الشركات التي لديها تكنولوجيا مماثلة.

لكن بحسب الخبراء فإن النتائج التي جاءت من "سورا" لا يمكن مقارنة جودتها مع الأدوات الأخرى، سواء من حيث جودة الصور والوضوح والطول، ما يجعل "سورا" نقلة مذهلة في هذا المجال.

قال فريد هافيماير، رئيس قسم الذكاء الاصطناعي وأبحاث البرمجيات في شركة ماكواري بالولايات المتحدة، إن إطلاق "سورا" يمثل خطوة كبيرة إلى الأمام بالنسبة لهذه الصناعة، بحسب ما نقل موقع "يورونيوز".

وأضاف: "لا يمكنك فقط إنشاء مقاطع فيديو أطول، فأنا أفهم أن تنتج مقطعاً يصل إلى 60 ثانية باستخدام بعض الأدوات، لكن اليوم يمكن إنتاج فيديوهات طويلة، كما أن مقاطع الفيديو التي يتم إنشاؤها من خلال "سورا" تبدو طبيعية أكثر ويبدو أنها تحترم قوانين الفيزياء وتقترب من العالم الحقيقي بشكل أكبر".

وبالعودة إلى "سورا"، فقد يرى البعض أن المنتج النهائي لا تشوبه شائبة في الوقت الحالي، لكن الشركة تؤكد أنه لا تزال هناك بعض نقاط الضعف، بما في ذلك بعض العناصر المتعلقة بالمكان وبعض النتائج التي لم تكن على المستوى المطلوب كما يظهر في هذا الفيديو:

أزمات قانونية وأخلاقية حالية ومستقبلية

وبحسب الخبراء فإن المشكلة القانونية والأخلاقية تعلقت في بداية الأمر بكيفية الحصول على بيانات التدريب لنماذج الذكاء الاصطناعي منذ أن أطلقت الشركة نموذج ChatGPT.

فقد تم اتهام كل من اوبن إيه آي وغوغل بـ”سرقة” البيانات بهدف تدريب نماذجهم الجديدة للذكاء الاصطناعي، أو بعبارة أخرى استخدام البيانات المأخوذة من وسائل التواصل الاجتماعي، ومنتديات الإنترنت وقواعد بيانات الكتب الخاصة، والمواقع الإخبارية دون الحصول على إذن مسبق.

وكان الرد هو أن الأساس المنطقي لاستخراج بيانات التدريب من الإنترنت بالكامل هو أن هذه البيانات متاحة للجمهور. لكنّ ما هو متاح للجمهور لا يجب نشره دائمًا في المجال العام.

على سبيل المثال، رفعت صحيفة نيويورك تايمز دعوى قضائية ضد شركتي اوبن إيه آي و مايكروسوفت بسبب انتهاك حقوق الطبع والنشر، زاعمة أن نماذج اوبن إيه آي استخدمت أعمال التايمز حرفياً أو استشهدت بالقصص بشكل غير صحيح.

واذا كان هذا هو الحال مع النصوص المكتوبة، فيمكننا أن تتوقع كيف سيكون الأمر مع كبار العاملين في صناعة الترفيه وخصوصاً في الولايات المتحدة.

انتهاك للخصوصية وحقوق النشر؟

أيضاً، تظل المشكلة قائمة، إذ لازلنا لا نعرف مصدر البيانات التي تم تدريب "سورا" من خلالها. كتب غاري ماركوس، خبير الذكاء الاصطناعي الذي أدلى بشهادته في جلسة استماع لجنة مراقبة الذكاء الاصطناعي بمجلس الشيوخ الأمريكي: "لقد التزمت الشركات الصمت بشأن الكيفية التي قاموا من خلالها بتدريب نماذج الذكاء الاصطناعي بل وما تم تدريب تلك النماذج عليه".

وأضاف: "يعتقد الكثيرون أنه من المحتمل أن يكون هناك منتجات استخدم فيها الذكاء الاصطناعي باستخدام محركات الألعاب مثل Unreal على سبيل المثال دون أن نعلم.. لذا لن أتفاجأ على الإطلاق إذا كان هناك أيضًا الكثير من التدريب لهذه النماذج من خلال المحتوى المنشور في موقع يوتيوب أو العديد من المواد المحمية بحقوق الطبع والنشر".

على الجانب الآخر، بدأ صناع محتوى الفيديو يشعرون بالقلق على مستقبلهم من وجود أداة تقوم بعمل ما يقومون به وفي المستبقل ربما تتجاوز جودة المواد المنتجة أبعد مما يمكن للبشر إنتاجه مهما حاولوا، وهو ما يهدد مصدر دخل ومسقبل الكثيرين حول العالم في هذه الصناعة.

لكن المتفائلين يرون أن هذا النوع من التطور قد يؤدي إلى زيادة الطلب على أدوات إنتاج الفيديو الإبداعية مثل Premiere ومع الوقت يمكن دمج مثل هذه التقنيات فيها، ما يحسن من جودة العمل بشكل مذهل، مع وجود اللمسة الإنسانية في المنتج النهائي.

ويرى آخرون أن هذه التقنيات ستتاح بشكل مبالغ فيه مادياً في البداية، ما يجعل إنشاء مقاطع الفيديو الطويلة أمرًا مكلفًا للغاية من الناحية المالية.

لكن الخبراء يتفقون في النهاية على أن البشرية في حاجة دائمة إلى التعديل والتطوير والابتكار، وأن الذكاء الاصطناعي سيعزز الإبداع البشري وسيظل للإنسان دائماً الأهمية الكبرى في هذا العالم المستقبلي.

يشهد الذكاء الاصطناعي في قطاع تكنولوجيا المعلومات تطورا متسارعا مع تصاعد المنافسة بين الشركات الكبرى التي تعمل كل منها على طرح منتجها الخاص لنيل حصة من سوق يعده البعض هو مستقبل التقنية الفعلي. فما أهم تطبيقاته ومزاياها؟

صورة من: Klaus Ohlenschläger/picture alliance

ما هو الذكاء الاصطناعي؟

الذكاء الاصطناعي (AI) هو برنامج حاسوب شديد التطور يحاكي السلوك البشري أو التفكير ويمكن تدريبه على حل مشكلات معينة. والذكاء الاصطناعي هو مزيج من تقنيات التعلم الآلي والتعلم العميق. يتم تدريب أنواع مختلفة ونماذج الذكاء الاصطناعي باستخدام كميات هائلة من البيانات ولديها القدرة على اتخاذ قرارات ذكية وأشهرها هو نموذج الذكاء الاصطناعي التوليدي.

صورة من: JOSEP LAGO/AFP/Getty Images

تشات جي بي تي من Open AI

أطلقت شركة اوبن ايه آي روبوت المحادثة Chat GPT بنسخته المجانية في نوفمبر من عام 2022 وبعدها بفترة وجيزة أطلقت نسختها المدفوعة Chat GPT 4. استقبل العالم تطبيق الذكاء الاصطناعي الواعد بحماس شديد وشيئا فشيئاً بدأ العالم يدرك انه على أعتاب حقبة جديدة. وفقًا لأحدث البيانات المتاحة، فلدى ChatGPT حاليًا أكثر من 100 مليون مستخدم. كما حقق الموقع 1.6 مليار زيارة في يونيو 2023.

صورة من: Harun Ozalp/AA/picture alliance

غوغل بارد Bard

في يوليو من عام 2023 أطلقت شركة غوغل برنامجها للذكاء الاصطناعي "بارد Bard" بعدة لغات محدودة ليضيف البرنامج بعدها بفترة قصيرة أكثر من 40 لغة. وإن كان البعض يعيب على النسخة المجانية لـ Chat GPT توقف معلوماتها عند العام 2021، فإن تطبيق غوغل Bard تجاوز هذه النقطة تماما

صورة من: David Talukdar/imagebroker/IMAGO

أمازون .. اليكسا وكود وسيبيرر

يتفوق نموذج التوليد اللغوي لأمازون LLM على تطبيق GPT3.5 بنسبة 16 نقطة مئوية (75.17٪).على مقياس ScienceQA. أصبح LLM الآن أكثر كفاءة في التعامل مع الأسئلة المعقدة. أيضاً طرحت أمازون برنامج Codewhisperer والذي يساعد مطوري البرمجيات على تحسين الإنتاجية

صورة من: Mike Stewart/AP Photo/picture alliance

بينغ تشات من مايكروسوفت

يعمل هذا النموذج من الذكاء الاصطناعي أيضاً بالتقنية نفسها التي يعمل بها Chat GPT. تم دمج Bing Chat في محرك بحث Bing الخاص بمايكروسوفت ، ويمكن استخدامه للإجابة على الأسئلة وإنشاء تنسيقات نصية إبداعية وترجمة اللغات.

صورة من: Jakub Porzycki/NurPhoto/IMAGO

جي بي تي - نيو

GPT-Neo هو برنامج من EleutherAI يعتمد أيضاً على تقنية ChatGPT، ولكنه مفتوح المصدر ومجاني الاستخدام. اكتسب نموذج الذكاء الاصطناعي GPT-Neo شعبية في الأشهر الأخيرة ، وقد يشكل تحديًا كبيراً لباقي نماذج الذكاء الاصطناعي في المستقبل.

صورة من: Friedrich Stark/epd-bild/picture alliance

سيري من آبل

سيري Siri هو أحد أشهر برامج الذكاء الاصطناعي حول العالم وتقوم شركة آبل بتطويره بشكل مستمر منذ فترة طويلة. تم دمجه مع العديد من منتجات آبل مثل الساعات الذكية والهواتف المحمولة والآيباد ويمكنه القيام بالكثير من المهام مثل تنظيم المواعيد وضبط المؤقت وتشغيل الموسيقى وتشغيل الخرائط

صورة من: Jakub Porzycki/NurPhoto/picture alliance

تطبيقات الشات بوت

تعتبر Chat Bots واحدة من أشهر وأوسع استخدامات الذكاء الاصطناعي انتشاراً حالياً حيث تقوم تلك البرمجيات بالرد على تساؤلات المستخدمين عبر الانترنت بصورة آلية وحتى الرد على الاتصالات الهاتفية وبعض النماذج الاكثر تطوراً تقوم ذاتياً بإنتاج مقاطع نصية مكتوبة متطورة بشكل كبير

صورة من: K. Thomas/blickwinkel/picture alliance

السيارات ذاتية القيادة

تم تطوير عدد من أنظمة الذكاء الاصطناعي لتقوم بقيادة السيارات بصورة آلية Self-driving Cars دون تدخل بشري حيث تستخدم الكاميرات المتصلة بالأقمار الاصطناعية في استكشاف الطريق وتخطي العوائق والزحام وتلتزم بإرشادات المرور المختلفة

صورة من: Volvo Cars/AP Photo/picture-alliance

التشخيص الطبي

في الوقت الحالي يتم استخدام عدد من تطبيقات الذكاء الاصطناعي والتي يمكنها مساعدة الأطباء في تشخيص بعض الأمراض Medical Diagnosis بشكل أكثر دقة وبسرعة غير عادية بناء على تحليل الصور على سبيل المثال

صورة من: Alexander Limbach/Zoonar/picture alliance

كشف التزوير

توجد عدة تطبيقات للذكاء الاصطناعي تعمل بكفاءة عالية لكشف عمليات التزوير والاحتيال وخصوصاً في المجال المالي والعمليات البنكية وغيرها من المجالات

صورة من: JANUSZ PIENKOWSKI/Zoonar/picture alliance

انتاج المحتوى الرقمي والفني

وهو أمر يثير بالفعل قلق الكثيرين حول العالم من كتاب سيناريو ومترجمين ومؤلفي موسيقى وحتى الرسامين والكثير من منتجي المحتوى باشكاله المختلفة. صحيح ان أغلب هذه البرامج لا تعمل بكفاءة مع لغة معقدة كاللغة العربية لكنها تعمل بكفاءة عالية للغاية مع اللغات ذات الأصل اللاتيني

صورة من: Simon Wohlfahrt/AFP/Getty Images

12 صورة

إعلان

تخطي إلى الجزء التالي المزيد من علوم في منطقة شمال أمريكا

المزيد من علوم في منطقة شمال أمريكا

بـ 64 مليون بعوضة .. حرب غوغل على الزاعجة المصرية!

تخوض غوغل معركة ضد البعوض الخطير بطلب يسمح بإطلاق 32 مليون بعوضة في كاليفورنيا وفلوريدا لخفض الأنواع الناقلة للأمراض.

"أرتميس 2" تستعد للعودة إلى الأرض ..و"كرة نار" تحبس الأنفاس

بعد 10 أيام في الفضاء وجولة تاريخية حول القمر، طاقم "أرتميس 2" يستعد للعودة إلى الأرض

ألبوم صور: لقطات لا تنسى من مهمة "أرتميس 2" حول القمر

اختتم روّاد الفضاء ضمن مهمّة "أرتميس 2" رحلتهم حول القمر وعادوا إلى الأرض، حاملين معهم ملاحظات فلكية غنية.

المزيد

تخطي إلى الجزء التالي المزيد من علوم من أرجاء العالم

المزيد من علوم من أرجاء العالم

نبوءة فرانكشتاين".. الذكاء الاصطناعي يتمرد على البشر؟

حذرت نتائج دراسات حديثة من خروج الذكاء الاصطناعي عن سيطرة الإنسان في الأشهر المقبلة. كيف؟

تقنية التبريد لحماية التربة الصقيعية في جبال الألب

مع ذوبان التربة الصقيعية في جبال الألب السويسرية، ينشر العلماء تقنية تبريد لحماية محطة جبلية.

ماذا لو لعب الرجال الكرة في نفس ظروف النساء؟

في تجربة سويسرية، يلعب الرجال بكرات أثقل وعلى ملاعب ضخمة بمرمى أكبر، ليشعروا بالتحديات التي تواجهها النساء.

المزيد

تخطي إلى الجزء التالي موضوع DW الرئيسي

موضوع DW الرئيسي

صُوْر تعيش الخوف والنزوح .. هل تتوسع إسرائيل في جنوب لبنان؟

يخشى السكان الذين نزحوا من بلدات ومدن جنوب لبنان، أن تسيطر إسرائيل على منازلهم بشكل دائم أو مواصلة توسيع نطاق سيطرتها.

عون: لن ننسحب من المفاوضات مع إسرائيل رغم الضغوط

ماذا طلب البنتاغون من الجيش اللبناني وراء الأبواب الموصدة؟

توتر سياسي في لبنان.. عون يفتح النار على إيران وحزب الله

تخطي إلى الجزء التالي المزيد من الموضوعات من DW

المزيد من الموضوعات من DW

طرد ثلاثة لاعبين وفوز المكسيك في أول مباريات كأس العالم 2026

حققت المكسيك فوزا سهلا في أولى مباريات كأس العالم 2026 بهدفين نظيفين على جنوب إفريقيا التي أكملت المباراة بتسعة لاعبين.

حرب إيران: هل انتهت منظومة الردع في الشرق الأوسط؟

مع حرب إيران، هل انتهت منظومة الردع القديمة، ومن يملك اليوم القدرة الفعلية على فرض قواعد اللعبة؟ طهران أم واشنطن؟

ملفات إبستين تعيد فتح لغز اختفاء شابة ألمانية قبل عشر سنوات

بعد أكثر من عشر سنوات على اختفائها بلا أثر، ظهر اسم الشابة الألمانية ميشيل في ملفات جيفري إبستين.

العراق اليوم: شباب كردستان تحت رحمة ميليشيات ليبيا

هدّدوهم بانتزاع الكلى. أكثر من 300 شاب من كردستان العراق وقعوا ضحايا شبكة تهريب عبر ليبيا، تعرّضوا للاختطاف والتعذيب.

مع تراجع الخصوبة.. "الشتاء الديموغرافي" يهدد العالم العربي

من "القنبلة السكانية" إلى شبح الشيخوخة.. أرقام صادمة تكشف أن معدلات الخصوبة في الدول العربية تتهاوى بوتيرة غير مسبوقة.

مراجعة حق المواطنة بالولادة في الولايات المتحدة

يسعى ترامب إلى تقييد حق المواطنة بالولادة في الولايات المتحدة الأمريكية ومن المنتظر الآن أن تحسم ذلك المحكمة العليا.

الانتقال إلى الصفحة الرئيسية

إعلان