استمع إلى المقال

الذكاء الصنعي التوليدي، أو (Generative Artificial Intelligence)، القائم على توليد الصور والنصوص والموسيقى وغيرها من المنتجات بواسطة الآلة اعتمادا على مدخلات نصية يدخلها المستخدم البشري، تصدر المشهد التقني هذا العام دون منازع، لتقفز قيمته السوقية من 8 مليارات دولار أميركي عام 2021، إلى أكثر من 10 مليارات دولار هذا العام، ومن المتوقع أن تصل إلى 110 مليارات دولار مع حلول 2030.

الصور المولّدة بواسطة الذكاء الصنعي كان لها نصيب الأسد من الحديث والجدل الدائر حولها، إذ انقسم المتناظرون بشأنها إلى فريقين، فريق أول يرى فيها تطورا طبيعيا للأدوات الرقمية التي تساعد الفنانين على عرض رؤاهم وتحسين أعمالهم، حالها حال أدوات “أدوبي”، بينما يرى الفريق الآخر بأن هذه الأدوات تُعدّ انتهاكا لحقوق أعمال الفنانين البشريين وتقويضا لخبراتهم ومهاراتهم.

“آرت ستيشن”، هي منصة تسمح لفناني الألعاب والأفلام والوسائط والترفيه بالتواصل وعرض أعمالهم الفنية، شهدت خلال الأيام الماضية إغراقا بصورة نُشرت مرارا وتكرارا من قبل مستخدمين مختلفين، عليها علامة “لا” حمراء كبيرة تغطي كلمة “AI” (أي الذكاء الصنعي) مقترنة بتعليق نصه “لا للصور المولدة بواسطة الذكاء الصنعي”.

ابتداء من يوم الثلاثاء، بدأ الفنانون في الاحتجاج على المنصة عن طريق تحميل الصورة على ملفاتهم الشخصية، بعد أن أشار بعض المستخدمين إلى أن الفن الذي تم إنشاؤه بواسطة الذكاء الاصطناعي يتم عرضه على صفحة الاستكشاف الرئيسية للموقع.

بالنسبة للعديد من الفنانين في “آرت ستيشن”، فإن تجاور الصور التي تم إنشاؤها بواسطة الذكاء الصنعي مع أعمالهم الخاصة أمر مهين ويقوض الوقت والمهارة التي تدخل في فنهم. كما تعرضت أدوات إنشاء الصور التي تعتمد على الذكاء الصنعي لانتقادات شديدة من قبل الفنانين، لأنها مدربة على فن من صنع الإنسان يتم مسحه عبر الويب، ثم تعيد مزجه بشكل فعّال أو حتى نسخه عن كثب دون إسناد.

فنانون مستاؤون

احتجاج الفنانين ضد الفن المولّد بالذكاء الصنعي انتشر على نطاق واسع مؤخرا، مع تزايد شعبية الأدوات المولدة لهذا الفن. وفقا لموقع “TechCrunch”، يحتل تطبيق “Lensa AI” الشهير، والذي يستخدم الذكاء الصنعي لتحويل صور المستخدمين الشخصية إلى شخصيات مختلفة من خلال ميزة “Magic Avatars”، المركز الأول في متاجر التطبيقات ويليه مباشرة تطبيقان آخران لتوليد وتحرير الصور بواسطة الذكاء الصنعي.

“Lensa AI”، الذي يستخدم نموذج “Stable Diffusion” مفتوح المصدر لتحويل الصورة إلى نص، واجه ردود فعل عنيفة من الفنانين الذين قالوا إن عملهم قد سُرق لإنشاء تلك الصور. إذ ادعى أولئك الفنانين أن الذكاء الصنعي تم تدريبه على أعمالهم الفنية دون إذن، وهو ما تم تأكيده عندما رأى العديد منهم جوانب من أعمالهم تظهر في الفن الذي تم إنشاؤه بواسطة الذكاء الصناعي، بما في ذلك تواقيعهم.

الفنان ديفيد أوريلي احتج كذلك على محرك آخر لتحويل النص إلى صورة بواسطة الذكاء الصنعي، وهو “Dall-E”، قائلا في منشور على “إنستجرام”، “إن دفع المال مقابل ذلك -يقصد تلك الصور- يدر الأرباح على شركة تقنية على أكتاف جهود بشرية استمرت لقرن من الزمان. يقوضDalle-E عمل المبدعين من جميع الأنواع، وعلى وجه الخصوص المصورين والرسامين وفناني المفاهيم الذين شاركوا أعمالهم عبر الإنترنت ولم يطلبوا أبدا أن يتم تضمينها في نموذج تعليمي خاص بالآلة”.

نتيجة لذلك، يدعو العديد من الفنانين الجمهور إلى مقاطعة الفن المولّد بواسطة الذكاء الصنعي ومولّدي هذا الفن من أجل دعم أخلاقيات الفنانين. كما تبعتهم بعض الشركات الفنية الأخرى، مثل مواقع الصور الأشهر  “Shutterstock” و”Getty Images” اللذين حظرا تحميل وبيع صور الذكاء الصنعي بسبب مخاوف تتعلق بحقوق النشر، وكذلك شركة “BOOM Studios” لصناعة القصص الهزلية المصورة التي أكدت، بأشد العبارات، أنها ستمنع وتحارب أي عمل مولّد بواسطة الآلة، إذ قال مديرها التنفيذي “لا يوجد مكان للمحتالين في هذه الصناعة”.

قد يهمك: هل يعيد “Lensa” المخاوف من تطبيقات تعديل الصور بالذكاء الصنعي؟

مشكلة في تدريب هذه الأدوات؟

نموذج الذكاء الصنعي االمستخدم حاليا لإنتاج الرسومات عبر التوصيف النصي اسمه “Latent Diffusion”، وھو ينتمي إلى عائلة من النماذج اسمها نماذج “Diffusion”.

الدكتور حسان أبو الهيجاء، الباحث في الذكاء الصنعي والرؤية الحاسوبية من جامعة “هايدلبيرغ” الألمانية يشرح في حديثه لموقع “إكسڤار” طريقه عمل ھذه العائلة من النماذج.

بعكس النماذج السابقة لإنتاج الرسومات التي نتنج الرسم أو الصورة دفعة واحدة، نماذج “Diffusion” تنتج الرسوم على عدد كبير من الخطوات، وفي كل خطوة يتم تحسين الرسم قليلا عن الخطوة السابقة.

في مرحلة التدريب، يتم استخدام عدد كبير جدا من الصور والرسوم الحقيقية المرسومة من قبل بشر لتدرﯾب النموذج عن طريق إضافة ضجيج عشوائي إلى الرسوم الحقيقية لتشويهها قليلا، ثم تدريب نموذج الذكاء الصنعي على استرداد الصورة الأصلية من الصورة المشوھة.

تدريب النموذج على ھذه المهمة يتم لمئات ملايين المرات، وعلى مدى أسابيع وأشهر من التدريب، مع زيادة نسبة الضجيج المضاف إلى الصورة. أﺧﯾرا، بعد انتهاء التدريب، يصبح النموذج قادرا على إنتاج رسومات بداية ﻣن صورة ضجيج عشوائي فقط، على عدة خطوات (تبلغ عادة حوالي 50 خطوة).

النموذج المدرب المنتشر حاليا اسمه “Stable Diffusion”، وھو نسخة مدربة من نموذج “Latent Diffusion” المذكور أعلاه، وتم تدريبه من قبل شركة “Stability AI”، وهو متوفر للجميع بشكل مجاني ومفتوح المصدر.

عملية تدريبه تمت على قاعدة بيانات مفتوحة المصدر، مجانية وغير ربحية، اسمها “LAION-5B” تحتوي على خمسة مليارات رابط لصور موجودة بشكل مفتوح وعلني على شبكة الإنترنت مع توصيف نصي ومعلومات عن كل صورة.

اﻟﮭدف ﻣن ﻗﺎﻋدة اﻟﺑﯾﺎﻧﺎت ھذه ھو اﻟﺳﻣﺎح ﻟﻠﺟﻣﯾﻊ ﺑﺗطوﯾر ﻧﻣﺎذج ذﻛﺎء ﺻﻧﻌﻲ ﺑﺷﻛل ﻣﻔﺗوح وﺷﻔﺎف وﻣﺗﺳﺎوِ بموارد ﻣﺣدودة، ذلك لأن اﻟﺷرﻛﺎت اﻟﻌﻣﻼﻗﺔ ﯾﻣﻛن أن ﺗﺻﻧﻊ ھﻛذا ﻗﺎﻋدة ﺑﯾﺎﻧﺎت ﺑﺳﮭوﻟﺔ ﺧﻠف أﺑواب ﻣﻐﻠﻘﺔ، ﻣﺎ ﻗد ﯾﺟﻌﻠﮭﺎ ﺗﺣﺗﻛر ﺗﻛﻧوﻟوﺟﯾﺎ ﺗوﻟﯾد اﻟﺻور ﻓﻲ اﻟﻣﺳﺗﻘﺑل.

الدكتور حسان أبو الهيجاء

قد يهمك: حوار حصري لـ”إكسڤار” مع صاحب أشهر صورة مولّدة بالذكاء الصنعي في العالم

ھل يجب إعطاء موافقة؟

الدكتور أبو الهيجاء، يجيب لا “لا تشترط قاعدة بيانات LAION-5B وجود موافقة صريحة مسبقة من قبل صاحب حقوق ملكية الصورة أو الفنان كي يُضاف عمله إلى قاعدة البيانات، لكن تسمح قاعدة البيانات لأي فنان بإﺧراج أعماله منها إذا أراد أن يمنع الشركات من استخدامها في تدريب النسخ القادمة من النماذج المدربة عن طريق موقع (haveibeentrained.com) الذي يسمح بالبحث داخل قاعدة البيانات وإرسال الاعتراضات لحذف الصور من قاعدة البيانات”.

ﺑﻣﻌﻧﻰ آﺧر، يُعتبر من المسموح استخدام ﻛل اﻟﺻور واﻟرﺳوم اﻟﻣﺗوﻓرة ﺑﺷﻛل ﻣﻔﺗوح ﻋﻠﻰ الإﻧﺗرﻧت طالما لم يعترض ﺻﺎﺣب اﻟﻌﻣل.

الدكتور حسان أبو الهيجاء

الدكتور أبو الهيجاء، يوضح أن المشكلة الحقيقية ھنا أنه لا يوجد طريقة فعالة للتحكم والتأكد ﻣن كيفية استخدام الصورة الموجودة على الإنترنت بشكل مفتوح ومن قِبل مَن، وبالتالي، فإن وضع قواعد مبنية فقط على “ميثاق الشرف” بأن تتعهد بعض الشركات بعدم استخدام الصور دون موافقة مسبقة، سوف يعطي أولوية كبيرة للأشخاص والشركات الذين لا يعترفون بهذه القواعد للسيطرة على ھذه التكنولوجيا.

ما الفرق بين “الإلهام البشري” وما تفعله الآلة؟

ھذا السؤال صعب جدا، وهو ﻣرﻛز دوامة الجدل بين الفنانين ومهندسي الذكاء الصنعي حاليا، يجيب الدكتور أبو الهيجاء “برأيي، إن ما تفعله خوارزميات التعلم الآلي حاليا ھو شيء أكثر من مجرد الإلهام، لكنه في نفس الوقت، أقل من إعادة إنتاج مباشرة للأعمال الفنية”.

إحدى أھم مهام خوارزمية التعلم الجيدة أثناء تدريب نماذج الذكاء الصنعي ھي، أني تمنع النموذج من إعادة إنتاج مجموعة التدريب بشكل حرفي (ﻣﺎ ﯾﺳﻣﻰ ﺑﻣﺷﻛﻠﺔ “over-fitting”). ﺑﻣﻌﻧﻰ آﺧر، إعادة إنتاج صور التدريب بشكل دقيق وحرفي ھي مشكلة وسلبية من وجهة نظر خوارزمية التعلم، وليست إيجابية.

الدكتور حسان أبو الهيجاء

ھذه نقطة مركزية في ھذا النقاش، لأن ھذا يعني أنه مع تطور تقنيات ونماذج الذكاء الصنعي، فإنها تقترب أكثر من مرحلة الإلهام، وتبتعد عن “الحفظ”، وعليه، ستقل نسبة الأعمال المنسوخة حرفيا، وتزداد نسبة الرسوم المبتدعة بشكل جديد من قبل الذكاء الصنعي.

النقطة الأخرى هي أن نماذج الذكاء الصنعب، من وجهة نظر الدكتور أبو الهيجاء، ما تزال تفتقد للجزء الأهم من العمل الفني، التفكير الإبداعي “ھناك فرق بين الرسم كمهارة تتطلب إمكانيات تقنية كبيرة في تحريك القلم والفرشاة لتحويل صورة معينة من خيال الفنان إلى الورق أو اللوحة، وبين الفن كتفكير إبداعي ينتج صور في مخيلة الفنان تعبر عن فكرة أو شعور أو قضية اختارها واختار طريقة التعبير عنها بشكل معين”.

ھذا الفرق يتضح عندما يعيد شخص ما إنتاج لوحة شهيرة لفان غوخ مثلا، نعتبر أن ھذا دليل على “مهارة عالية”، وليس على “إبداع فني”، وبالتالي، فإن اللوحة الجديدة أقل قيمة من الأصلية.

نماذج الذكاء الصنعي لإنتاج الصور تسرع الجزء المهاري من الرسم، بحسب الدكتور أبو الهيجاء، لكنها عديمة الهدف وغير قادرة على الاختيار بين الكم اللانهائي من الرسوم الممكنة. العمل الإبداعي ما زال يقع على عاتق المستخدم البشري، من ناحية الاتيان بفكرة جديدة أو أسلوب تعبير مبتكر عنها باستخدام النموذج الآلي من خلال إدخال توصيف نصي مفصل ومحدد قد يصل إلى عشرات، أو حتى مئات الكلمات.

ھل تستطيع الآلة حل المشكلة؟

ﻣن الممكن، من الناحية التقنية، على سبيل المثال، أن تتم برمجة الآلة على أن تتحقق من الصورة/المنتج النهائي قبل إرجاعها للمستخدم، فإن كان فيها تطابق يتجاوز الـ 30 بالمئة مع صور أخرى، تعود وتدمج عناصر من صور أخرى.

لكن الدكتور أبو الهيجاء، يقول إنه من الصعب معرفة ما إذا ﻛﺎن ذلك سيحل المشكلة الحالية. أولا، ھناك عشرات الطرق لقياس “المسافة” بين صورتين، وكل منها تعبر عن معنى مختلف للمسافة بين الصور.

“على سبيل المثال، فإن قياس وسطي الفرق بين قيم البيكسلات في الصورتين ھو مقياس بسيط، ولكنه سيئ جدا في هذه الحالة نظرا لتشابه الصور. مثلا، لو أخذنا صورة ملونة وحولناھا للأبيض والأسود، سوف يكون فرق القيمة بينها وبين الصورة الملونة أكثر ﻣن 50 بالمئة، ولكن بالنسبة للإنسان، فإن كلا الصورتين متطابقتين، لكن بفارق بسيط جدا. أما إذا قسنا الفرق بين لوحة الموناليزا وصورة برج إيفل مثلا، سوف نجد الفرق أقل ﻣن 30 بالمئة. وبالتالي، فإن مدى صحة مقياس التطابق بين الصور ھو موضوع نسبي، ويعتمد على تعريف غير موضوعي للتطابق بين الصور”.

ثانيا، التشابه غالبا لا يكون مع صورة واحدة فقط، إنما ھو تشابه مع مجموعة صور وأنماط فنية. على سبيل المثال، يمكن أن يكون الرسم المنتج من قبل الذكاء الصنعي ھو صورة لآينشتاين بنمط فني يعود لبابلو بيكاسو. “ھل ھذه الصورة مشابهة لصورة آينشتاين أم للوحة بيكاسو؟ ھل ھي لوحة جديدة و”إبداع” من الذكاء الصنعي؟ ھذه أسئلة صعبة، وليس لدينا إجابات واضحة عليها على المستوى الأخلاقي، قبل محاولة تطبيقها تقنيا على النموذج”.

لمن الحق؟

بحسب الدكتور أبو الهيجاء، فإن قوانين حماية الملكية الفكرية تحمي الاستخدام المباشر للأعمال المحمية وإعادة إنتاجها بغرض الربح، ولكنها أيضا تسمح عادة بما يسمى بـ “الاستخدام العادل” للأعمال المحملية بحقوق الملكية دون موافقة صاحب العمل.

ذلك يشمل عادة استخدام العمل للتعلم أو الإلهام أو المقارنة والنقد، فالفرق الجوهري بين الحالتين ھو ھدف استخدام العمل الفني. يقول الدكتور أبو الهيجاء، إذا كان الهدف ھو الحفاظ على العمل الأساسي قدر الإمكان فهذا يعتبر “إعادة إنتاج” غير مسموح حسب حقوق الملكية، أما إذا كان الهدف ھو إنتاج عمل فني جديد بفكرة أصلية جديدة بعد رؤية العمل الأصلي، فهذا يعتبر بمثابة “إلهام”، وهو ما تشمله قواعد الاستخدام العادل.

قد يهمك: محركات تحويل النص إلى صورة: لا تزاحم الفنان البشري، بل قد تساعده

هل أعجبك المحتوى وتريد المزيد منه يصل إلى صندوق بريدك الإلكتروني بشكلٍ دوري؟
انضم إلى قائمة من يقدّرون محتوى إكسڤار واشترك بنشرتنا البريدية.