أدوات التلخيص باستخدام الذكاء الاصطناعي: هل هي مساعدة حقًا؟

استمع إلى المقال

مع تغلغل نماذج الذكاء الاصطناعي في مختلف جوانب حياتنا العملية والشخصية والترفيهية وغيرها، تحتدم المنافسة بين الشركات التقنية على تقديم أفضل النماذج التي تساعد البشر في حلّ مشاكلهم المعقدة أو تلك التي تستغرق وقتًا طويلًا بكفاءةٍ وسرعة. وفي عصرٍ تتسارع فيه وتيرة المعرفة وتزداد معها صعوبة المواكبة، انبثقت العديد من أدوات التلخيص القائمة على الذكاء الاصطناعي التي تعمل على تلخيص المراجع والكتب والمقالات والأبحاث إلى مواد قصيرة سهلة الفهم هدفها اختصار الوقت والجهد على القارئ أو الباحث بحيث يحصل على الخلاصة دون الحاجة لقراءة الكتاب أو البحث كاملًا. لكن هل هي فعلًا أفضل حل لمواكبة المعرفة؟ وهل من المنصف بحق الكاتب أو الباحث الأصلي تلخيص جهده إلى ما لا يتجاوز الـ ـ5% من حجمه وادّعاء أن ذلك كافٍ؟ للإجابة على هذه الأسئلة، كان علينا اختبار بعض هذه الأدوات، واستنتاج ما يمكننا استنتاجه.

أداة Scholarcy Smart Synopsis لتلخيص الأبحاث الأكاديمية

بدأ تطوير أداة Scholarcy Smart Synopsis في بداية عام 2018 بناءً على حاجة مؤسسها لفرز الأوراق البحثية الكثيرة التي كانت بين يديه عند إعداده لرسالة الدكتوراه خاصته، بحسب قوله. ويقول موقع الأداة: “مهمتنا في Scholarcy هي مساعدتك على قراءةٍ أقل وفهمٍ أكثر. نقوم بذلك من خلال إعطائك أكثر من مجرد الملخص أو المقدمة، فنحن نقدم لك السياق، ونُبرز الأقسام الرئيسية لك ونتيح لك بسهولة حفظ أو تصدير ملخصاتك للعودة إليها لاحقًا.”

وفي تواصلٍ خاص لكاتب المقال مع إحدى المؤسسين للأداة، قالت: “باستخدام تقنية الذكاء الاصطناعي، تلخص أداة Smart Synopses الأوراق البحثية بأسلوبٍ صحفي، وتستخرج منها معلوماتٍ مفيدة أخرى؛ بما في ذلك المشاركين في الدراسة، وأحجام العينات، وقيود الدراسة، وكذلك كيف بنت الورقة البحثية معلوماتها على الأبحاث الأخرى في فهرس المراجع.”

وبالفعل، اختبرتُ في البداية النسخة المجانية من الأداة لمدة يومٍ كامل وعلى عشرة أوراقٍ بحثية؛ تنوعت بين كافة المجالات، الطبي والإداري والاجتماعي والتقني، وبين كافة الأطوال (بين 7 صفحات و 70 صفحة)، وفي اللغتين العربية والإنجليزية. وكانت النتائج ما يلي:

الأداة لم تعمل مع الأبحاث العربية على الإطلاق.
الأداة قد تخلط أسماء الباحثين مع أسماء جامعاتهم. ففي أحد الأمثلة، أخرجت الأداة ملخصها باسم “الدكتور محمد دبي”، إلا أن دبي كانت، وضوحًا، تعود لاسم الجامعة وليس الاسم الأخير للباحث.
لم تستخرج الأداة البيانات من الجداول.
قد تخطئ الأداة وتتداخل معلوماتها إذا كان للبحث تصميم خاص. (لكن هذا ليس خطأ الأداة على أية حال).
الأداة تعمل بشكلٍ رائع مع الأبحاث القصيرة، لكنها قد تغفل بعض المحاور المهمة في الأبحاث الطويلة.
لم تخطئ الأداة بذكر الأرقام (مثل عدد المشاركين والنسب في النتائج)، لكنها لم تذكر كافة الأرقام والنسب، وهو ما يشكّل جوهر العديد من الأبحاث.

الخلاصة، أفضل استخدامٍ للأداة هو في دراسات الحالة أو (ـcase studies) والأبحاث التي لا يتجاوز طولها الـ10 صفحات. لكن لأخذ فكرةٍ عامة عن البحث لا أكثر، فهي لا تغني، ولا بأية شكل، عن قراءة البحث.

أما عند اختبار النسخة المدفوعة من الأداة، فكان هناك تحسنًا ملحوظًا في بعض المناطق. إلا أنها ظلت تختصر الكثير من الأجزاء المهمة في البحث، إلا أنها كانت تترك دليلًا على مكان كل فقرة مستخلصة من البحث فيما لو أراد القارئ الاطلاع على النص الكامل.

أداة OpenAI لتلخيص الكتب

قام فريق شركة OpenAI مؤخرًا بتدريب نموذج ذكاء اصطناعي لتلخيص الكتب. ويزعم الفريق أن النموذج يمكن أن يساعدك باستخدام معالجة اللغة الطبيعية من خلال نموذج GPT-3 في الحصول على جوهر كتاب بأي طول. و GPT-3 تعني (Generative Pre-trained Transformer 3)، أي المحوّل التوليدي المدرّب مسبقًا، هو نموذج لغوي آلي يستخدم التعلم العميق لإنتاج نصوص تشبه كلام الإنسان.

لإنشاء النموذج، جمعت OpenAI بين التعلم المعزز مع تحليل المهام التكراري؛ والذي يقسّم من الناحية الإجرائية مهمة صعبة (مثل تلخيص جزء طويل من النص) إلى مهام فردية أبسط (مثل تلخيص عدة أجزاء أقصر). ويسمح هذا للبشر بتقييم ملخصات النموذج بسرعة من خلال قراءة أجزاء أصغر من الكتب. علاوةً على ذلك، فهذا النهج يمكّن النموذج من تلخيص الكتب أيًا كان طولها، من عشرات إلى مئات أو حتى آلاف الصفحات.

قامت OpenAI بتدريب النموذج على مجموعة من الكتب في مجموعة بيانات التدريب الخاصة بـ GPT-3 والتي كانت في الغالب من مجموعة متنوعة من القصص الخيالية يبلغ مجموعها أكثر من 100 ألف كلمة. ولتقييم النموذج، أخذ باحثو المختبر أكثر 40 كتابًا شيوعًا تم نشرها في عام 2020 وفقًا لـ Goodreads وخصصوا شخصين لقراءة كل كتاب وكتابة ملخص ثم تقييم الملخصات التي كتبها كل من النموذج والأشخاص.

وفي حين أن النموذج نجح في إنشاء ملخصات لكتبٍ ضخمة تحتوي على الكثير من المعلومات المهمة، إلا أنه وقع أحيانًا في فخ البيانات غير الدقيقة بسبب عدم وجود سياق. علاوةً على ذلك، غالبًا ما قدّمت ملخصات النموذج قائمة أحداثٍ من الكتاب بدلاً من ملخص متماسك، مما يكشف عن قصورٍ في تحليل المهام المنفصلة. إذ يفترض تحليل المهام أنه يمكن إكمال أجزاء منفصلة من المهمة الكبرى بشكلٍ مستقل، لكنها قاعدة قد لا تكون صحيحةً فيما يتعلق بتلخيص الآلة للكتب. على سبيل المثال، قد يكون من الصعب تحديد الحالات التي لا تنكشف فيها أهمية تفاصيل معينة وردت في بداية الكتاب إلا عند نهايته، كما هو الحال في كتب الغموض؛ مثل رويات الكاتب الإنجليزي آرثر كونان دويل الشهيرة؛ سلسلة شيرلوك هولمز.

ما المشكلة مع هذه الأدوات؟

إن هاتين الأداتين ليستا أول من يحاول استخدام الذكاء الاصطناعي لحلّ مشكلة التلخيص. إذ تستخدم بعض الشركات؛ مثل Primer، وهي شركة تقدم تطبيقات معالجة اللغة الطبيعية للهيئات الحكومية والمؤسسات المالية والشركات والعديد من المنظمات الأخرى، تقنيات التعلم الآلي للمساعدة في تحليل وترتيب عدد كبير من المستندات عبر عدة لغات. كما قامت جوجل بالبحث في طرق التلخيص التي يمكن أن تولّد ملخصات مجرّدة للفقرات (مايكروسوفت فعلت ذلك أيضًا). وبحسب بعض المصادر، فإن فيسبوك تطور أداة ذكاءٍ اصطناعي تلخص المقالات الإخبارية حتى لا يضطر المستخدمون إلى قراءتها كاملة. ولهذه الأدوات مخاطر عدة.

أولًا، المحتوى نفسه، فبعد اختبار أفضل الأدوات وبإصداراتها المدفوعة، اتضح أن الآلة لا تزال عاجزةً على استنباط أهم المحاور في بحثٍ أو كتاب ووضعها ضمن سياق، ناهيك عن مدى نجاعة التلخيص بحد ذاته، آليًا كان أو بشري. فقد يجادل البعض أن ضرورة هكذا أدوات تكمن فيما لو أراد الشخص الإحاطة بمضمون البحث أو الكتاب دون اللجوء لقرائته، لكن هذا ممكن على أية حال من خلال قراءة خلاصة البحث (Abstract) أو مقدمة الكتاب.

ثانيًا، هناك مخاطر من أن تصبح خوارزميات الذكاء الاصطناعي هذه هي الطريقة المفضلة لتلخيص الكثير من أخبار اليوم. بعد كل شيء، يمكن تدريب هذه النماذج على تضمين عنوان قابل لتحقيق أكبر عددٍ ممكنٍ من النقرات وكلمات رئيسية لتحسين محركات البحث. وفي حين أنه قد يوفر أيضًا وقتًا للصحفيين للعمل في مشاريع أكثر أهمية، إلا أن ذلك يتطلب المزيد من التحقق والإشراف المباشر.

بعد كل شيء، فإن العديد من نماذج معالجة اللغة الطبيعية الأساسية متحيزة سلوكيًا، وتنفيذ خوارزميات التلخيص هذه على نطاقٍ واسع يمكن أن يكون له أضرار غير مقصودة. هناك أيضًا مخاوف من أن أتمتة عملية جمع الأخبار يمكن أن تلحق المزيد من الضرر بالصحافة والكتابة وقيمتهما.