هزيمة اللغة العربية ..

النجاح الإخباري - غازي مرتجى

تصفّح معي الفيسبوك، ستجد كل ما يُكتب متشابهًا: "ليس… بل"، "حتى إنّ"، وهكذا. اللغة فيه لا تشبه عربية أحد. ليست شامية، ولا مصرية، ولا خليجية، ولا حتى الفصحى الصحفية التي نقرأها يوميًا. هي عربية مُترجمة من الإنجليزية بدقة عالية… لكنها تخلو من الروح.

لماذا هذا خطر؟ لأن النموذج الذي يكتب بهذه العربية المُترجمة، هو الذي سيدرّب الجيل القادم. وحين يكتب جيل كامل بعربية مترجمة، نكون قد فقدنا أكثر مما نتخيّل. فقدنا اللغة كأداة تفكير.

كل النماذج اللغوية الكبرى أمريكية التقنية، وحتى تلك الصينية تتدرّب على النصوص الإنجليزية بشكل أكبر… لك أن تتخيّل أصلًا أن 3% فقط من محتوى الإنترنت مكتوب بالعربية، والباقي بلغات أخرى!

اطلب من النموذج نصًا قانونيًا، طبيًا، شرعيًا، أدبيًا — تجد ضعفًا واضحًا. لم يقرأ كثيرًا من النصوص العربية المتخصصة، فلا يستطيع توليدها بكفاءة. اطلب منه أن يصف القرية الفلسطينية، يصفها كما يصفها سائح أجنبي…

الأخطر، أن التراث مفقود. الأدب العربي الكلاسيكي، الفقه، الشعر، النثر القديم — كل هذا غائب أو مشوّش في النماذج الكبرى. حتى لو قلت له "اكتب لي رواية" (وقد واجهناها في روايتنا الأولى) يكتبها كأنه أديب هجين أو مستشرق — بغباء!

ماذا يحدث للغة حين تُكتب بآلة لا تفكّر بها؟

العربية، تاريخيًا، تنتج عقلًا معينًا. تكرار للتأكيد. استطراد بلاغي. والنموذج الذي يكتب بالعربية وهو يفكّر بالإنجليزية، يُنتج نصًا عربيًا بمنطق غير عربي. جمل قصيرة، نقاط مرتبة، استدلال خطّي، خاتمة سريعة. تبدو "عربية أفضل". لكنها عربية مُستعمَرة… بلغة أخرى تختبئ خلفها.

الكارثة تبدأ حين يقرأ شاب عربي مئات النصوص بهذه العربية المُستعمَرة، ويبدأ في الكتابة بنفس النمط. يفقد إيقاعه الأصلي تدريجيًا. ولا يلاحظ، لأن النموذج يخبره أن كتابته "ممتازة". لكنها ممتازة وفق معايير ليست عربية أصلًا.

أين نقف عمليًا؟

البيانات النوعية شحيحة. كثير من النص العربي على الإنترنت ضعيف، منسوخ، أو بجودة منخفضة. النماذج تتدرّب على ما هو متاح. نحتاج لرقمنة أفضل وكثير من النصوص.

هل تعلم أن النموذج يتدرّب الآن على النص الذي قام هو بإنتاجه؟ تخيّل معي الفيسبوك وهو مليء بالتصاميم المشغولة بالذكاء الاصطناعي، فيقوم بالتدرّب على هذه التصاميم… فماذا سينتج؟ سيبقى معتقدًا أنه يتعلّم، وهو يتعلّم من نماذج صنعها بنفسه. بالتالي ستزداد القتامة والاضمحلال.

أمّا الجامعات، فهي أول من تأثّر بترك العربية كلغة أصيلة. الباحث بات مضطرًا للنشر بالإنجليزية لأن الأبحاث لا تُعتمد إلا بهذه اللغة، ومضطرًا لكتابة مشروعه باللغة الإنجليزية لذات السبب. بالتالي، الإنتاج المعرفي باللغة العربية أقرب إلى الصفر!

المطلوب

استثمار عربي طويل المدى بالنماذج العربية. هناك كمٌّ معرفي وثقافي مخفيّ في الدول العربية، يجب البدء بجمعه ورقمنته. هذا سيساعد.
تشجيع الجهات المالكة للداتا (مكتبات، جامعات، دور نشر…) على تجميع هذه النصوص في قاعدة مفتوحة بمقابل مالي، يعني أن هناك نموذجًا عربيًا أصيلًا في الطريق.
البدء بنماذج صغيرة. لدينا الآن، على سبيل المثال، نموذج يفهم اللهجة الفلسطينية، لكن تدريبه الأصلي من نموذج مفتوح! بالتالي يفهم اللهجة الفلسطينية (التشَ) الأصلية، لكنه يردّ بروح الـ(هاي) الغربية…

فلسطينيًا

نحن الفلسطينيين لا نملك سوى سرديتنا، وهويتنا الأدبية الزاخرة بآلاف المصطلحات والمطبوعات والكلام العربي الأصيل… ولدينا تاريخ شفهي أكبر بكثير من المكتوب والمرقمن. وهنا يأتي دور الدولة الفلسطينية لحفظ هذا الإرث، بدلًا من أن يبقى مبعثرًا بلا هوية.

باتت الهوية المكانية تطغى على الهوية الوطنية الجامعة بسبب عدم وجود ثقافة موحّدة للفلسطينيين! هذا يلزمه أن تأخذ الجهات الرسمية دورها في البدء بحفظ الأرشيف المحكي، والأرشيف المنسي أيضًا، ليكون أساسًا في التدريب.

على حدّ فهمي البسيط، فإن تكرار كلمة "شهيد" في النماذج يجعل النموذج أكثر وعيًا لمعنى الكلمة. فهل عندما نكتب "ش..هيد" أو "shaهيد" سيفهم النموذج ذلك؟ كذلك معنى كلمة "انتفاضة"؟ انتفاضتنا تختلف عن انتفاضات جهات ومناطق جغرافية أخرى، ومنطقنا التاريخي يختلف عن منطق الانتفاضات الأخرى، فبماذا سيفهم النموذج كلمة "انتفاضة"، وكيف سيعرّفها في وعيه؟ هذا ما يجب أن تبدأ عليه الدراسات والعمل الفلسطيني، من خلال الهيئة التي ذكرناها في مقالنا السابق.

في مركز الإعلام بتوجيه ومساعدة من ليمينال، بدأنا تجربة متواضعة في هذا الاتجاه. نؤرشف كل ما يُنتج عبر سنوات، بصيغ نظيفة، قابلة للاستخدام في تدريب نماذج لاحقًا. هذا التفكير من جهة تفكير تجاري، لأن كل هذه المعلومات والصياغات ستُستخدم في حال فهمت القيادة أهمية النماذج التدريبية، ومن جهة أخرى حفظ حقوق العاملين فيها.

السيناريو الذي يقلقني، أن يستمر هذا الوضع عشر سنوات أخرى. حينها نصل إلى نقطة لا عودة منها. الجيل الجديد سيكتب العربية كما تكتبها الآلة. سيفقد إيقاعها، بلاغتها، قدرتها على إنتاج فكر أصيل لا مترجم. العربية ستبقى موجودة شكليًا، لكنها ستصبح قشرة لغوية على عقل غير عربي.

وهذا هو التوصيف الحقيقي للهزيمة…

ليمينال - حين تكون الثقة هي الكذبة

النموذج اللغوي لا يكذب بالمعنى التقليدي لأنه لا يعرف أصلاً أنه مخطئ. هو يخترع إجابة بنفس النبرة، نفس الثقة، وبنفس الصياغة المتقنة التي يجيب فيها على حقيقة مؤكدة.

وهنا الخطر الحقيقي: الكاذب يترك أثراً: تردد، تناقض، توتر. أما الآلة، فتقدّم الخطأ بنفس سلاسة الصواب.

هذا ما يجعل "الهلوسة" (Hallucination) أخطر بكثير مما تبدو عليه على الورق. المستخدم لا يتعامل مع معلومة قد تكون خاطئة، بل مع معلومة تبدو صحيحة تماماً. ومع الاستخدام المتكرر، تتشكّل عادة خطيرة: الثقة بالنبرة بدل التحقق من المصدر.

في ليمينال، نتعامل مع هذه المعضلة كجزء أساسي من تصميم أي نظام - لا كعيب جانبي نتغاضى عنه.

الأنظمة التي نبنيها مبنية على الإسناد إلى مصادر موثّقة (RAG)، لا على ثقة النموذج بنفسه.

لأن السؤال الحقيقي في عصر الذكاء الاصطناعي ليس "هل الإجابة مقنعة؟" - بل "هل الإجابة صحيحة، ومن أين جاءت؟"

الثقة وحدها لم تعد دليلاً على الصدق. وأي نظام لا يملك آلية للتحقق، يبني مصداقيته على الحظ لا على الهندسة.

للاطلاع على المقالات السابقة: