معظم أنظمة الذكاء الاصطناعي المؤسسية المبنية للعالم الناطق بالعربية هي، في جوهرها، أنظمة إنجليزية ترتدي عباءةً مترجمة. النموذج يفكّر بالإنجليزية. والواجهة صُمّمت من اليسار إلى اليمين. وبنية البيانات، وأسماء الحقول، وقوالب المستندات، ورسائل الخطأ، وفهرس البحث، كلّها تفترض الإنجليزية أولًا. وتأتي العربية في نهاية المسار بوصفها مهمة توطين: ملفّ نصوص يُملأ، وتخطيطٌ يُعكَس، ومرحلةٌ عجلى قرب موعد الإطلاق. هذه هي الطريقة المعتادة التي تعامل بها الصناعة اللغة، وهي تحدّد بهدوء من يتبنّى المنتج فعلًا ومن يهجره في صمت.

وبالنسبة للمؤسسات السعودية، هذا هو الافتراض الخاطئ. فالناس الذين يديرون العمل، على المنصّة، وفي غرفة التحكّم، وعند الكاونتر، وفي الميدان، يعملون بالعربية. وحين لا يخاطبهم النظام بلغتهم إلا بوصفها طبقة سطحية رقيقة، تصير التجربة هشّةً في الموضع نفسه الذي يكون فيه العمل حقيقيًا. وليست هذه مشكلة شكلية، بل هي الموضع الذي يُكسَب فيه التبنّي أو يُخسَر.

وهم ضريبة التوطين

يحمل تأطير المسألة بوصفها «توطينًا» افتراضًا يستحقّ التسمية: أنّ العربية كلفة. بندٌ في الميزانية. شيءٌ تدفع ثمنه مرّةً واحدة، متأخّرًا، لتبلغ سوقًا صمّمت المنتج من دونها أصلًا. وبموجب هذا الافتراض يصير الهدف تقليل الضريبة، وجعل العربية تعمل بما يكفي للإطلاق، ثم المضيّ قدمًا.

والمشكلة أنّ اللغة ليست طلاءً فوق نظام التشغيل، بل هي نظام التشغيل نفسه. فحين يتعيّن ترجمة الاستعلام بصمت إلى الإنجليزية، والتفكير فيه، ثم إعادته مترجَمًا، يتسرّب المعنى من الوصلتين كلتيهما. العربية لغة غنية صرفيًا، بجذورها وأوزانها وسوابقها ولواحقها وحركاتها التي تحمل فروقًا تطمسها طبقة الترجمة. والأسماء والأماكن والمصطلحات التقنية تُنقَل حرفيًا بصور غير متّسقة. والأرقام والتواريخ والوحدات تُعرَض في اتجاهين. والمشغّل الميداني الذي يكتب سؤالًا سريعًا مصبوغًا باللهجة لا يكتب العربية الفصحى النظيفة التي يتوقّعها مترجمٌ مُلحَق، والفجوة بين الاثنين هي حيث يبدأ النظام بإرجاع هراءٍ واثق.

فالضريبة إذن لا تبقى مدفوعة، بل تتراكم. كل ميزة جديدة تُبنى بالإنجليزية أولًا تتكبّد دَيْن الترجمة من جديد. وكل حالة حدّية في التخطيط من اليمين إلى اليسار، أو في النص مختلط الاتجاه، أو في صلة نتائج البحث العربي، تطفو مرّة أخرى. ويعامل الفريق كلًّا منها بوصفها خللًا، لا عَرَضًا للخيار المعماري الأصلي، فتصير التجربة من الدرجة الثانية دائمةً لأنها كانت حاملةً للبنية منذ البداية.

اللغة ليست طلاءً فوق نظام التشغيل، بل هي نظام التشغيل نفسه.

التشغيل بالعربية أصالةً بوصفه خندقًا

اقلب الافتراض الآن. عامِل العربية لا بوصفها سوقًا تقصده، بل بوصفها لغة التشغيل الأصيلة للنظام. الواجهة تُصاغ بالعربية وتُقرأ من اليمين إلى اليسار لأنها رُسمت هكذا، لا لأنّ ورقة أنماط عكستها. والاستعلام عربيٌّ أصالةً: يسأل المشغّل بالكلمات واللهجة التي يستعملها فعلًا، والنظام مبنيٌّ ليفهم هذا المُدخَل مباشرةً لا ليُدوّره عبر الإنجليزية. والمستندات والنماذج والتقارير تُؤلَّف بوصفها أعمالًا عربية، لا ترجمات مُصدَّرة. والصوت، حيث يهمّ، مضبوطٌ على الطريقة التي ينطق بها الناس في الميدان حقًّا. والاتجاه من اليمين إلى اليسار هو أصل سير العمل، لا استثناءً يُعالَج في كل شاشة.

وحين يُصنع الأمر هكذا، تكفّ العربية عن أن تكون كلفة وتصير أصلًا متراكمًا. فالجهد نفسه الذي أنتج طبقة ترجمة هشّة، إذا وُجِّه إلى أعلى المسار، أنتج نظامًا يثق به المشغّل من المحاولة الأولى. والثقة هي المورد النادر في الذكاء الاصطناعي التشغيلي. فالمشغّل الذي يتلقّى إجابة خاطئة أو متكلّفة مرّةً واحدة سيلتفّ حول الأداة ويعود إلى المكالمة الهاتفية وجدول البيانات، ولا تستردّ خارطة طريق المزايا تلك الثقة بثمن زهيد. أما النظام الذي يلاقيه بلغته منذ التفاعل الأول فيكتسب الحقّ في أن يُستعمل، والاستعمال هو ما يحوّل النشر إلى نتيجة.

وهذا هو المنطق الكامن وراء بناء الاستعلام العربي الأصيل داخل عدسة «مرصد» لا إلحاقه بها. فحين يستطيع المشغّل أن يستجوب العملية مباشرةً بالعربية، تكفّ اللغة عن أن تكون حاجزًا بين الشخص والبيانات، وتصير الوسيط الذي يُنجَز به العمل. والخندق ليس ميزة بارعة، بل هو الواقع المتراكم بأنّ الناس الذين يؤدّون العمل يفضّلون هذا النظام على أيّ بديل، وذلك التفضيل مكلفٌ على المنافس أن يزحزحه.

لماذا يصعب نسخه

يستطيع المنافس أن يقرأ هذه الحجّة ويوافق عليها بكاملها، ولا يمكّنه ذلك من اللحاق سريعًا، والسبب بنيويٌّ لا بلاغي.

فالتشغيل بالعربية أصالةً ليس وحدةً تستوردها، بل خاصيّةٌ في المنظومة بأسرها. يسكن في نموذج البيانات، وفي كيفية تطبيع الكيانات والأسماء، وفي طبقة البحث والاسترجاع، وفي تصميم التوجيه والاستدلال، وفي صياغة الواجهة، وفي مسار المستندات، وفي مجموعة التقييم التي يستعملها الفريق ليعرف ما إذا كان النظام جيّدًا بالعربية حقًّا. والشركة التي بنت بالإنجليزية أولًا لا تستطيع إلحاق هذا، بل يلزمها إعادة تجهيز كلٍّ من تلك الطبقات، وإعادة التجهيز أصعب وأبطأ من البناء الصحيح أول مرّة، لأنّ كل طبقة صارت لها افتراضات إنجليزية مغروسة في أسسها واختباراتها.

وثَمّة كذلك خندقٌ من المعرفة الضمنية. فمعرفة أنّ مصطلحًا بعينه يُكتب بثلاث صور في الميدان، وأنّ صياغةً لهجيّةً بعينها تعني شيئًا محدّدًا في سياق تشغيلي معيّن، وأنّ المشغّلين يختصرون بأنماط متوقّعة تحت ضغط الوقت: هذه معرفةٌ تُكتسَب بالنشر إلى جانب الناس الذين يؤدّون العمل، لا تُحصَّل من مجموعة بيانات. والفريق المنتشر ميدانيًا يراكمها باستمرار، أما المورّد الذي يترجم عن بُعد فلا يراها قطّ. وتتّسع هذه الفجوة مع كل أسبوع من التشغيل الحقيقي، وهذا بالضبط سبب تراكمها إلى خندق بدل أن تتبخّر بمجرّد أن ينتبه أحدٌ إلى الاستراتيجية.

التشغيل بالعربية أصالةً ليس وحدةً تستوردها، بل خاصيّةٌ في المنظومة بأسرها.

التصميم للمشغّل بلغته

ينبثق الانضباط العملي من المبدأ. ابدأ من المشغّل ومن اللغة التي يعمل بها، ودع بقية المعمار يتشكّل بهذا القيد لا أن يعتذر له لاحقًا.

وعمليًّا، يعني هذا التزامات قليلة. عامِل التجربة العربية بوصفها التجربة الأساسية التي تُختبَر وتُقاس، لا الصيغة التي تنال مراجعة جودة أخفّ. وابنِ مجموعة التقييم بالعربية، بصياغة مشغّلٍ حقيقية ولهجة حقيقية، ليتمكّن الفريق من التمييز بين نظام يحسن العرض ونظام يعمل عند الكاونتر. وصمّم معالجة الاتجاه من اليمين إلى اليسار والنص مختلط الاتجاه في نظام التخطيط مرّةً واحدة على نحو سليم، بدل ترقيعها في كل شاشة. واجعل الاستعلام العربي الأصيل مسارًا من الدرجة الأولى، حتى لا يضطر المشغّل أبدًا إلى التفكير بلغة ثانية ليحصل على إجابة عن عمليّته هو. وأبقِ من بنى النظام قريبين ممّن يستعملونه، لأنّ هذا القرب هو منبع معرفة اللغة التي لا يستطيع أحدٌ تنزيلها.

وبالنسبة للمؤسسات السعودية التي يعمل مشغّلوها بالعربية، ليس هذا بيان قيم، بل هو الموضع الذي يُحسَم فيه العائد على استثمار الذكاء الاصطناعي كلّه. فالنظام الذي يثق به الميدان يُستعمَل، والنظام الذي يُستعمَل يُنتِج نتائج، بينما النظام المُبهِر تقنيًّا الذي يهجره المشغّل في صمت يصير خسارةً مشطوبة. والعربية أصالةً بالتصميم ليست مجاملةً تُمنَح للمستخدم، بل هي الخيار المعماري الذي يحوّل النشر إلى خندق، لأنه مبنيٌّ للناس الذين يؤدّون العمل، بلغتهم، وذلك يصعب إعادة تجهيزه ويصعب نسخه أكثر.