نشــرت مقــالا مفصــّلا عن مشروع “الذخــيرة” في مجــلة المجمع الجزائري للغة العربية

لعقـــــــد تشــــــرح أساليــــــب استثمــــــار المدوّنــــــات النصّــــــية المحوسبــــــة

تقديم: توفيق العارف

 

أصدرت الباحثة سارة لعقد من جامعة الجزائر 2، مقالا بالعدد الأخير لمجلة المجمع الجزائري للغة العربية، خصصته للحدث عن استثمار المدوّنات النصّية المحوسبة للذّخيرة العربية في الصّناعة المعجمية، وقالت إن “الانفجار التكنولوجي الذي نعيشه جعل كثيرا من الباحثين في مجال العلوم اللغوية يفكر في الكيفية التي يمكن من خلالها حفظ التراث اللغوي والثقافي العربي خصوصا مع ظهور كم هائل من الأجهزة التي تمكن من حفظ جملة من المعطيات اللغوية التي يمكن الاستفادة منها وتخزينها وحتى معالجتها”. وسجلت الباحثة أن الفاعلين بالحاضنة اللغوية العربية، “عملوا جاهدين على اللغة العربية”، وقدّرت أن “أبرز ما سعوا في سبيله هو محاولاتهم الجادة من أجل رقمنتها؛ ذلك لأن العالم أصبح اليوم يسير في اتجاه رقمي في شتى المجالات إن لم نقل كلها.

وقالت الدكتور لعقد إن الحديث عن رقمنة اللغة العربية يتطلب بالضرورة الحديث عن الأستاذ عبد الرحمن الحاج صالح، فهو من أبرز علماء اللغة العربية الذين حاولوا استغلال الحاسوب في سبيل رقمنتها، ما دفعه إلى التفكير في محاولة الاستعانة بمختلف البرامج والتطبيقات المتاحة في إنجاز مشروع الذخيرة العربية، وذكرت أن البروفيسور الحاج صالح قال في ورقة بحثية قدمها في واحد من المؤتمرات: «إن هذا المشروع نشأ من فكرة الاستعانة بالكومبيوتر - الحاسوب واستغلال سرعته الهائلة في علاج المعطيات وقدرته العجيبة في تخزين الملايين من هذه المعطيات في ذاكرته لإنشاء بنك آلي من المعطيات يحتوي أهم ما حرّر بالعربية مما سينتجه على مرّ السنين، وسيكون البنك الآلي تحت تصرف أي باحث في أي مكان من العالم».

فضائل المدونات المحوسبة..
وسجلت الباحثة أن مشروع الذخيرة العربية الذي اقترحه الأستاذ عبد الرحمن الحاج صالح يندرج في إطار لسانيات المدونة، بحكم أنه “مدونة كبيرة من النصوص المحوسبة”، وأضافت أن المشروع أداة ووسيلة نافعة للصناعة المعجمية وإنشاء بنوك المصطلحات، مؤكدة على أنه لا يمكن في الوقت الراهن بناء معجم، ما مهما كان نوعه، بالطريق التقليدية أي بالاعتماد على ما ورد في المعاجم التراثية والاتكاء على محتوياتها في انتقاء المادة المعجمية وترتيبها وشرحها، بل يجب الانطلاق من مدونات محوسبة معدة سلفا بطريقة علمية وجرد ما فيها من مادة معجمية ثم معالجتها بطريقة آلية عن طريق برمجية خاصة تحدد جذور الألفاظ وتأتي بها في سياقاتها التي وردت فيها داخل نصوص المدونة.
وفي السياق، قالت الدكتورة لعقد إن مشروع الذخيرة العربية رغم تعثره في بداياته الأولى، استطاع أن يؤسس رؤية علمية مستقبلية للصناعة المعجمية ولإنشاء بنوك المصطلحات وذلك من خلال الأداة التقنية التي طورها فريق المهندسين التابعين له، ومن خلال المدونات التي جمعها خبراء مختصون لتوضع بين أيدي الباحثين المهتمين بهذا المجال، وأشارت إلى “استفادة بعض الهيئات من أفكار الأستاذ عبد الرحمن الحاج صالح خاصة في مجال المعاجم حيث ظلّ يدعو إلى ضرورة الانطلاق من النصوص المحوسبة في ذلك، واعتماد برمجيات إلكترونية لتحقيق الغاية. وتتجلى الإفادة من هذه الفكرة في المعجم التاريخي للغة العربية الذي لم يعرف طريقه إلى الظهور إلا بعد أن اعتمد هذين المبدأين مبدأ الانطلاق من المدونات النصية المحوسبة. ومبدأ اعتماد أدوات تقنية تسهل العمل وتسرع عملية الإنجاز”.


اللسانيات الحاسوبية
تعتبر الدكتورة لعقد اللسانيات الحاسوبية، نقطة انطلاق في محاولة استغلال كل ما يتيحه الحاسوب من برامج وتطبيقات تمكن من برمجة اللغة ورقمنتها والاستفادة منها في إنجاز المحتوى الرقمي العربي، وقالت إن اللسانيات الحاسوبية وفق علي القاسمي هي: وضع نظام آلي لمعالجة اللغة الطبيعية ويحتاج إلى مدونة لتطبيق أو اختبار النظام الذي يضعه على نماذج ممثلة لجميع أنواع النصوص التي من المتوقّع أن يعالجها ذلك النظام وكذلك بناء معجم مختص في مجال معين.. لتسجل أن هذا التخصص ظهر في منتصف الستينيات من القرن الماضي، ورجحت أن أول من استخدم المصطلح للدلالة على هذا الحقل العلمي، هو دافيد هايرس “David Hayrs” عندما كان عضوا في اللجنة الاستشارية للمعالجة الآلية للغة في الأكاديمية الوطنية للعلوم في الولايات المتحدة، وذكرت ـ في السياق ـ أن نعوم تشومسكي “Chomsky” كان من الذين أسهموا بشكل كبير في تطور هذا التخصص الذي أصبح له دور مهم خصوصا مع تطور مجالي الذكاء الاصطناعي ومعالجة اللغة الطبيعية. إضافة إلى تطور الصناعة المعجمية بانتقالها من الطابع التقليدي إلى طابع إلكتروني يعتمد أيضا المدونات اللغوية لحل بعض الإشكالات أبرزها معنى المفردات والمصطلحات والسياقات التي وردت فيها.
وأكدت الدكتورة لعقد أن الحاجة إلى مدونة عربية تكون القاعدة الأساس للمعطيات اللغوية المراد العمل بها وعليها، هو ما جعل الأستاذ عبد الرحمن الحاج صالح يفكر في مشروع الذخيرة العربية المحوسبة، وهي بمثابة المحرك العربي على الشابكة العالمية، ومن جهة أخرى فإن هذه المدونة العربية هي الأساس في إنشاء عدد من المعاجم العربية الإلكترونية العامة والخاصة، ومن هنا، طرحت إشكالية كيفية استثمار المدونات النصية المحوسبة للذخيرة في الصناعة المعجمية.

العمل على المصطلح
وفي سياق عملها البحثي، وقفت الدكتورة لعقد عند المصطلحات، وسجلت أن “المدونة” اسم مفعول مشتق من الفعل “دوّن يدوّن تدوينا” وهي من الكلمة الفارسية المعربة “ديوان وهو عبارة عن دفتر يجمع فيه كل أسماء العمال والجند، كما تطلق كلمة ديوان على المكان الذي تحفظ فيه هذه الدفاتر”. استخدم العرب مصطلح “مدوّنة” مقابلا للمصطلح الأجنبي الفرنسي والإنجليزي Corpus ، وهو من اللاتينية Corps والتي تعني الجسد و Corpus جمع لكلمة Corpora وهي مجموعة من البيانات اللغوية؛ سواء أكانت نصوصا مكتوبة أم تسجيلات صوتية - نصوصا منطوقة، وبعبارة أخرى هي ما يشكل مجموع المعطيات اللغوية التي يخضعها الباحث للتحليل والدرس. وقالت إن هناك نوعين من المدونات، أولهما المدونة النصية المكتوبة والمدونة النصية المنطوقة التي يمكن أن تدون باستخدام برامج تقنية مخصصة في نقل النصوص من طابعها المنطوق إلى طابعها المكتوبة مثل ما أشار إلى ذلك “David Crystal” في معجمه  Dictionary of Linguistics Phonetics.
وسجلت الباحثة أن التكنولوجيا الحديثة أتاحت للمهتمين إمكانية إنشاء المدونات وتصميم الأنظمة التي تتبنى فكرة المدونة وتهتم باللغات الطبيعية في محاولة للإجابة عن كثير من الأسئلة وكذا المساهمة بشكل فعّال في سير عملية البحث عبر العالم فيمكننا استخدام مختلف الوسائل التكنولوجية وأبرزها الحاسوب لتشفير اللغة في أي سياق يمكننا على سبيل المثال الحديث عن مجموعة اللغة المكتوبة ومجموعة اللغة المنطوقة، إضافة إلى ذلك وجود مجموعة الإشارات التي تمّ تسجيلها من خلال مجموعة من الفيديوهات.

المدونة النصية المحوسبة
ذكرت الباحثة سارة لعقد بجهود الأستاذ عبد الرحمن الحاج صالح في إقناع المؤسسات والهيئات العلمية في مختلف الدول العربية بمشروع “الذخيرة العربية”، وقالت إنه عرفها على أنها: بنك آلي من النصوص وليست مجرد مدونة أدخلت في ذاكرة الحاسوب، وهي لیست CDROM كما يقولون، بل مجموعة من النصوص أدمجت على الطريقة الحاسوبية، حتى يتمكّن الحاسوب من مسحها كاملة، أو جزئيا، ولها عدد من البرامج الحاسوبية وضعت خصيصا لإلقاء أنواع خاصة وكثيرة من الأسئلة على الذخيرة”.
وقالت الدكتورة لعقد إن المشروع عرض أول مرة في ديسمبر عام 1988م على المنظمة العربية للتربية والثقافة والعلوم، فوافق أعضاؤها على تبنيه، وفي عام 1991م، نظمت جامعة الجزائر بمشاركة المنظمة العربية للتربية والثقافة والعلوم ندوة لمناقشة كيفية إنجاز المشروع والتدابير اللازمة، ثم أعد الأستاذ عبد الرحمن الحاج صالح المشروع، وقدمته الحكومة الجزائرية إلى جامعة الدول العربية فصادق عليها مجلسها عام 2008، وأنشأت له منظمة متخصّصة، على غرار المنظمات التابعة الجامعة الدول العربية هي “الهيئة العليا للذخيرة العربية”، واختيرت الجزائر لتكون مقرا لهذه الهيئة. وبناء على ما سبق، فالذخيرة العربية عبارة عن مدونة نصية محوسبة، فهي مجموعة كبيرة من النصوص التي تجمع آليا لتشكل بنكا آليا عربيا، وهذه العملية لا تكون إلا وفق جملة من المراحل أوجزتها الدكتورة لعقد في: تحديد الهدف من الذخيرة العربية، وهو الشيء الذي وضحه الأستاذ عبد الرحمن الحاج صالح في الوثيقة التي قدمها للمنظمة العربية منذ البداية، ثم  تحديد المصادر التي تعتمد في إنشاء الذخيرة العربية والتي حددها كذلك الأستاذ عبد الرحمن الحاج صالح سابقا، وتتمثل في الكتب والمعاجم العربية القديمة والحديثة، إضافة إلى الجرائد والكتب المدرسية والقصص والروايات والمحاضرات لأنها تمثل الاستعمال الحقيقي للغة. الحصول على الموافقة القانونية من المؤسسات المعنية بتلك المؤلفات.

أهداف “الذخيرة العربية”
قالت الدكتورة سارة لعقد إن أهداف إنشاء الذخيرة العربية - حسب ما ذكره الأستاذ عبد الرحمن الحاج صالح في مختلف المؤتمرات والمحافل الدولية ـ ترمي إلى تأسيس “بنك معلومات آلي”، وأضافت أن الأستاذ عبد الرحمن الحاج صالح أطلق عليها وصف “Google عربي” وهو بنك نصي آلي يعد نموذجا حيا عن الاستعمال الحقيقي للغة، وتكون هذه النصوص في جميع التخصصات على مرّ العصور، ويكون هذا البنك الآلي قاعدة معطيات دائمة حيث تقبل الزيادة والتصحيح على الدوام بسبب تطور المعلومات من خلال الاستعمال الحقيقي للغة العربية، ومنه إنجاز المعجم العربي الجامع.
وقال الأستاذ عبد الرحمن الحاج صالح ـ وفق الباحثة - إن أهم الأهداف هي إمكانية استثمار الذخيرة العربية في إنجاز عدد من المعاجم الآلية مثل المعجم التاريخي للغة العربية.

منهجية جمع النصوص المحوسبة
 ذكرت الباحثة أنه “تمّ انتقاء مجموعة من الصحف من كل بلد عربي عضو في جامعة الدول العربية بالإضافة إلى مجموعة من الصحف المشهورة التي تصدر في الخارج مثل الشرق الأوسط وجريدة الحياة. وكان المعيار الأساس لاختيار الجرائد هو الشهرة والشيوع والمقرونية الواسعة وكونها جرائد حكومية ما أمكن، وتمثلت بجريدة “الوطن”، وجريدة “عمان” لسلطنة عُمان، جريدة “المدى”، وجريدة “الصباح” للعراق اعتمادا على مجموعة من البرامج التقنية والتي تسهم بشكل كبير وفعّال في تنزيل عدد ضخم من المقالات في وقت وجيز.
وقالت لعقد إن الخطوة الأولى تبدأ بـ«جمع المادة من عدد كبير من الصحف والمجلات في مختلف دول الوطن العربي أو الناطقة باللغة العربية، ثم تحديد المجالات التي يتم العمل على جمع مقالاتها كل مجال على حدة، في السياسة ومجال الصحة، ومجال الرياضة، والصحة والثقافة.. إلخ.

الصناعة المعجمية العامة
قالت الدكتورة سارة لعقد إن “عملية البحث التقليدي عن معنى كلمة في كثير من الأحيان تستغرق وقتا طويلا غير أن عملية البحث هذه ستصبح ممكنة ومتاحة لأي باحث خصوصا مع إنجاز مشروع الذخيرة العربية والذي سيفضي إلى مجموعة من المعاجم الآلية العامة ومعنى قولنا عامة أنها تجمع كل ألفاظ اللغة العربية في مختلف المجالات وعلى مرّ العصور إلى يومنا هذا وحسب ما جاء في وثائق مشروع الذخيرة التي قدمها الأستاذ عبد الرحمن الحاج صالح.
وذكرت الباحثة أن المعجم الآلي الجامع لألفاظ اللغة العربية، يعد النموذج الصادق عن استثمار الجانب الحاسوبي في مجال المعجميات حيث يحتوي على جميع المفردات العربية التي وردت في النصوص قديمة وحديثة، وتحدّد فيه معاني كل مفردة باستخراج هذه المعاني من السياقات التي ظهرت فيها، ثم يضاف إلى ذلك تحديدات العلماء. وسجلت أن أهم ما يمكن أن نستفيده من هذا المعجم أن تصبح للغة العربية أكبر مدونة نصية محوسبة تتضمن جميع مفرداتها القديمة والحديثة مشروحة، أضف إلى ذلك السرعة في البحث، والدقة حيث تقوم الآلة بتقديم الكلمة ومعناها والسياقات التي وردت فيها هذه الكلمة كما يقدم لنا المقابلات الفرنسية والإنجليزية.

 

رأيك في الموضوع

أرشيف النسخة الورقية

العدد 19462

العدد 19462

الأحد 05 ماي 2024
العدد 19461

العدد 19461

الأحد 05 ماي 2024
العدد 19460

العدد 19460

السبت 04 ماي 2024
العدد 19459

العدد 19459

الأربعاء 01 ماي 2024