* الرياض - حمد البدراني
تنفذ مدينة الملك عبدالعزيز للعلوم والتقنية ممثلة في معهد بحوث الحاسبات والالكترونيات حاليا مشروعا طموحا يهدف إلى انشاء قاعدة صرفية لمفردات اللغة العربية لتكون هي أساس البناء لبرامج اللغة العربية وقد تم قطع أشواط كبيرة وانجز الكثير من العمل في هذه القاعدة التي ستتاح للجميع عبر موقع خاص بها وسيتم نشرها على الانترنت في الفترة القادمة.
وأوضح عبدالله عبدالرحمن الزامل أحد مسؤولي تنفيذ هذا المشروع لالجزيرة أن مشروع القاعدة الصرفية لمفردات اللغة العربية هو أحد المشاريع البحثية في معهد بحوث الحاسب والإلكترونيات في مدينة الملك عبدالعزيز للعلوم والتقنية التي تقوم بدور كبير في خدمة البحث العلمي في عدة مجالات تمثلها معاهد المدينة المختلفة ومنها هذا المعهد الذي يقوم بتنفيذ مشاريع بحثية تتعلق بالحاسب الآلي والإلكترونيات, وأكد أن الهدف من مشروع القاعدة الصرفية لمفردات اللغة العربية هو محاكاة وظيفة المعجم آلياً بتخزين المفردات وخصائصها لتيسير استرجاعها فهذا المشروع يعد ركيزة أساسية تعتمد عليها الكثير من تطبيقات الحاسب الآلي المتعلقة باللغة ومعالجة النصوص إذ يتعذر إنجاز مثل هذه التطبيقات بصورة متكاملة تضاهي مثيلاتها في اللغات الأخرى دون الاعتماد على مثل هذه القاعدة الأساسية ومن هنا تتضح أهمية هذا المشروع.
وأشار الزامل إلى اعتماد هذه القاعدة على علم الصرف في اختصار واختزال المفردات إلى أصغر حد ممكن لتسهيل عمليات الحفظ والاسترجاع والبحث فبدلا من تخزين جميع كلمات اللغة العربية التي لا يمكن حصرها يمكن باستخدام علم الصرف تخزين الجذور والأوزان التي تقبلها تلك الجذور وخصائص كل مفردة من حيث التأنيث والتذكير والتثنية والجمع وخلافه,, ثم بعد ذلك تصميم برامج وخوارزميات حاسوبية تقوم بتوليد الكلمات من الجذور والأوزان والخصائص آلياً كما يفعل العقل البشري حين يولد الكلمات (كاتب، مكتوب، يكتب، يكتبون) من الجذر (كتب) لأنه يعرف الأوزان التي يحتملها الجذر (كتب) ويعرف خصائصه.
وقال إن المشروع قد مر بعدد من المراحل وهي جمع بيانات اللغة العربية من مصادرها الأصلية بالتعاون مع لغويين متخصصين في هذا المجال وعمل البرامج المساعدة في عمليات جمع البيانات والاحصائيات وبناء وتصميم هياكل قواعد البيانات مع الأخذ بالاعتبار أهمية شمول البيانات وضغطها في نفس الوقت وعمل الخوارزميات الحاسوبية التي تقوم بالعمليات الصرفية والاحصائية, اضافة إلى عمل الاختبارات اللازمة للتحقق من دقة هذه الخوارزميات على ضوء البيانات المأخوذة من المصادر الطبيعية الحديثة مع إجراء التحديثات اللازمة لهذه الخوارزميات.
وأوضح الزامل أنه تم تحقيق عدد من الانجازات في هذا المشروع وهي وضع الهيكل العام للقاعدة: إذ تم تقسيم القاعدة إلى قاعدة بيانات الأسماء وقاعدة بيانات الأفعال وقاعدة بيانات المشتقات وقاعدة بيانات المصادر، مشيرا إلى أنه تم الانتهاء من قاعدة بيانات الأسماء وقاعدة بيانات الأفعال ويجري العمل حاليا في قاعدة بيانات المصادر ووضع قاعدة بيانات أساسية للجذور العربية.
ولفت إلى أن من أبرز التطورات الحالية في سير هذا المشروع هو معالجة بيانات الفعل المضارع والأمر والمبني للمجهول وجمع بيانات المصادر والمشتقات من معاجم اللغة العربية بالتعاون مع معهد اللغة العربية بجامعة الإمام محمد بن سعود الإسلامية.
وأكد الزامل في ختام تصريحه لالجزيرة أن المعهد سيقوم بنشر معلومات تلك القاعدة على الانترنت عن طريق انشاء موقع يتم العمل عليه موضحا أن فريق العمل المكلف يقوم حاليا بإنشاء موقع للمشروع على الانترنت جارٍ العمل عليه حاليا ويحتوي على جميع المعلومات المتعلقة بالمشروع وشرح كامل عنه بالإضافة إلى قواعد البيانات التي يمكن للمختصين الاستفادة منها مع إمكانية البحث والاستعراض للقاعدة وإبداء الملاحظات والتواصل بين المهتمين بهذه المواضيع بالإضافة إلى قوائم بيبلوغرافية بالابحاث والكتب والمقالات التي نشرت عن هذا الموضوع وكذلك قاعدة بيانات بأسماء الأشخاص المهتمين وعناوينهم مؤكدا أن هذا الموقع سيكون متاحا للجميع فور الانتهاء منه إن شاء الله.
|