مساهمة اللغويين العرب في مشروعات حوسبة اللغة العربية بمعهد بحوث الحاسب والإلكترونيات (2-1)
|
*بقلم: الدكتور منصور بن محمد الغامدي
مع التطور التقني في كافة مجالات الحياة وخاصة في مجال تقنية المعلومات، أصبحت الدراسات اللغوية في غاية الأهمية لتمكين متحدثي اللغة العربية من الاستفادة القصوى من هذه التقنية.
ولهذا السبب ينفذ معهد بحوث الحاسب والإلكترونيات بمدينة الملك عبد العزيز للعلوم والتقنية عدة مشروعات في مجال حوسبة اللغة العربية. واعتمد على عدد كبير من اللغويين العرب لتنفيذ هذه المشروعات جنباً إلى جنب مع لحاسوبيين.
إلا أن الحاجة لا تزال قائمة في أن تقوم أقسام اللغة العربية بإدخال تخصصات ذات علاقة بحوسبة اللغة في خططها التعليمية حتى يكون خريجو هذه الأقسام مؤهلين في المساهمة الفاعلة في المشروعات البحثية ذات العلاقة أو في استخدام اللغة العربية في مجال تقنية المعلومات.
* عرض: عادل حماد أبوعِزَّة
يبين مؤشر الدراسات اللغوية والتعمق فيها لأية لغة بشرية مدى تقدم أصحاب تلك اللغة ووضعهم الحضاري.
ليس لأنه يظهر مدى وعى متحدثيها بها وبأهميتها ودورها في حياتهم وتقدمهم ولكن أيضاً لان الدراسات اللغوية المتقدمة هي البنية التحتية لتقدم العلوم الأخرى.
إذ بدون الوعي بأقرب القدرات العقلية عند الإنسان وأهمها وهى اللغة ومن ثم توظيفها في دراسة وتطوير العلوم الأخرى.
من الصعوبة بمكان أن تلفت الظواهر الكونية الأخرى اهتمام باحثي ومفكري ذلك المجتمع، ففي الحضارة العربية الإسلامية على سبيل المثال نجد أن الدراسات اللغوية بما فيها المعجمية والنحوية والصرفية والصوتية قد ظهرت في القرن الثاني الهجري.
هذا الإبداع الفكري في الدراسات اللغوية مهد لتقدم مذهل في علوم أخرى في القرون التالية، حيث شاعت الترجمة إلى اللغة العربية، وعلوم الطب، والفلك، والرياضيات، والتعمية، والتجويد، والفيزياء، والصيدلة، وعلم الاجتماع، والكيمياء.
وفي العصر الحديث نجد الشيء ذاته يتكرر فبدون تقدم في الدراسات اللغوية وحوسبتها لا يمكن الإطلاع على المراجع والمعارف في العلوم المختلفة فالوسيط إلى ذلك هي اللغة.
ومن المؤسف أن اللغة العربية لم تحظى بكثير من الدراسات المتعمقة في فروعها المختلفة مما نتج عنه وجود حاجز بين المتحدث العربي والعلوم والمعارف الأخرى، وما يصاحبها من تطور سريع ومذهل في هذا العصر، فعلى سبيل المثال وضع لوحة المفاتيح الحالية وتوزيع الحروف عليها بنظام مايكروسوفت يشكل إلى حد ما حاجزاً أمام مدخل البيانات العادي، ولو أن هناك دراسات جادة في هذا المضمار لما فرض العامل التجاري على المستخدمين العرب نمط لوحة مفاتيح غير عملية.
وهناك الكثير من الحالات المشابهة في كافة الفروع المتعلقة باللغة العربية كنمط الكتابة والأصوات والصرف والنحو والدلالة مما آخر ظهور أنظمة حوسبة في مجالات تمس المستخدم العربي العادي كما في التعرف الآلي على الكلام والناطق الآلي والتعرف على الكتابة واستخدام الشبكة العالمية.
وسنأخذ إحدى الانعكاسات السلبية على التأخر في الدراسات اللغوية على العربية، وهى استخدام الشبكة العالمية المعروفة بالإنترنت Internet. فالمشكلة العالمية لها دور مهم في توسيع مدارك الإنسان ورفع كفاءته في مجال عمله سواء كان عالماً في معمل أو إنساناً عادياً. وذلك لكونها أصبحت المزود الأول للمعرفة وأحدث المستجدات في نواحي الحياة المختلفة وفي العلوم والأبحاث بصفة خاصة.
فعند استعراض نسبة المستخدمين العرب للشبكة العالمية نجدهم لا يتجاوزون 5% وهى من أقل نسب مستخدمي الشبكة العالمية من متحدثي اللغات الأخرى.
وهذه النسبة المتدنية لها أسباب عديدة منها توفر خدمة الدخول إلى الشبكة العالمية والتعليم وتوفر الحاسبات الشخصية - إلا أن أحد أهمها بلا شك - هو التأخر في الدراسات اللغوية العربية، فبينما نجد لغات كالإنجليزية والألمانية لا تحتل مساحات كبيرة بالنسبة لعدد متحدثيها إلا أنها تستحوذ على نصيب الأسد بالنسبة لمستخدمي الشبكة العالمية.
إن النسب العالية لمتحدثي لغات مثل الإنجليزية والألمانية والفرنسية يعود إلى التطور الكبير الذي تم في دراسة هذه اللغات مما يسر على المستخدم الاستفادة من هذه التقنية، وأحد الأدلة على ذلك أن النصوص المترجمة في مجال اللسانيات من الإنجليزية إلى اللغات الأخرى تساوي 90% من النصوص المترجمة في ذات التخصص بين اللغات الأخرى.
وهذا يبين مدى التقدم الذي وصلت إليه الدراسات اللسانية باللغة الإنجليزية مما جعلها تترجم إلى بقية اللغات البشرية كمراجع لهذا العلم.
ومن الجدير ذكره أن النسب العالية لمستخدمي الشبكة العالمية لا تعود إلى اللغة أو إلى الحروف المستخدمة في كتابتها بدليل تدنى نسبة الإسبانية المرتبطة باللغات الأوربية وارتفاع نسبة اليابانية مختلفة عن اللغات الأوروبية في طبيعتها ونمط كتابتها.
من هنا تبرز الحاجة الماسة إلى وضع خطة لسبر أغوار العربية على جميع المستويات - الصوتي phonetic والفونولوجي phonological والصرفي morphological والنحوي syntactic والدلالي semantic والبراغماتي pragmatic - ووضع وصف رياضي دقيق واستخلاص خوارزميات يمكن توظيفها في البرمجيات الحاسوبية، ولابد أن تكون في أقسام اللغة العربية بالجامعات.
فخريجو هذه الأقسام هم الرافد الوحيد المؤهل والقادر على التعاون مع الحاسوبيين والمبرمجين للخروج بنظم حاسوبية تخدم اللغة العربية وناطقيها، وبدونهم إما يجتهد الحاسوبيين بدون معرفة عميقة باللغة وهذا ما حدث في معظم المشروعات اللغوية الحاسوبية، أو أن تبقى اللغة العربية كما هي.
مشروعات معهد بحوث الحاسب والإلكترونيات لحوسبة اللغة العربية: رغم حداثة معهد بحوث الحاسب والإلكترونيات بمدينة الملك عبدالعزيز للعلوم والتقنية - تأسس عام 1412 هـ - إلا أن له مساهمات ملموسة في مجال حوسبة اللغة العربية، فقد بدأ منذ تأسيسه في العمل على خدمة اللغة العربية، فقام بتنفيذ عدة مشروعات في هذا المجال، وكانت خطة المعهد أن يضم فريق تنفيذ المشروعات ذات العلاقة باللغة العربية متخصصين فيها وهذا خلاف ما كان سائدا في الجامعات إذ كان الحاسوبيون هم الذين يقومون بهذه المشروعات بمعزل عن اللغويين مما تسبب في قصور لغوى وعدم دقة في توصيف اللغة في كثير من هذا النوع من المشروعات.
فالحاسوبي رغم أنه يتحدث العربية كلغة أُم إلا أنه يخفي عليه من خصائص اللغة العربية ما لا يخفي على المتخصصين فيها.
ومن المشروعات التي عمل عليها المعهد أو سبق أن قام بتنفيذها والتي ساهم فيها اللغويين ما يلي:
1- مشروع نصوص عربية غنية ومتنوعة صوتياً - مفردات (1415هـ): يهدف هذا المشروع إلى تكوين قاعدة بيانات لمفردات عربية تتسم بالثراء والتنوع الصوتي، وذلك لاستخدامها في تدريب نظم التعرف الآلي على الكلام وذلك في اختبار وتقييم نظم النطق الآلي الكلام العربي، فتم اختيار 663 كلمة عربية تغطى جميع الاحتمالات الصوتية من حيث ورود جميع أصوات اللغة العربية في أماكن الكلمة المختلفة، وورود جميع أصوات اللغة العربية في جميع المواقع الصوتية التي تسمح بها القوانين الفونوتكتيكية العربية على سبيل المثال ما يتبع الصوت (ن) من صوامت وصوائت مختلفة.
وكانت مهمة اللغويين في هذا المشروع هي اختيار أقل عدد ممكن من الكلمات تتسم بالثراء والتنوع الصوتي وفق المعايير المحددة أعلاه، وتم إنجاز كامل متطلبات المشروع عام 1415هـ.
2- مشروع نصوص عربية غنية ومتنوعة صوتياً - جُمل (1422هـ): يهدف هذا المشروع إلى تكوين جمل عربية تحوى المفردات الواردة في المشروع السابق وفق ضوابط محددة منها احتوائها على جميع المفردات الواردة في المشروع السابق، على أن يتراوح عدد الكلمات في كل جملة من كلمتين إلى تسعة كلمات وتكون باللغة بالعربية الفصحى وذات سلاسة في النطق والفهم.
وكانت مهمة اللغويين في هذا المشروع هي تركيب اقل عدد ممكن من الجمل التي تحتوى على المفردات الواردة في المشروع السابق بالمعايير المذكورة أعلاه وكانت النتيجة 267 جملة تتكون من 1835 كلمة بما فيها الكلمات الواردة في المشروع السابق، وقد انتهى المشروع عام 1422هـ وقد استفيد من نتائج هذا المشروع والمشروع السابق في المشروع رقم (4) التالي.
3- مشروع قاعدة بيانات الصوتيات العربية (1420هـ): يهدف هذا المشروع إلى توفير قاعدة بيانات عن أصوات اللغة العربية من حيث مخارج الحروف وطرق إخراجها باستخدام أحدث التقنيات المتوفرة بحيث تتوفر بيانات دقيقة عن مخرج كل صوت عربي وطريقة إخراجه من حيث مخرجه وكمية الهواء المصاحبة له وضغط الهواء داخل التجويف الحلقي أثناء نطق كل صوت وصور فوتوغرافية لمخرج الصوت أثناء نطقه باستخدام منظار الحنجرة وآلات التصوير الخارجية ومناطق التقاء اللسان مع الحنك ووضع الرقيقتين الصوتيتين أثناء النطق.
وقد قام اللغويين في هذا المشروع بوضع وصف لأصوات العربية وطرق جمع البيانات والمعلومات عن مخارجها وإجراء الاختبارات السمعية لها.
وكانت النتيجة أكثر من 64.000 ملف صوتي وصور فوتوغرافية وبيانات عن المخرج، وقد تم الانتهاء من متطلبات المشروع عام 1420هـ.
القاعدة متوفرة الآن على شكل ثلاثة أقراص مدمجة متاحة للباحثين والدارسين من قبل مدينة الملك عبدالعزيز للعلوم والتقنية.
في العدد القادم بإذن الله سوف نقوم باستكمال ما طرحه الدكتور منصور بن محمد الغامدي عن بقية مشروعات معهد بحوث الحاسب والإلكترونيات مثل مشروع قاعدة بيانات الأصوات العربية الهاتفية للمتحدثين السعوديين،مشروع الناطق العربي الآلي، مشروع المُشكّل الآلي، مشروع رومنة أسماء الأعلام العربية...الخ، بالإضافة إلى الخاتمة.
* معهد بحوث الحاسب والإلكترونيات -مدينة الملك عبدالعزيز للعلوم والتقنية
.....
الرجوع
.....
|
|
|
|
توجه جميع المراسلات التحريرية والصحفية الى
chief@al-jazirah.com عناية رئيس التحرير
توجه جميع المراسلات الفنية الى
admin@al-jazirah.com عناية مدير وحدة الانترنت
Copyright 2002, Al-Jazirah Corporation, All rights Reserved
|