Thursday 4th July,200210871العددالخميس 23 ,ربيع الثاني 1423

     أول صحيفة سعودية تصدرعلى شبكة الانترنت

 

تعوزها الدقة وتحتاج إلى كومبيوترات فائقة القوة تعوزها الدقة وتحتاج إلى كومبيوترات فائقة القوة
برامج التعرف على الصوت لم تحقق حلم التواصل

  * الجزيرة إبراهيم الماجد:
تحدث الانسان إلى الآلة حلم قديم، وتواصله مع «مخلوقات» من صنعه استحوذ على اهتمام كثير من العلماء والمفكرين على مدى قرون، لكن معظم المحاولات في هذا المجال لم تصل إلى نتيجة مرضية، ومع اللجوء إلى مساعدة الكومبيوتر وبرامجه ظهر بصيص أمل، فالمعلوماتية قادرة على دمج معطيات الثورة الرقمية في شكل يتيح للناس توجيه الاوامر إلى جهاز الكومبيوتر، اي الاستغناء عن لوحة المفاتيح والماوس وبقية وسائل ادخال المعلومات إلى الكومبيوتر، وفعلا، تمكنت شركات عديدة من تحضير برامج تضع المستخدم في موقع يمكنه من ايصال أوامره إلى الاجهزة والقطع بواسطة صوته، وأولى المحاولات الناجحة كانت من شركات مثل IBM التي اصدرت برنامج Vua Voice، وVirage التي اصدرت اوديولوغر وفيديو لوغر، وWizaed Software التي أنزلت Interactive Voice Assistant وL & H التي أنزلت speaking Deluxe اعتمادا على تقنية IBM، وأخيرا ضمنت شركة مايكروسوفت نظامها التشغيلي Windows XP برنامجا يتيح تجربة توجيه الاوامر فقط، ورغم ان تقنية التعرف على الكلام المحكي قديمة إلا ان برامجها لا تزال بسيطة ولم تتطور كثيرا بعد عقد من التجارب في المجال الذي يتيح تطوير التقنية التي تسمى Voice Recognition، فتارة تقول هذه الشركات ان التطوير جار، وتارة اخرى تقول ان تسويق المنتجات صعب، اما المستخدمون والنقاد يقولون ان النتائج التي تخرج بها الشركات غير مرضية خاصة في مجال الاملاء، ونتائج الابحاث التي قامت بها الشركات ليست وليدة اعمالها فقط بل هي حصيلةربع قرن من الاعمال في مجال علم الاصوات والترددات الفيزيائي، وشركة IBM كانت الرائدة في هذه التقنية لكنها لم تستمر في التطوير، بل باعت شركات اخرى مثل Virage التقنيات التي توصلت إليها في علم الصوتيات، اعتمادا على تكنولوجيا IBM حضرت Virage برنامج Video Logger الذي يستطيع تحويل الكلام في فيلم الفيديو إلى نص مكتوب، وهذا مكن بعض الشركات من ارشفة الافلام وتحويل الاحاديث الصوتية فيها إلى احاديث نصية.
IBM رائدة
ورغم تعدد الشركات المحضرة لهذا النوع من البرامج تمكنت IBM من الحفاظ على مركز متقدم، فهي وعلى مدى 25 عاما أنزلت اكثر من مائة برنامج صوتي وتوصلت أخيرا إلى برنامج Via Voice باصدارات عدة آخرها ما سمته «طبعة الالفية»، لكن المشكلة الدائمة التي تواجه هذا النوع من البرامج تكمن في الدقة والتدريب المطلوبين من المستخدم لكي يبدأ الكومبيوتر التعرف على صوته وطريقة تحدثه و«سماع» مخارج الحروف لديه، ولذلك فإن على المستخدم انهاء البرمجة التي لم تتوصل إلى حل يُمكِّن من شراء البرنامج وبدء استخدامه فورا، وقد تمتد عملية «تمرين» البرنامج ساعات قبل ان يبدأ التعرف على صوت المستخدم.
الشركات الاخرى
فضلا عن IBM، قامت شركات عديدة بمحاولات للاستفادة من هذه التقنية، لكن أيا منها لم يتمكن من اعداد برنامج يتناسب وطموحات المستخدمين، وبعض هذه الشركات أطلق برامج تتعلق بتحويل الكلام المكتوب إلى كلام محكي ، بحيث يقوم المستخدم بكتابة نص ويقوم الكومبيوتر بقراءته بواسطة البرنامج الخاص، وعملت شركات اخرى على تطوير برمجة هذا النوع من التقنيات، فتم تقديم لغة البرمجة XVML التي حسنت قليلا أداء الكومبيوترات المسؤولة عن مراكز الهاتف التي تقدم الاجابات المحضرة سابقا للمتصلين Call Centers، وتوجد هذه المراكزعموما في المطارات وصالات السينما والمراكز التجارية التي تتلقى استفسارات من الزبائن، ونجحت شركات اخرى في تطوير XVML وجعله قابلا للتطوير الاضافي، غير ان كثيرا من الابحاث والتجارب التي بدأت مثلا اواخر التسعينات لم تتواصل مع القرن الجديد وهذا أدى إلى تراجع، وفي حين نرى كل هذه الاخفاقات، لجأت شركات تحضير برامج أجهزة الهاتف الجوال إلى تضمين اعمالها برامج التعرف على الصوت، لكنها بدورها لم تكن ناجحة جدا واعتبرها البعض مجرد لعبة مسلية يتم اللجوء اليها فقط عند الملل.
التجهيز
تتطلب برامج التعرف على الكلام احدث أجهزة الكومبيوتر لأن الشركات التي تحضرهذه البرامج توجهها للعمل مع أحدث الاجهزة، وكلما كان الكومبيوتر اسرع وأكثر قدرة كانت «محنة» التعرف على برامج التعرف على الكلام أخف وطأة، وعمليا فإن ما تم اصداره من نسخ لهذه البرامج، سواء للتعرف على اللغات الاجنبية او العربية، يتطلب أداء فائقا من اجهزة الكومبيوتر التي يجب ان تتضمن:
1- بطاقة صوت فائقة الأداء.
2- معالجا حديثا جدا (بنتيوم IV او أحدث).
3- قرصا صلبا يفوق 56B تخينا.
4- سماعات للأذنين.
5- ميكروفونا.
6- سرعة RAM تفوق 128 MB.
خلاصة القول، انه مهما تحدثت الشركات عن انجازاتها في مجال التعرف على الكلام المحكي لن يعترف لها بالانجاز ما دام المستخدم مضطرا لارهاق نفسه في اسماع الكومبيوتر صوته قبل ان يستخدم البرنامج الذي لا يقدم دقة كافية تتيح تعرفه على الكلام العادي للانسان، لذا، لا تزال الرحلة طويلة أمام هذه الشركات وخاصة أمام IBM المنتظر منها اكثر من مجرد الانتظار واتاحة الفرصة أمام مايكروسوفت لقطف الثمار.. كالعادة.

 

[للاتصال بنا][الإعلانات][الاشتراكات][الأرشيف][الجزيرة]
توجه جميع المراسلات التحريرية والصحفية الىchief@al-jazirah.com عناية رئيس التحرير
توجه جميع المراسلات الفنية الىadmin@al-jazirah.com عناية مدير وحدة الانترنت
Copyright, 1997 - 2002 Al-Jazirah Corporation. All rights reserved