أنت هنا

    رسالة ماجستير تبحث في تصميم نظام تحويل نص عربي مكتوب يدويا الى ملف نصي

    تاريخ السيمنار: 
    الأحد, شباط (فبراير) 19, 2017

    ناقشت الطالبة حنين سعيد في قسم الحاسبات والتحكم الالي بكلية الهندسة الميكانيكية والكهربائية رسالة ماجستير بعنوان/ تصميم نظام تحويل نص عربي مكتوب يدويا الى ملف نصي /وحصلت على درجة جيد جدا بعلامة قدرها 87 .
    وعرضت سعيد أهمية البحث بإمكانية أرشفة ومعالجة الوثائق الورقية ومنها الشيك المصرفي الذي هو تطبيق هام من تطبيقات أنظمة التعرف على المحارف لأنَّ الشيكات المصرفية من أكثر المستندات الورقية انتشاراً واستخداماً والأبحاث المنشورة في مجال التعرف على الكلمات العربية للمبلغ المكتوب على الشيكات المصرفية نادرة جدّاً موضحة انه يمكن أن يكون تطبيق مساعد في مجال واسع من تطبيقات التعرف الآلي على الكلمات حتى المكتوبة باللغات المشابهة مثل الفارسية والأوردو والتي تتألف من نفس الأبجدية ورفد البحث العلمي بقاعدة بيانات لنماذج مكتوبة يدوياً من قبل أشخاص مختلفين وهي مفيدة للباحثين في هذا المجال.
    و بينت ان مشكلة البحث تتمثل بأن التعرف على النصوص العربية المكتوبة يدوياً Arabic Handwritten Script يواجه مشاكل كثيرة بسبب الاتصالية بين الأحرف ووجود النقاط والعلامات الأخرى التي يمكن أن تُغير معنى الكلمة. كما أنَّ غالبية الأحرف المكتوبة يدوياً تُكتب بطرق تختلف باختلاف الكاتب وبالتالي يمكن أن تظهر أشكال كثيرة متعددة للحرف الواحد, ويمكن لنفس الشخص أن يكتب بطرق مختلفة,بالتالي تكون عملية تجزيء الكلمات العربية المكتوبة يدوياً إلى أحرف صعبة ومعقدة, نظراً لتنوع أشكال كتابة الأحرف على سبيل المثال(صعوبة التمييز بين حرف السين والخط الواصل بين الأحرف المشكلة للكلمة في بعض النماذج) كما في الشكل التالي بالإضافة إلى اختلاف الأبعاد لكل حرف باختلاف الكاتب و مشاكل التداخل بين الأحرف.
    ومن المشاكل والصعوبات أيضاً التشابه الكبير بين بعض كلمات المبلغ (الأرقام المكتوبة) مثل تسعمائة, سبعمائة وخمس,خمسة وسبعون, تسعون وغيرها مما يجعل عملية استخلاص سمات مميزة لكل كلمة أمراً صعباً.
    واوضحت مبررات البحث بتسهيل التفاعل بين الحاسب والإنسان عن طريق تحويل النصوص المكتوبة يدوياً على مستندات ورقية إلى صيغة رقمية ممايوفر الكثير من الوقت ويسهل معالجتها وتحويلها إلى أي لغة أخرى,كما أن َّعملية تدريب الحاسوب للتعرف على الكتابة اليدوية لاتزال في مراحل التطوير والبحث, ولم تصل إلى مرحلة التطبيق الفعلي لافتة الى ان الهدف من الرسالة هو تصميم نظام تحويل نص عربي مكتوب يدوياً إلى ملفات نصية قابلة للتحرير مما يساعد على تخفيض حجم الذاكرة اللازم لعملية الأرشفة, حيث تتطلب الملفات النصية مساحة تخزينية أقل, وإمكانية تعديلها ومعالجتها من قبل الحاسب بدون الحاجة لإعادة كتابتها,والتعرف على كلمات المبلغ المكتوبة يدوياً على الشيكات المصرفية باستخدام تقنيات معالجة الصورة بهدف استخلاص النص المراد معالجته والتجزيء إلى كلمات واستخلاص السمات المميزة لكل كلمة باستخدام خوارزمية حديثة نسبياً وهي الهيستوغرام للتدرج الموجه HOG(Histogram of Oriented Gradient),والتصنيف باستخدام الشبكات العصبية الاصطناعية.
    ووصلت الباحثة الى نتائج أهمها زيادة نسبة التعرف بزيادة عدد وأنواع نماذج التدريب ويستطيع التعرف على صور النصوص العربية المكتوبة يدوياً وتحويلها إلى ملف نصي ويدعم التعرف على كافة امتدادات الصور (jpg,tiff,png,..) وكافة أنواع الصور (الملونة color,الرمادية gray scale ,الثنائيةBinary ) واستخلاص النص المكتوب يدوياً من صورته بنسبة 99.49% وتمكن النظام من تجزيء النص إلى كلمات بنسبة 89.85% والتعرف على الكلمات المشكلة للنص بنسبة (88.53-89.14)% .
    وقدمت سعيد عددا من المقترحات كتوسيع قاعدة البيانات لتشمل مفردات أخرى من مفردات اللغة العربية والتجزيء باستخدام خوارزميات أخرى وتطوير البرنامج ليدعم النصوص المكتوبة باللغات الأردية والفارسية وتطوير البرنامج بمنظومة برمجية أخرى.
    أعدت الطالبة بحثها باشراف د. حسن الاحمد مدرس في قسم الحاسبات والتحكم الالي في كلية الهندسة الميكانيكية والكهربائية وناقشت رسالتها امام لجنة الحكم المؤلفة من د. حسن الاحمد عضوا ومشرفا ود.مريم ساعي استاذ مساعد في قسم الحاسبات والتحكم الالي في كلية الهندسة الميكانيكية والكهربائية عضوا د. بلال شيحا استاذ مساعد في الحاسبات والتحكم الالي في كلية الهندسة الميكانيكية والكهربائية عضوا .
    المكتب الصحفي 19/2