توجه النسخة بشكل أساسي إلى الشركات العاملة
في تطوير تطبيقات الويب الخاصة باللغة العربية والتي تتعامل مع
"إدخال" متكرر لبيانات عربية عبر المستخدمين إلي تلك التطبيقات. وكأمثلة للتطبيقات التي يمكن أن تفيد من المدقق الإملائي:
نظم إدارة المحتوى (Content
Management Systems), نظم البريد الإلكتروني, المنتديات,
المدونات .. إلخ.
يعتمد المدقق الإملائي من "الخوارزمي" علي تقنيات المعالجة
الطبيعية للغات, والموضوعة خصيصا للغة العربية, والتي يمكنها
كشف وتصويب الأخطاء الأكثر شيوعا, كالأخطاء الصوتية
والإعرابية, بالإضافة إلى الأخطاء الناتجة عن الشكل الإملائي للهمزة, خاصة في بداية الكلمة.
وبشكل أساسي, فإن النموذج الذي بني عليه المدقق الإملائي يتضمن
جزأين رئيسيين يقوم أحدهما بالتحقق من صحة الهجاء (لمعرفة ما
إذا كان الشكل الإملائي للكلمة صحيحا),
بينما يقدم الجزء الثاني مقترحات الهجاء (والتي تقترح البدائل
الصحيحة).
وقد تم مراعاة نقطتين هامتين عند تطوير هذا المنتج: الأولى هي
أن المستخدم لمثل هذا النظام ليس متخصصا في اللغة العربية
بالضرورة, أما الثانية فهي أن تصيد الأخطاء الخاصة بالكتابة
العربية, وتصويبها, يتطلب أكثر من مجرد نموذج شديد التبسيط
ملائم لتصويب الكلمات الخاطئة, كما هو الحال بالنسبة إلى
مصححات الهجاء التقليدية. وقد أدى ذلك إلى تطبيق منهج "وصفي"
Descriptive
بدلا من تطبيق منهج "فرضي"
Prescriptive
في المنهج المتّبع
لإعطاء المستخدم المقترحات الصحيحة للكلمة.
يقوم المدقق الإملائي من شركة الخوارزمي – واسمه التجاري
KSpell
– بتصحيح الأخطاء في الكلمات
العربية المدرجة بالمعاجم العربية الحديثة والمعاصرة بجانب
قدرته علي تصحيح الأخطاء في مجالات أخرى مثل:
-
الكلمات المستحدثة (مثل: الأتمتة
Automate).
-
الكلمات القريبة من العامية (مثل: كباب, كبابجي).
-
الكلمات ذات الأصل العربي التي اكتسبت معاني أخري مع الاستخدام
الحديث (مثل: استورد, بمعنى "يطلب الماء من البئر" في الأصل
العربي القديم).
-
الكلمات المستعارة من لغات أجنبية (مثل: تليفون, تلفزيون).
-
الأعلام العربية والبلدان (مثل: علي, مدحت, فرنسا, مُؤمرَك).
|