محرك بحث الخوارزمي ومفهرس الخوارزمي

اعرف المزيد عنا...

 

محرك بحث الخوارزمي ومفهرس الخوارزمي

 

نبذة عامة

 

إن اللغة العربية ليست كأي لغة أخرى! فلها ما يميزها من جمال وموسيقى ومنطق.

وبالرغم من جمالها، فما زال حتى الآن يصعب البحث فيها بكفاءة باستخدام محركات البحث الموجودة على الإنترنت.

 

من أين تأتي صعوبة البحث في اللغة العربية؟

إن محركات البحث الموجودة -للغة الإنجليزية مثلاً- تستخدم البحث بالأنماط عن الكلمات، وهذه الأنماط تصلح للبحث في اللغة الإنجليزية ولكنها -حتمًا- لا تصلح للبحث في اللغة العربية، والسبب في ذلك طبيعة الصرف العربي -أي قواعد أشكال الكلمات وتركيباتها المختلفة- فبينما للكلمة الإنجليزية خمسة أو ستة أشكال صرفية، قد تتشكل الكلمة العربية الواحدة بعدد يصل إلى 10.000 شكل صرفي، وبما أن تصريفات الكلمة عامل أساسي في طريقة عمل محرك البحث، لذا كان لابد من إيجاد طريقة للبحث تتناسب مع الطبيعة الصرفية للغة العربية.

 

هل يوجد محرك بحث يناسب اللغة العربية؟

ها هو ذا.. محرك بحث الخوارزمي KSearch الذي تقدمه الخوارزمي من أجل اللغة العربية.

إنه محرك بحث قادر على الفهرسة والبحث في المواقع العربية وفي الوثائق العربية على الشبكات الداخلية للشركات. يستخدم محرك بحث الخوارزمي محللاً صرفيًّا عربيًّا يتيح للمستخدم البحث في جميع الأشكال الصرفية للكلمة باستخدام القواعد الصرفية، أي إنه بحث صرفي. ولضمان دقة البحث ولأنه صُنِع خصيصًا من أجل اللغة العربية فإنه يبحث أيضا بمعنى الكلمة، وأنماطها، ومشتقاتها، وهو قادر على البحث المنطقي أيضًا.

يحتوي باحث الخوارزمي على مفهرس عربي قادر على فهرسة الكلمات العربية في الوثائق وقواعد البيانات باستخدام قواعد الصرف، بالإضافة إلى فهرسة الكلمات غير العربية الموجودة في النص.

 

الخصائص

يستطيع محرك بحث الخوارزمي العثور على جميع الأشكال الصرفية للكلمة العربية، ويسمح للمستخدم بالبحث عن المعاني المرتبطة بأحد المشتقات عن طريق اختيارها منذ بداية البحث ثم عرض النتائج المتعلقة بهذا المعنى.

  • البحث الصرفي العربي:
    لو أردت أن تبحث عن كلمة "اجتماع" فستخرج نتائج البحث متضمنة كلمات مثل: "اجتمع، يجتمعون، المجتمعون، ... الخ". وأقصى ما يمكن أن تقدمه محركات البحث التقليدية التي تحتوي على بحث صرفي نتائج تحتوي على "اجتماع، واجتماع، اجتماعهم".
  • التمييز بين المعاني المختلفة للكلمة:
    في حالة توفر أكثر من معنى للكلمة موضع البحث، يمكن للمستخدم اختيار المعنى الذي يريده، وبالتالي يحصل على نتائج متعلقة بهذا المعنى وحده دون غيره. [وهذا ما يقلل من عشوائية البحث الصرفي]
  • البحث المنطقي:
    بالإضافة إلى البحث بـ "كل الكلمات" و "أي كلمة"، فإن بحث الخوارزمي يشمل البحث المنطقي الذي يتيح للمستخدم البحث بالجملة باستخدام البحث المنطقي "و، أو، ليس"، ليس هذا فحسب فمن الممكن تحديد المسافة بين الكلمات في السياق، ويمكن البحث بترتيب أو بدون ترتيب إدخالها لمحرك البحث.
  • البحث بالأنماط:
    يمكن للمستخدم أن يبحث عن أسماء الأعلام من أصل غير عربي باستخدام الأنماطـ، أي إنه يسمح له بالبحث عن كلمات لم تحلل لغويًّا مثل الكلمات الأجنبية وغير العربية. هذه الخاصية هي البحث عن الكلمة بشكلها أو بأشكال قريبة منها باستخدام الأنماط البحثية التالية: (؟) رمز عربي واحد. (*) أي عدد من الرموز العربية. وهكذا فإذا وجدت الكلمات "بجورج، لجورج، جورج" في النص، لن تحلل لغويًّا ولكن سيتمكن المستخدم من العثور عليها في النص بإدخال "*جورج" مثلاً في خانة البحث.
  • تمييز كلمة البحث عند عرض النتائج:
    تعتبر هذه الخاصية مهمة جدًا لأنها تريح المستخدم من عناء البحث عن أشكال الكلمة المتعددة في نتائج البحث. [إن عدم إتاحة هذه الخاصية قد يجعل عملية البحث عديمة الفائدة]
  • كل أنواع الوثائق التالية مدعومة:
    يمكن لباحث الخوارزمي البحث في المستندات من نوع HTML, TXT, RTF, PDF,UNICODE.
  • القاموس المستخدم في باحث الخوارزمي هو القاموس الشامل للغة العربية المعاصرة الذي يحتوي على مفردات اللغة العربية بالإضافة إلى الكلمات العربية الحديثة المستخدمة في وسائل الإعلام
    وهذا القاموس مبني على النسخة المنشورة من "معجم اللغة العربية المعاصرة" لمؤلفه أ.د/ أحمد مختار عمر، عالم المعاجم الشهير.
  • احتواء باحث الخوارزمي على محرك فهرسة سريع يستخدم تكنولوجيا 64 بت
    يحتوي باحث الخوارزمي على محرك فهرسة سريع للملفات وقواعد البيانات، تصل سرعة الفهرسة إلى 50.000 كلمة في الثانية على حاسوب شخصي مزود بالآتي: (Intel Core2 Duo 2.33GHz processor, 1GB of memory and a SATA hard disk drive) بالإضافة إلى ذلك يستخدم محرك الفهرسة تكنولوجيا 64 بت التي تسمح بحجم غير محدود للفهرس بالمقارنة بتكنولوجيا 32 بت التي لا تسمح بفهرس أكبر من 4 جيجا بايت.
  • معالجة شاملة للفهرس:
    يشتمل نظام الفهرسة على معالجة شاملة للفهرس تسمح للمستخدم بتقسيم مجموعات الوثائق أو صفحات الإنترنت إلى فهارس منفصلة لتسهيل معالجة النصوص. ويتيح نظام الفهرسة أيضا إمكانية حذف وتحديث ودمج الفهارس وحذف وإضافة ملفات أو مجلدات من وإلى الفهارس.

النُسـخ المنتجة من الخوارزمي:


  • نسخة قواعد البيانات:
    في هذه النسخة تتم فهرسة قاعدة بيانات الموقع (باستخدام مفهرس الخوارزمي) وتخزن الفهارس على خادم الموقع. ويستطيع المستخدمون البحث عن طريق المتصفح الذي سيستخدم محرك بحث الخوارزمي الذي يخزن على الخادم. يأتي المفهرس بواجهة تطبيق افتراضية أو يمكن تشغيله من متصفح.
  • نسخة الوثائق:
    في هذه النسخة تتم فهرسة وثائق الشركة على خادم مركزي متصل بشبكة الشركة الداخلية، ويمكن لأي مستخدم متصل بالشبكة الداخلية للشركة أن يبحث في هذه الوثائق عن طريق متصفح من خلال تطبيق على الشبكة الداخلية متصل بمحرك بحث الخوارزمي.
  • نسخة الحاسوب الشخصي:
    تعمل هذه النسخة على حاسوب شخصي واحد، حيث تتم فهرسة وثائق المستخدم على الحاسوب بالإضافة إلى البحث، باستخدام واجهة تطبيق بدون متصفح.
 
 
All Rights Reserved. www.AlKhawarizmy.com
Valid XHTML 1.0 Strict | Valid CSS 3.0