عن الشركة
  من نحن
  اتصل بنا
   
 
KSearch
 

خصائص KSearch

 

من يستخدم KSearch

 

كيف يطور أعمالك

 

اختبر KSearch

 

KSearch خطوة بخطوة

 
التقنيات
  تقنية البحث العربي
   
وجهات أخري
  خريطة الموقع
  الرئيسية
  English
   



"البحث فيما وراء الكلمات".. !

 



اللغة العربية لغة متفردة في خصائصها، وعلي الرغم من أن عدد مستخدمي الإنترنت العرب 22 مليون عربي، وأن عدد صفحات الويب العربية 100 مليون صفحة، إلا أن الشركات العالمية لم تهتم بإنتاج محركات بحث تأخذ في حسبانها الطبيعة المختلفة للعربية .

 



المشكلة بالتفصيل | الحل_الذي_تقدمه_الخوارزمي | إلى_من_يتوجه_KSearch |
 
خصائص_المنتج_KSearch | نُسَخ_المنتج

المشكلة بالتفصيل :

فلنفترض أن مستخدما مهتم بالسياسية الدولية، ويرغب في معرفة نتائج "اجتماع منظمة الأمم المتحدة". فعند الدخول على إحدى محركات البحث على الإنترنت أو إحدى المواقع الإخبارية، قام بإدخال "اجتماع منظمة الأمم المتحدة" في خانة البحث.

 

عندئذ تظهر قائمة بالنتائج، تشمل الصفحات التي وجدت بها كلمات الجملة "اجتماع منظمة الأمم المتحدة"، لكن جملا مثل "اجتمعت منظمة الأمم المتحدة" أو "وقد اجتمع أعضاء منظمة الأمم المتحدة" أو "وفي آخر اجتماعات منظمة الأمم المتحدة"، هذه الجمل لن تظهر على الإطلاق.
 

محرك "الباحث العربي" أو KSearch – حيث سيطلق المنتج تجاريا بهذا الاسم -  الذي تقدمه شركة "الخوارزمي لبرمجيات اللغة", يستطيع أن يفهم الكلمة ويدرك أشكالها الصرفية المختلفة ويعطيك مثل تلك النتائج.

 

لنفترض فرضية أخرى ممتعة، ماذا لو أن المستخدم يبحث عن "حادث الطائرة المصرية"، هل ستستطيع محركات البحث الحالية أن تمنع جملة مثل "يتحادثون عن عمل فني متميز" من الظهور في قائمة نتائج البحث؟ KSearch يستطيع ذلك، لأنه سيسأل المستخدم أولا: "ماذا تعني بكلمة حادث؟"، ويجعلك تختار من قائمة تحتوي على المعاني المحتملة لكلمة "حادث": (الحدوث، المحادثة.. إلخ). وعلى هذا الأساس سيستطيع محرك البحث أن يحذف كثيرا من الكلمات المتشابهة في الهجاء/التركيب والمختلفة في المعنى.

 

 أعلى الصفحة

الحل الذي تقدمه "الخوارزمي":

 

KSearch هو محرك بحث إلكتروني، يقوم بالبحث داخل الوثائق وصفحات الويب المكتوبة باللغة العربية ويستطيع الحصول على نتائج بحث سريعةFast)) ودقيقة(Accurate) وشاملةComprehensive)) استنادا لفهمه لتفرد خصائص اللغة العربية وقواعدها الصرفية.

 أعلى الصفحة

إلي من يتوجه KSearch:

 

وتنبع الحاجة لمثل هذا المنتج لعدة حقائق مهمة، فالمعرفة الإنسانية المسجلة إلكترونيا تتضاعف مرة سنويا، وتشكل المعلومات النصية حوالي 70% منها[1]، وللثقافة العربية نصيب يقدر بنحو 100 مليون صفحة ويب على الإنترنت، بجانب مئات الآلاف من الوثائق الإلكترونية العربية Electronic Documents والموجودة في النظم الداخلية للشركات والمؤسسات والحكومات.

 

وكمثال للمؤسسات الكبرى التي لديها مواقع تتصل بكم هائل من البيانات العربية، هناك 76 صحيفة عربية (من أصل 140([2] لديها مواقع على الويب مزودة بمحركات بحث.

وهناك 22 مليون عربي يستخدمون اللغة العربية أثناء البحث، وربما يرجع ذلك لأن 65 % من العرب المستخدمين للإنترنت (في عام 2005) لا يستطيعون قراءة اللغة الإنجليزية[3].

 

وقد أجرت الشركة اختبارا على 100 موقع عربي مختلف[4]، ووُجد أن 48% من عينة البحث تستخدم محركات بحث عادية (بدون البحث صرفيا أو بالمعنى)، بينما 52% منها لا تستخدم محرك بحث على الرغم من كثافة المحتوى العربي الذي تحتويه تلك المواقع، وعلى الرغم من أن 60% من العينة احتوت صفحاتها على كم كثيف من المعلومات باللغة العربية.

 

لذلك فإن هناك مساحة هائلة يستطيع المحرك KSearch أن يتحرك داخلها سواء عن طريق عرض خدماته على المواقع العربية التي تريد تطوير محركاتها إلى محركات أكثر ذكاء، أو تلك التي ليس لديها محرك بحث من الأصل في الوقت الحاضر وتريد إضافة محرك بحث لصفحاتها، أو عرض خدماته على الشركات والمؤسسات التي لديها نظم إلكترونية داخلية لإدارة المعلومات وتريد إضافة أداة تستطيع من خلالها الحصول على المعلومة الصحيحة بشكل سريع وفعال وبدون إضاعة وقت في نتائج غير مرغوبة.


 

  أعلى الصفحة

 

خصائص المنتج KSearch : 

  1. بحث بالتصريفات اللغوية للكلمات العربية:
    إذا بحثت عن "اجتماع"، فسوف يعرض لك المحرك نتائج تحتوي كل الصفحات/ الوثائق التي وردت بها الكلمات "اجتمع، اجتمعوا، يجتمعون، اجتمعن.. إلخ". وليس "واجتماع" أو "الاجتماع" فقط (كما في محركات البحث العادية).

  2. التمييز بين معاني الكلمات المختلفة:
    يسألك المحرك عن المعني الذي تقصده بكلماتك - إذا رغبت أنت في ذلك - لذلك فسوف يعرض نتائج مختلفة للكلمة "هاتف"، حيث تعني (التحادث عبر الهاتف، الصياح.. إلخ).

  3. إمكانية البحث المنطقي:
    بالإضافة إلى إمكانية البحث باستخدام "كل الكلمات " أو "أي من الكلمات"، يمكن أيضا استخدام العلاقات المنطقية "و"، "أو"، "ليس" ، مع إمكانية البحث بالكلمات أو العبارات (الكلمات المتجاورة) مع وضع مسافات قصوى بين الكلمات وبعضها.

  4. إمكانية البحث بالأنماط:
    يتيح المحرك إمكانية البحث بالأنماط، حيث يمكن استخدام الرمز "؟" مع أي كلمة ليرمز إلى حرف واحد، أو الرمز "*" ليرمز إلى أي عدد من الحروف. وهذا النوع من البحث يتيح إمكانية البحث بالأعلام، خاصة الأجنبية منها.

  1. عرض صفحات النتائج مع إبراز كلمات البحث بلون مميز.

  2. يستطيع البحث داخل ملفات HTML - PDF - TXT- RTF  بالإضافة للملفات المكودة بـ Unicode.

  3. محرك البحث ملحق به قاموس يغطي اللغة العربية المعاصرة بكل المصطلحات الحديثة الموجودة علي الإنترنت، مما لا يجعل مجالا للمحرك أن يتجاهل أو يرفض كلمات البحث المدخلة.

  4. تقنية متقدمة للفهرسة :
    يقوم
    KSearch عند تركيبه على موقع ما بفهرسة كل الكلمات الموجودة على هذا الموقع وأماكن وجودها داخل الموقع وأماكن وجود معانيها المختلفة داخل صفحات الموقع – بحيث يتم البحث داخل هذا الفهرس لاحقا، مما يحقق السرعة الفائقة.

    يقوم
    KSearch بالفهرسة بسرعة تصل إلى 20,000 كلمة في الثانية أو 1,200,000 كلمة في الدقيقة (على معالج من طراز AMD Athlon XP 2500+ بذاكرة 1 جيجا بايت)، كما أن حجم الفهرس غير محدود لاستخدامه لتكنولوجيا 64 بت (بمعني أنه صالح للبحث في أي حجم من البيانات).

  5. إدارة كاملة للفهارس :
    إذا كان الموقع أو المؤسسة ترغب في إنشاء أكثر من فهرس (مثلا موقع إخباري يريد فهرسا للصفحات الثقافية وآخر للصفحات السياسية و ثالثا للصفحات الرياضية)، فسوف يعطيه
    KSearch إمكانية حذف أجزاء من فهارس، حذف فهارس، عمل تحديث للفهارس، أو دمج فهارس.

 أعلى الصفحة

 

نُسَخ المنتج:

يأتي المنتج
KSearch إلي المستخدمين عبر إصدارين اثنين:

1-                          KSearch لمواقع الويب:
تقوم هذه النسخة بفهرسة فهرسة محتويات قاعدة البيانات الخاصة بالموقع، ثم بتخزين الفهرس على الخادم الذي يستضيف الموقع Host Server. ويستطيع المستخدم العادي استخدام المحرك من على الموقع مباشرة عبر جزئية البحث التي سيتم تركيبها على الموقع.

2-                         KSearch للشركات والمؤسسات:
تعمل هذه النسخة على الشبكات الداخلية Intranets للشركات والمؤسسات، ويقوم بفهرسة كل الوثائق Documents الموجودة على الشبكة وتخزينها على خادم مركزي Centralized Server وإخراج النتائج للمستخدم على متصفحه Browser الشخصي، من خلال تطبيق ويب داخلي Internal Web Application يعمل على الشبكة


[1] المصدر: كلية إدارة المعلومات والنظم- جامعة بيركلي- الولايات المتحدة, http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/internet.htm
[2] نقلا عن خدمة Google Directory, http://www.google.com/dirhp
[3] المصدر: شركة "مدار" لأبحاث السوق www.madarresearch.com  (منقول عن: شبكة IslamOnLine.net).
[4] البحث أجري علي 100 موقع عربي عشوائي تم استخراجه عبر خدمة Google Directory .

 

 

 أعلى الصفحة

 

 
  © 2007 شركة الخوارزمي لبرمجيات اللغة, كل الحقوق محفوظة.