تقنياتنا هى...
لتحميل ملف يصف التكنولوجيا المستخدمة اضغط هنا

معالجة اللغة الطبيعية مجال بيني يجمع بين علوم الحاسب واللغويات، حيث تقوم نظم فهم اللغة الطبيعية بتحويل اللغة إلي رموز تستطيع برامج الحاسوب التعامل معها.
كثير من المشاكل في مجال برمجة اللغة الطبيعية تنشأ من توليد وفهم اللغة؛ فمثلاً لابد للحاسوب من نموذج صرفي لكي يفهم جملة إنجليزية، وفي نفس الوقت لابد من نموذج صرفي لكي يتمكن الحاسوب من إنشاء جملة إنجليزية صحيحة.
وتعني جمع وتخزين البيانات لتيسير العثور السريع والدقيق على المعلومات، ويضم تصميم الفهرس مفاهيم بينية من اللغويات وعلوم الحاسب.
يضمن البحث الصرفي أنّ معادلة البحث ستبحث في كل الأشكال الصرفية للكلمات عند إنشاء الفهرس وإجراء البحث عن الجمل المطلوبة.
هذه الخاصية من البحث تعني أن يكون عدد الكلمات الموجودة بين كلمات البحث محددًا، ويحدد بواسطة رمز معيّن.
سُمِّيَ هذا النوع من البحث باسم "جورج بول"، عالم الرياضيات الإنجليزي الذي عاش في القرن التاسع عشر.
يستخدم البحث المنطقي لإجراء بحث فعّال، يستبعد نتائج كثيرة ليست لها علاقة بموضوع البحث، ويمكن إنشاء تعبيرات بحث مركبة عن طريق البحث المنطقي باستخدام الكلمات "و، أو، ليس".
ويمكن أيضا استخدام الأقواس لإجراء بحث منطقي متقدم مثل: "(مدرسة أو كلية) و الفن"، ويبحث هذا التركيب عن المعلومات التي تتعلق بمدارس وكليات الفن.
وتستخدم في العثور على الكلمات التي لا توجد في قاموس اللغة ولا يمكن البحث عنها باستخدام البحث اللغوي الصرفي.
(*) تحل محل أي عدد من الحروف. (؟) تحل محل حرف واحد.
العشوائية هي نتائج البحث غير المرغوب فيها والتي ليس لها علاقة بالكلمات موضوع البحث.
إن المحلل الصرفي قادر على تحليل الكلمة العربية، والتعرف على لواحق الكلمة وجذرها وأصلها الثلاثي ومعناها، ليس هذا فحسب فهو يستطيع أيضًا توليد كلمات باستخدام الجذر واللواحق، ويمكن دمج هذا المحلل مع برمجيات أخرى ليضيف خاصية البحث الصرفي العربي.
تقنية تدقيق وتصحيح تستخدم برمجة اللغة الطبيعية، وقد صممت خصيصًا من أجل اللغة العربية، وهي تستخدم محللاً صرفيًّا عربيًّا، يستطيع الهجائي أن يكتشف الأخطاء الإملائية ويقترح تصحيحات لأكثر الأخطاء شيوعًا.
تنقسم آلية عمل المدقق والمصحح الهجائي في جزأين؛ الأول: يتحقق من هجاء الكلمة، والثاني: يقترح قائمة بالكلمات الصحيحة.
يستخدم هذا المصطلح في مجال الترجمة الآلية، حيث تنتج الأخطاء الصرفية التركيبية من تطبيق خاطئ للقواعد الصرفية والتركيبية. تستطيع المدققات اللغوية البسيطة أن تكتشف الأخطاء التي تنتج عنها تراكيب غير معبرة، أما الكلمات الصحيحة الموجودة في غير سياقها فلا يمكن اكتشافها.
وهو الأصل الذي تشتق من الكلمات، فجذر مصنع وصانع وصناعة هو: ص ن ع.
إن جذور الأفعال ومعظم الأسماء في اللغات السامية تتميز بالحروف الصامتة، تشتق الكلمات المستخدمة في اللغة من هذه الجذور بإضافة الحروف المتحركة والصوامت الزائدة عن الجذر، والتي تتخذ شكلاً صرفيًّا ملائمًا لحروف الجذر وبطرق تتبع قواعد ثابتة. غالبًا ما تتميز اللغات السامية بأن معظم جذور كلماتها ثلاثية.
وهو عملية استخراج لفظ من لفظ، ويعرف بأنه أخذ صيغة من أخرى مع اتفاقهما معنًى ومادة أصلية وهيئة تركيب لها؛ ليدل بالثانية على معنى الأصلية بزيادة مفيدة؛ لأجلها اختلفا حروفا وتركيبًا.
مثل أن تأتي من (س ل م) على وزن فَعِل (سَلِم)، وعلى فاعِل (سالم)، وعلى فَعَالة (سَلامة)، وعلى فَعِيل (سَلِيم)، وعلى إفعال (إسلام)، وهكذا.
اللغة العربية هي لغة عالية الصرفية تحتوي على تركيب معقد من الضمائر واللواصق قبل وبعد الفعل والاسم، وينتج كم هائل من أشكال الكلمة بكل احتمالات سوابقها ولواحقها مع مراعاة التوافق بينهما, وقد تتشكل الكلمة العربية الواحدة بعدد يصل إلى 10.000 شكل صرفي.
علم الدلالة فرع من فروع علم اللغويات، يدرس معاني الكلمات والجمل والنصوص، ولا ينفصل عن دراسة التركيب الصرفي للكمة وبيان المعنى الذي تؤديه صيغتها.
تُحدِّد قواعد الهجاء الطريقة الصحيحة لاستخدام نظام كتابة اللغة. تحتوي اللغة العربية على 25 حرفًا أساسيًّا، ولا يوجد أحرف كبيرة وصغيرة كما في الإنجليزية مثلاً. تكتب الحروف العربية باليد وتطبع في شكل حروف متشابكة بحيث تتصل معظم الحروف بالحرف التالي لها.
يمكن للحرف الواحد أن يأخذ أربعة أشكال بحسب موقعه كالتالي:
في العربية تكتب الحروف المتحركة الطويلة بينما لا تكتب القصيرة، لذا يجب أن يكون القارئ ملمًا بقواعد اللغة لكي يتعرف على الحركات القصيرة.
وتقسم إلى:
