الانتقال للخلف   منتديات بلاد ثمالة > الأقسام الــعــامة > الــمـنـتـدى الـعـام

 
إضافة رد
 
أدوات الموضوع انواع عرض الموضوع
  رقم المشاركة : ( 1 )  
قديم 08-18-2008
الصورة الرمزية alsewaidi
 
alsewaidi
أبو ماجد

  alsewaidi غير متواجد حالياً  
الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع
افتراضي المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

المُدَوَّنات النَّصِّيَّة
ودور اللغة العربية في التعامل معها
د/ سلوى حمادة
الملخص
لقد أصبح تحليل المُدَوَّنات النصية corpus-based analysis من أهم الموضوعات البحثية في مجال العلوم اللغوية في السنوات الأخيرة. وتُعَدُّ صناعة المعاجم والأبحاث القائمة على الظواهر اللغوية ناقصة وضعيفة ما لم تستند في مادتها اللغوية على مكتنزات لغوية شاملة ومتنوعة. وبالرغم من وجود العديد من المُدَوَّنات العربية، إلا أن إنتاجها كان من خارج المنطقة العربية، وبتمويل من هيئات أجنبية. ورُبَّما يرجع السبب في ذلك إلى عدم معرفة أو استيعاب اللغويين لأهمية النصوص اللغوية المدوّنة في المُدَوَّنات ودورها في دعم الأبحاث في مجال اللغة العربية، على سبيل المثال. وبسبب هذا القصور، ارتأينا إلى شرح مفهوم المُدَوَّنات النصية، وفوائدها، وأنواعها خدمة للباحثين في اللغة العربية.

كلمات دالّة : المُدَوَّنات النصية - النصوص الألكترونية- الأغراض المعجمية – بناء المُدَوَّنات وتحليل النصوص – الإحصاء اللغوي

1. المقدمة
أغرى - الباحثين في مجال اللغويات - ظهور الحواسيب فائقة السرعة، والتوسع في نظم الذكاء الاصطناعي الذي تعد آليات التعامل اللغوي من أهم مقوماته، وظهور النظم الآلية الجيدة التي تحاكي مهام الخبراء العاملين في المجال اللغوي بالاستفادة من هذه التقنيات لتطوير التطبيقات اللغوية وعمل ما يسمى بالعقل الحاسوبي الذكي الذي يستطيع فهم اللغة والتعامل مع البشر باللغة الطبيعية. وذلك عن طريق إكساب النظم الآلية الخلفية اللازمة للتحليل والاستنتاج. وأصبح المطلوب اختزال مضمون الخبرة البشرية بكل ما تشمله من معلومات، ومعارف، ومهارات، وأحكام داخل الآلة.
كما شجع أيضًا انتشار الحاسوب كوسيلة للتعليم، ودخوله في مجال تعليم اللغات، والتسابق العلمي والتقني بين دول العالم في مجال الترجمة الآلية – كأحد أهم وأصعب التطبيقات اللغوية- على الخوض بعمق في مجال التطبيقات اللغوية بكافة أنواعها. وكانت ومازالت مشكلة عمل معاجم تتضمن معلومات ومعارف ومهارات وأحكام اللغة من أهم المشكلات الَّتي تقابل العاملين في المجال. وبدأت الأعمال اللغوية بداية تقليدية تبحث في وضع معاجم ومحللات لغوية مقيدة بعقلية واضعيها. ثم بدأ قصور هذه المعاجم في الظهور عند التطبيق وأصبحت الحاجة ضرورِيَّة لتطبيقات أكثر شمولية، فلجأ العاملون في المجال إلى تدعيم أعمالهم بالعمل الإحصائي على نصوص تمثل الواقع اللغوي. وسرعان ما ظهرت أهداف وغايات أكبر من خلال هذا العمل الإحصائي؛ إلا أن مشكلة عدم وجود القاعدة النصية الَّتي تخدم هذه الأعمال باتت واضحة، الأمر الَّذي تنبثق عنه الحاجة القوية لعمل المتون النصية / المدونات الخام. هذه المتون استطاعت الرقيّ بالأعمال اللغوية لدرجة أعلى في الدقة والسرعة وحجم النتائج وشمولها في الاستخدام الفعلي للغة. ثم بدأ قصور هذا النوع في مد الباحثين بمبتغاهم أو صعوبة التطبيق على هذا النوع من المتون. فظهرت في السنوات الأخيرة فكرة المدونات - المتون المرمزة. إلا أن إنتاجها ليس بهذه السهولة، بل إن لها مشكلات عديدة. ويُعَدّ إدخال العامل البشرى بها سلاحًا ذا حدين، فهو يضفي الدقة على التحليل والترميز – لو طبق من قبل محترفين- إلا أنه يحتاج زمنًا طويلا وجهدًا جهيدًا. وبالرغم من ذلك يرى العاملون في المجال طول الوقت هنا عيبًا بسيطا إذا ما قورن بالإمكانيات الهائلة الَّتي ستخدم بها هذه المتون مجال التطبيقات اللغوية.

توقيع » alsewaidi
قال بعض السلف:"قد أصبح بنا من نعم الله تعالى ما لا نحصيه مع كثرة ما نعصيه فلا ندري أيهما نشكر، أجميلُ ما ينشر أم قبيح ما يستر...؟"
رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 2 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

المدونات الإلكترونية:

ما هو النص الإلكتروني


هو أي نص مخزن على جهاز إلكتروني. هذا النص يمكن التعامل معه باستخدام هذا الجهاز: مثل رسائل الهاتف الجوال
أو رسائل البريد الإلكتروني
أو نصوص معالجة الكلمات
ولهذه الأخيرة صور عديدة.

2) ما المقصود بالمدونات النصية Corpus؟
كلمة “Corpus” كلمة إنجليزية مشتقة من كلمة لاتينية بمعنى الجسد وترجمة الكلمة اللاتينية الأصل “corpse” التي تقابل في الإنجليزية “body” وجمعها في اللاتينية هو “corpora”. وهي عبارة عن مجموعة من النصوص المتاحة للاستخدام الحاسوبي، ويُطلق على مجموعة Corpus / المدونات بالإنجليزية لفظ .”corpora” ونظريًا، يجوز أن نطلق على أكثر من نص مصطلح (مُدَوَّنة). وقد عرفها معجم أكسفورد [1] للغة الإنجليزية بأنها "جسم من المادة المكتوبة أو المنطوقة يبنى عليه التحليل اللغوي". أما معجم ديفيد كرستال فعرَّفَها بأنها "مجموعة من البيانات اللغوية المكتوبة أو المُحَوَّلة لمادَّة مكتوبة من تسجيلاتٍ صوتية، يمكن أن تستخدم كنقطة بداية لوصف اللغة أو طريقة لإثبات الفرضيات اللغوية" [2].
وبالرغم من أن المتون كانت فيما قبل نصوصًا ورقية؛ إلا أن المتون تُعٌرف الآن على أنها النصوص المقروءة آليا، وأطلق عليها مدونات حاسوبية computer corpora. وعندما نتحدث عن المتون والمدونات فإننا نعنى الحاسوبية - النصوص الالكترونية - ما لم نذكر خلاف ذلك. وتعرف المدونات في علم معالجة اللغات الطبيعية بأنها؛ "بناء كبير من النصوص الإلكترونية يستخدم في التحليل الإحصائي اللغوي ويتحقق من تكرار أو صحة القواعد اللغوية".
3) هل هناك مجموعات من النصوص الإلكترونية لا تمثل متنًا أو مُدَوَّنة؟
نصوص شبكات المعلومات ليست متنًا [3] لأنها:
1. غير محددة
2. تتغير باستمرار وبمعدل الثواني وبدون أية منهجية.
3. لم تصمم لأغراض لغوية.
4. تتخلَّلها الصور والأشكال والخطوط وغير ذلك.
ونحن نرى أنه يمكن التعامل معها كمصدر للمدونات إذ يتم حصر النصوص المتوفرة عليها وتنظيمها بصورة مُدَوَّنة، بل أن البعض يعتبرها أهم مصادر المدونات.
الأرشيفات والسجلات
1. تجمع لأغراض مختلفة[3].
2. تصنف بأولويات متغيرة.
النص الواحد لا يمثل مُدَوَّنة.
تجميع الشواهد اللغوية citationأو المقتبساتquotation لا يمثل مُدَوَّنة لعدم وجود اتصال نصي أو معرفة بالمنهجية التي اتبعت في تكوين كل منهما[3].
4) التدوين اللغوي
يعتبر التدوين اللغوي نهجا حديثا وعلما جديدا من العلوم اللغوية، خاصة في مجال اللغة العربية. وقد طور هذا العلم في الفترة الأخيرة اعتمادًا على ما قدمته تقنية الحاسبات من دعمٍ لها في مجال معالجة اللغات الطبيعية آليًا. وقد سهلت هذه التقنيات تمثيل المدونات بطريقة تلائم البحث الآلي.
وهدف التدوين اللغوي ليس استخراج البيانات آليًا، ولكن دراسة وتحليل البيانات المستخرجة من المدونات مما يتطلب المعالجة الحاسوبية التي قد لا نستغني عنها أحيانًا. إذن التدوين اللغوي هو دراسة للغة والظواهر اللغوية مبنية على المدونات الآلية، وهو يختلف عن الدراسات التقليدية بتوفير قاعدة نصية هائلة من العالم الحقيقي والاستخدام الفعلي للغة. وفي حقيقة الأمر أن القدامى قد قاموا بعمل مدوناتهم الشخصية الورقية من العالم الحقيقي والاستخدام الفعلي للغة. وجمعوا بياناتهم على كروت ورقية صنفت كيفما تراءى لهم من مناهج إلا أن ذلك كله كان محدودا بالجهد والطاقات البشرية. ومن ثم فإن البحث الذي كان يحتاج لعشرات السنين لعمله أصبح من الممكن عمله في وقت قصير. وتتفوق الطرق التي تستخدم البحث الحاسوبي على الطرق التقليدية في السرعة، وتقليل الجهد، والدقة، والشمول.
و التدوين اللغوي هو دراسة اللغة كما تمثلها عينة من النصوص الحياتية الحقيقية "real world" على كافَّة المستويات (الصوت، والبنية، والتركيب، والدلالة، والمُعجَم، والجوانب البراجماتية...). والتدوين اللغوي ليس مجرد استخراج بيانات لغوية بمساعدة الحاسب ولكنها تحليل لهذه البيانات. تقول لطيفة: إن المدونات اللغوية ليست علما مستقلاً من علوم اللغة[4] بل هي طريقة لدراسة اللغة. ونقول: إنها مصدر لدراسة اللغة تختلف الآليات المعالجة له.
ولكي نطلق على مجموعة من النصوص "مُدَوَّنة لغوية" فيجب أن تخضع مادَّة المُدَوَّنة اللُّغَوِيَّة لمجموعة من الأسُس والمعايير، فهي ليست نصوصًا مجموعة بطريقة عشوائية؛ بالرغم من إنها كتلة غير منتظمةٍ من النُّصوص. هذه الأسُس والمعايير، يُحَدِّدها الهدف المنشود من المُدَوَّنة اللُّغَوِيَّة؛ فالمُدَوَّنة التي يُعتَمَد عليها في صَناعة مُعجَمٍ لُغَويٍّ، ستختلف مادَّتُها عن تلك المُستَخدَمةِ في حَصر مجموعة من الأنماط التركيبية أو البِنَوِيَّة للُّغة، كما تختلف مادَّة المُدَوَّنة المُستخدَمة في صَناعة مُعجَمٍ تكراريّ عن تلك التي يُعتَمَد عليها في صَناعة المَعاجم التاريخية. كذلك.. فإنَّ المُعالَجة الآليَّة للنُّصوص تتَّفِق وطبيعةَ المُدَوَّنة؛ فالبرامج الحاسوبيَّة المُستَخدَمة، وطريقة مُعالَجة النصوص، وطرائق إدارة قواعد البيانات، كلُّ هذا يخضَع لتلك الأسُس والمعايير التي يُحدِّدها هدف المُدَوَّنة اللُّغَوِيَّة. وعلى الرغم من هذا كله فأنا أؤيد عمل مُدَوَّنة تغطي جميع الأغراض السابقة أو بعبارة أخري فإن المُدَوَّنة الممثلة للغة يجب أن تصلح لجميع الأغراض.
وظل الحديث هنا قاصرًا على المدونات النصية باللغة العربية التي تعاني تقلصًا هائلاً نسبة لنظائرها في اللغة الإنجليزية. ولا ننكر جهود الباحثين المخلصين في هذا المجال مثل لطيفة [4] التي سعت لجمع مدونه نصية هائلة ومتنوعة لسد حاجة اللغويين في هذا المجال إلا أن عملها ظل محدودا بالوقت المخصص للبحث وبالجهد الفردي أيضًًا.
واستغلال الحاسب في التطبيقات اللغوية على المدونات النصية غيَّرَ من كفاءة ونوعية الأبحاث التي كانت تعتمد على دراسة التراكيب اللغوية وأصبحت الآن تعتمد على الاستعمال اللغوي والتطبيق الفعلي. فباستخدام اللغة الحية، أي اللغة من الواقع اللغوي –المستخدمة عمليا في الحياة اليومية - في التحليل نحُصل على أكبرِ قَدْرٍ من الاستعمالات اللُّغَوِيَّة للمُفردات والتَّراكيب العربيَّة بينَ أهلِها، وَهذا بدوره يخدِم جانِبَ الاستعمال اللُّغَوِيّ Pragmatics الَّذي يتجاهله كثيرٌ مِن صُنَّاعِ المُدَوَّنات اللُّغَوِيَّة مُكتَفِينَ في تحلِيلِهم اللُّغَوِيّ للنُّصُوص بجوانِب التَّحلِيل البِنَوِيّ والتَّركيبيّ، وإن وُجِدَ الجانب البرجماتي فهو مرتبط بخبرتهم الخاصة، أو بما استطاعوا تحليله بالجهد البشري فقط. وقد وجد كثير من الأخطاء المعجمية والصرفية والنحوية والتركيبية والدلالية الشائعة في الاستخدام في هذه المدونات. وهذه الأعمال كانت استكمالاً لأعمال كثير من اللغويين مثل فاروق شوشة –برنامج قل ولا تقل- ومثل د/ محمد حسن الأخطاء اللغوية في الصحافة المعاصرة [5]. وقد لجأ هؤلاء جميعا للجهد البشري الخالص بالرغم من جودة النتائج.
آخر مواضيعي
  رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 3 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها


1.المجالات ذات العلاقة: وهناك العديد من الأبحاث ذات الصلة. ولمزيد من المعلومات، راجع المصدر التالي :
http://www.essex.ac.uk/linguistics/clmt/w3c/corpus_ling/*******/corpora/
ونذكر منها المجالات في أدناه:
علم اللغة الحاسوبي Computational Linguistics
الدراسات الثقافية Cultural Studies
تحليل الحديث والبرجماتية (الفائداتية) Discourse Analysis and Pragmatics
النحو والقواعد Grammar/Syntax
علم اللغة التاريخي Historical Linguistics
اكتساب اللغة Language Acquisition
تدريس اللغات Language Teaching
التنوع اللغوي Language Variation
علم المعاجم Lexicography
علم اللغة Linguistics
الترجمة الآلية Machine Translation
معالجة اللغات الطبيعية Natural Language Processing (NLP)
علم اللغة النفسي Psycholinguistics
علم الدلالة Semantics
علم اللغة الاجتماعي Sociolinguistics
الكلام Speech
علم الأسلوب Stylistics
2.أنواع المتون النصية:
1)من حيث التحليل اللغوي:
1-متون نصية خام "Raw corpus":يقصد بها مجموعات كبيرة وشاملة من النصوص متوفرة إلكترونيا جمعت دون ترتيب أو منهجية.
2-متون نصية معلَّمة "Annotated corpus": مجموعات كبيرة وشاملة من النصوص محللة تحليلًا لغويًا بأية صورة من الصور أو على أي مستوى من المستويات اللغوية. وهذا التحليل تم يدويا عن طريق متخصصين لغويين.
3-المدونات النصية أو المتون النصية المرمزة "Tagged corpus": – مجموعات كبيرة وشاملة من النصوص محللة تحليلًا لغويًا على مستوى أجزاء الكلام POS. وهذا التحليل تم إما يدويًا أو آليًا أو نصف آلي.
2)من حيث آلية البحث:
ويقصد بها طريقة استرجاع ما نبحث عنه من مفردات أو مركبات أو حتى جمل عن طريق:
1.مطابقة القالب الشكلي template/ pattern keyword ونصوص المتن. وفى نفس الوقت تقوم آلية الاسترجاع بعد تكرار هذا القالب في المتن وعرض الأجزاء النصية الَّتي يوجد بها بعدد كلمات تحدد من قبل المستخدم فبل وبعد القالب المطلوب.
2.البحث الصرفي: وهو البحث عن كل جذور الكلمات موضوع البحث بجميع المشتقات. وهذا النوع مازال يعاني قصورًا شديدا إذ إنه يحتاج لقاعدة صرفية كبيرة. وكاتبة البحث تشرف على عمل آلية توفر هذا النوع من البحث ولها نتائج طيبة.
3.البحث الصرفي الدلالي وهو نفس البحث السابق لكن بتحديد معنى واحد من جميع المعاني المتاحة للكلمة. البحث السابق غطي هذه النقطة بالربط بين الكلمات المصاحبة والكلمة اللبسية.
وعلى هذا تنقسم آلية البحث على المدونات والمتون إلى :
متون نصية ذات واجهة بحثية فقط وأخرى ذات واجهة بحثية إحصائية وتنقسم إلى:
1.آلية بحث نصية ذات واجهة إحصائية قالبية:
هذه الآلية غالبا ما تكون مصممة من أجل اللغة الإنجليزية أو مماثلة لما صمم من أجل اللغة الإنجليزية وتعمل عن طريق مطابقة القالب الشكلي template/- pattern/ keyword. أي أنها ليست مدعمة بأي قاعدة لغوية وإنما تقوم على التطابق الشكلي في آلية البحث. ومع تطور الحاسبات تطورت استخدامات المتون ودعمت كل الأعمال في جميع المجالات ومن أشهر وأهم وأنفع آليات البحث هي آلية البحث على الشبكات - Yahoo , Google, … - الَّتي تمد العاملين في جميع المجالات بمطلبهم من أحدث المعلومات والمعارف– ساعة حدوثها أحيانًا- بأقصى سرعة.
2.آلية بحث نصية ذات واجهة إحصائية وآلية تحليل صرفي:
وتختص بالبحث الصرفي وهو البحث عن كل جذور الكلمة موضوع البحث بجميع المشتقات. هذه الآلية مصممة من أجل اللغة العربية فقط لتميزها بخاصية الاشتقاق. وتشمل نفس التطبيق في المتون ذات الواجهة إحصائية بالإضافة لمولد صرفي يولد جميع الكلمات الممكنة من جذر القالب المطلوب البحث عنه يبحث عنها أيضا. وقد يتميز الإحصاء هنا بحساب مجموع التكرارات الكلية للمشتقات وتكرار كل مشتقة على حدة لتحديد أي المشتقات أكثر استخدما فالأقل ثم الأقل. وتعمل عن طريق مطابقة القالب الشكلي للمشتقات دون أي علاقة للمعنى. وغالبا ما تقيد بمنتج لغوي محدد. انظر أي آلية بحث مع برنامج بحثي مثل برامج البحث في القران الكريم.
3.آلية البحث نصية ذات واجهة إحصائية وآلية تحليل صرفي وقاعدة بيانات معجمية دلالية:
هذه الآلية مصممة من أجل اللغة العربية أيضا وتشمل نفس التطبيق في المتون النصية ذات واجهة إحصائية وآلية تحليل صرفي بالإضافة لقاعدة بيانات معجمية دلالية حيث يخزن مع كل مشتقة معلوماتها المعجمية وقيودها الدلالية. وكذلك برامج شركة صخر وغيرها.
3)من حيث اللغة( وحيدة اللغة وثنائية اللغة ومتعددة اللغات):
a)النص في المُدَوَّنة وحيدة اللغة monolingual corpus وهو نص مكتوب بلغة واحدة فقط. انظر جدول (1).
b)النص في المُدَوَّنة ثنائية اللغة Bilingual corpus وهو نص مكتوب بلغتين إحداهما اللغة المصدر والأخرى اللغة الهدف.
c)النص في المُدَوَّنة متعددة اللغات Multilingual corpus or Parallel Corpora وهو نص مكتوب بلغات متعددة بحيث يتم عمل تنظير بين الجمل المتقابلة في كل اللغات. وهى مثل المُدَوَّنة متعددة اللغات المشار إليها في جدول (1). وهي مُدَوَّنة مكتوبة وحجمها 107 مليون كلمة تمثل العربية في مليون كلمة منها. وهناك المُدَوَّنة المتوازية ع/ا التي طورت بجامعة الكويت وهي عبارة عن 3 مليون كلمة والغرض منها تدريس الترجمة.
4)من حيث التطبيق اللغوي والعلاقة بين اللغات في المُدَوَّنة متعددة اللغات
هل هدفها التناظر كالمدونات المتوازية Parallel corpora أم المقابلة كالمدونات المتقابلة Comparable Corpus
5)من حيث العموم:
تمتعمليةتصنيفالمدوناتمنذالتسعينيات،والآنيوجدالعديدمنهذهالأنواع:
· المدوناتالعامةGeneral Corpora ، وهى متعددة الأغراض كمُدَوَّنة براون التي استُخدِمَت – ولا تزال – لأغراضٍ مُتَعدِّدة، كَصَنَاعة المَعاجم وتصميم برامج مُعالَجة النُّصوص، بالإضافة إلى استخدامها لأغراض تعليميَّة.
· المدونات الخاصة.Specialized Corpora وتُستَخدَم لِغَرَضٍ مُعَيَّن. كمُدَوَّنة كوبيلد الَّتي تُستَخدَم لصَناعة المَعاجِم التَّعليميَّة. (وكثيرٌ مِن صُنَّاع المَعاجم المُتَخَصِّصَة يستخدِمون مُدَوَّناتِهم لأغراض أخرى) كتحديد المتصاحبات، أو التعبيرات الاصطلاحية، وغيرها... وفي المُدَوَّنة اللغوية Sublanguage Corpora تجمع وتختار المُدَوَّنة طبقا لموضوع محدد: طبي، أو أدبي، أو جغرافي، ...
آخر مواضيعي
  رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 4 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

5) من حيث نوعية النص/ المادة النصية:

· مدونات اللغة المكتوبة Written Corpora .

· ومدونات اللغة المنطوقةSpoken Corpora مثل مدونات البرامج الإذاعية أو المكالمات التليفونية باللغة العربية والمستخدمة بحامعة بنسلفانيا [5] Pennsylvania. توجَد المادَّة المنطوقة على إحدى صورَتَين:

- الأولى: مادَّة صوتِيَّة مُسَجَّلة غير مكتوبة، ويكثر استخدامها لغرض تعليم اللُّغات، كما في المُدَوَّنات المنطوقة لمؤسَّسة LDC.

- الأخرى: مادَّة منطوقة تمَّ تحويلها إلى مادَّة مكتوبة باستخدام المُحوِّلات الصَّوتِيَّة، ويكثُر استخدامها لِغَرَض صَناعة المَعاجم والدِّراسات النَّحوِيَّة، كما في المُدَوَّنات المنطوقة لِسِلسِلة Collins-COBUILD.

6) مدونات اللهجاتDialect Corpora مثل المدونات الخاصة بلهجة واحدة كمدونات اللهجة المصرية.

7) من حيث نوعية مستخدم المُدَوَّنة:

هل هي لاستخدام ابن اللغة native speaker أم متعلم اللغة learner. وهنا يرتبط تصميم المُدَوَّنة بهذا الفرق.

8) من أصل اللغة:

هل لغة المُدَوَّنة أصلية original أم تمت ترجمتها translations. ويجب التمييز بين النوعين هنا لتأثر لغة المُدَوَّنة المترجمة بأسلوب وطريقة ودقة الترجمة.

10) من حيث زمن اللغة

· مُدَوَّنة محددة بفترة زمنية محددة Synchronic Corpora كمُدَوَّنة العربية الفصحى (2004) بجامعة مانشستر، وهي محددة من الفترة قبل الإسلام حتى القرن الحادي عشر.

· مُدَوَّنة شاملة مختلفة الفترات Diachronic Corpora.

11) من حيث الإتاحة:

وقد أدي ظهور شبكات الاتصال إلى التمييز بين المدونات الرسميَّة – Standard Corpora وهي مدونات مصممة وفقًا لمبادئ خاصة- ومُدَوَّنة حرة Free Corpora مثل المتاحة على شبكات الاتصال والتي تضم نصوصًا لا نهاية لها.

12) من حيث تحشية المدونات:

سبق وأوضحنا أن هناك نوعين من المدونات:

1- مدونات خام :Raw Corpora وهي نصوص توجد على صورتها الخام ولم تتم أي إضافة لها ونسميها أيضا متونا نصية.

2- مدونات مزودة بمعلومات لغوية :Annotated Corpora ورغم شيوع استخدام المدونات الخام في الدراسات اللغوية، فإن هناك بعض القضايا اللغوية التي تتطلب استخدام النوع الآخر من المدونات والمزودة بمعلومات لغوية مختلفة ومتنوعة. وأحد أهم المزايا الأساسية لهذه المدونات أنها تحولت من صورتها الخام إلى صورة يتضح فيها شتى المعلومات اللغوية. وتسمى هذه المعلومات "تحشية". وهناك العديد من الأبحاث حول عملية التحشية ومبادئها وقواعدها.

13) من حيث المنتج:

1- مؤسسات أو هيئات Organization:

وهي خاصة بمشروعات تجارية وتمتاز بتوفر الدعم المادي والبحثي والحكومي أحيانًا مثل مدونات LDC [6].

2- أفراد أو مجموعات بحثية:

وهي التي ينتجها أفراد للمشاركة في مشروعات بحثية أول للحصول على درجات علمية مثل لطيفة[4].

5. تخزين المُدَوَّنة:

يوجد كثير من الصور الإلكترونية للنصوص لا تمكنا من التعامل معها تعاملا مباشرا سواء باستخدام برامج التحليل اللغوي أو المفهرسات الآلية، لذلك يجب تحويل هذه الصور جميعها إلى الصورة النصية plan text format مثل (Doc, Text, Rtf,..) حتى يسهل التعامل معها بأي مصحح نصي text editor. من هذه الصور:

§ صورة لغة الربط بين النصوص التشعبية (HTML): وهي من أشهر صور التعامل النصي مع شبكات الاتصالات؛ فهي لغة كتابة معظم صفحات الشبكة. وهي ليست لغة برمجة وإنما لغة وصفية لعرض محتويات المواقع والروابط الملحقة بها من خلال متصفحات إلكترونية. وهذه الصفحات بطبيعة الحال لا يمكن التعديل بأي صورة من الصور فيها كنوع من أنواع التأمين لكن يمكن نسخها لأي صورة نصية. وهي بطبيعة الحال رغم شهرتها ليس اللغة الوحيدة للتعامل مع صفحات الشبكات وإنما يوجد لغات أخرى مثل: Java , Active ,Home page وجميعها امتداد لHTML لذلك يمكن تحويلها لصورة نصية بسهولة.

§ صورة الوثيقة المحمولة (PDF): وهي من أعم وأهم صور تبادل النصوص بين الباحثين في جميع بلدان العالم من خلال شبكات الاتصال حيث تخضع لأغلب نظم التشغيل مثل: Microsoft, Linux. وهي متاحة للقراءة فقط من خلال Adobe Reader ولكن يمكن تحويلها من خلال برامج كثيرة لصورة نصية، مثل برنامج المحول المحترف PDF Converter Professional وهو متوفر على الموقع : www.ScanSoft.com. وغالبا ما تكون صورته رقمية طبق الأصل من النص الأصلي تحتفظ بجميع خواصه وسماته خاصة نصوص اللغة الإنجليزية، ولكنها لا تدعم كل الخطوط العربية والرموز وعلامات التشكيل والترقيم مما يسبب أخطاء أثناء تحويل النصوص العربية لذلك يجب مراجعتها قبل استخدامها.

§ الصورة النصية، وهي أسهل الصور في التعامل الحاسوبي وفي تحليل اللغات وغيرها من البرامج والتطبيقات.

أما في حالة المتون الصوتية فهي تحتاج نوعية خاصة من التعامل، وكذلك اللغات التي لا يمكن لجميع الحواسيب التعامل معها مثل الصينية واليابانية. ويفضل تخزين المتون في صورة قواعد بيانات يتم ربطها بالمعلومات الخاصة بها.

6. صور تصميم المدونات:

1- مجموعة من النصوص a text collection.

2- مجموعة معبرة عن اللغة من النصوص a representative text collection.

3- مجموعة معبرة عن اللغة وبنائية من النصوص a representative and structured text collection.

4- مجموعة معبرة عن اللغة وبنائية مرمزة من النصوص مقروءة آليًا a representative, structured and annotated text collection(in order to be machine readable)

7. استخدامات المدونات في معالجة اللغة قديما وحديثًا:

عملية تجميع النصوص لدراستها عملية قديمة وشاقة وتتطلب وقتا طويلًا، وقد كانت في حدود قدرات الباحثين البشرية قبل ظهور الحاسب الآلي. وقد كانت المدونات تُستخدم بصورة منتظمة تطورت إلى أحد فروع علم اللغويات المعني بدراسة المدونات .Corpus Linguistics وكانت المدونات الكبيرة تستخدم ليس فقط للتحقق من النظريات اللغوية الجديدة، ولكن أيضًا لإنتاج قواميس ومعاجم لغوية ومناهج لتعليم اللغات والقواعد، جميعها يعتمد عليها في بناء هذه المدونات. وفي العصر الحديث، بعد التطور الهائل والتقاء تكنولوجيا الحاسوب بالمتون النصية أصبحت المدونات اللغوية أساسا من أسس البحث اليوم. وقيمة المدونات ترجع لما تقدمه من شواهد لغوية تدعم البحوث اللغوية. وقد ظهرت أهميتها في علم اللغة الحاسوبي.Computational Linguistics ويعنى علم اللغة الحاسوبي بتطوير أدوات لتحليل المدونات لتطوير خوارزميات algorithms لمعالجة اللغات الطبيعية ولدراسة وتحليل اللغة بكافة صوره – صرفي؛ معجمي ؛ نحوي؛ دلالي ..- والظواهر اللغوية. تقول لطيفة [4] أن أول من استخدم المتون النصية باللغة الإنجليزية في التعليم هو لي عام 1997 [4]. وأصبح من السهل على المتعلم البحث عن المثل والتحقق من المعلومة من خلال المتون النصية. لمزيد من التفصيل انظر لطيفة[4]. وأهم ما نتطلع له هو إنشاء قاعدة بيانات نصية تخدم جميع مجالات الدراسة اللغوية باللغة العربية وتطبيقاتها ويمكن عن طريقها عمل برامج إحصائية.

1) المدونات والإحصاء اللغوي: الإحصاء اللغوي الذي يتم على المدونات يمكن أن يثري معالجة اللغات الطبيعية ومن بعض إسهاماته:

1-المستوى الصرفي:

- الإحصاء الصرفي وما يمكن أن يضيفه للقواعد الصرفية.

- التحليل والتوليد الصرفي الآلي.

- تصحيح الأخطاء الإملائية الناتجة عن الصرف.

- دعم التشكيل الآلي للنصوص.

2- المستوى النحوي:

- التحليل النحوي وتفكيك الجملة لعناصرها النحوية الأولية "مبتدأ، خبر، فعل، فاعل …".
- الإحصاء النحوي وما يمكن أن يضيفه للقواعد النحوية.
- التحليل والتوليد النحوي للنصوص.

- التشكيل الآلي للنصوص.

- تعليم النحو للصغار ولغير الناطقين بالعربية باستخدام الحاسوب.

3- المستوى الدلالي:

- الترجمة الآلية.

- الفهم الآلي للنصوص.

- دراسة تطور أساليب الكتابة من حيث الشكل والمضمون.

- دراسة الترابط النصي في النصوص الحديثة.

- تحديد المفردات الأكثر شيوعًا.

- تحديد المترادفات الأكثر شيوعًا، وكذلك الأضداد والمتضادات، وجميع الظواهر اللغوية الأخرى.

- دراسة مدى تأثير غياب حركات التشكل،وعلامات الترقيم على التحليل اللغوِيّ.

- تحديد مدى استخدام وتأثير المفردات والتراكيب العامية والأجنبية في اللغة.

- دراسة ومقارنة في النحو والأساليب بين اللغة العربية الأصلية واللغة المستخدمة اليوم وتحديد نواح التطور.

- تحديد أشكال الجمل والتراكيب والمفردات في الكتابات المعاصرة.

- تحديد الأساليب اللغوية في الكتابات المعاصرة.

- تحديد الأخطاء اللغوية الشائعة في الكتابات المعاصرة.

ومن ثم إقرار الصحيح منها ورفض الخطأ وتصحيحه بما يتناسب مع قواعد اللغة العربية وأساليبها الصحيحة، وعمل تصور للقواعد اللغوية يمكن الرجوع إليه من قبل جميع الكتاب،والمفكرين ومن ثم الرقي باللغة العربية.

- دراسة أساليب الكتابة للكتاب المعاصرين من حيث الشكل والمضمون. ويمكن أن يفيد الحاسوب في مجال النصوص الأدبية وأساليب الكتاب بتحليل أساليب الكتاب المعاصرين مثلًا، من حيث أطوال الجمل والمفردات والتراكيب النحوية واستخدامها للضمائر والعطف والظروف والجمل الاعتراضية والظواهر اللغوية وغيرها. ومن ثم إنتاج الوثائق النصية بأسلوب كاتب معين. كذلك يكمن عندها حصر وشرح هذه الأساليب للكتاب المبدعين في المدارس والجامعات لتوليد جيل ذو لغة جميلة.

- إنشاء معجم آلي يضم السمات اللغوية على جميع المستويات أنظر [5]. وهذا بدوره يؤدى إلى لسهولة فك اللبس انظر [7]. انظر [5] لماذا يجب أن نحل اللبس؟

- عمل عقول حاسوبية اصطناعية تحاكى القدرات البشرية لاستخدامها في تطبيقات شتى.

- تدعيم المعجم العربي بسمات وخصائص ودلالات جديدة. إثراء المعاجم العربية بالعلاقات والسمات [8].

- إمكانية تحليل النصوص آليًّا ومن ثم إعراب النصوص آليًّا والعودة إلى التشكيل تدريجيًّا.

- سهولة الترجمة.

- اختصار النصوص واستخلاص المعلومات من النص مثل .Information extraction or text mining.

- تصحيح الأخطاء (الصرفية – النحوية – الدلالية).

- الارتقاء بالأساليب التعليمية للغة العربية، وعرضها بشكل مفيد جذاب .

- تحليل النصوص الأدبية وحفظ سماتها ؛ مما يمكننا فيما بعد من توليد نصوص بالصياغة والأداء أنفسهما.

- قراءة الكتب آليًّّا، وعمل ملخصات لأهم النقاط بها .

- استعادة المعلومات عن طريق المحادثة باللغة الطبيعية مع الحاسوب ومع شبكات المعلومات.

- ترجمة الكتب والمقالات من وإلى جميع اللغات، والاستفادة منها وخدمة قضية التعريب.

- حصر دقيق لخصائص العلاقة بين اللغة العربية.

- إقامة نماذج حاسوبية لفهم الأداء الشامل لمنظومة اللغة العربية[9].

- تطبيق أساليب الذكاء الاصطناعي في تفهم اللغة العربية غير المشكولة .

2) استخدامات خاصة في مجال اللغويات:

تستخدم في دراسة النصوص:

1. مقارنة بين استخدامات الكلمة.

2. تحليل الكلمات.

3. تحليل تردد الكلمات.

4. إيجاد وتحليل الفقرات والتعبيرات الاصطلاحية.

عمل الفهارس وقوائم الكلمات
آخر مواضيعي
  رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 5 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

3) ومن أهم خصائص المُدَوَّنة في علم اللغويات الحديث أن تكون :
1. عينة ممثلة للغة
يعد تجميع المُدَوَّنة من أصعب مهام معالجة اللغات الطبيعية Natural Language Processing والغرض الأساسي من تجميع المدونات أن تمثل كافة الجوانب اللغوية للغة التي نتعامل معها. ومن ثم، لابد وأن تحتوي على نصوص لمختلف الكُتاب والأنواع كما سنوضح فيما بعد.
2. ذات حجم محدد
تتألف المُدَوَّنة من عدد من الكلمات يتم تحديد بداية له إن كانت ممتدة أو تحديده كله إن كانت ثابتة وذلك قبل البدء في مشروع إنشائها. ويمكن أن تكون المُدَوَّنة قابلة للزيادة أو لا. فمُدَوَّنة براون على سبيل المثال تحتوي على مليون كلمة .وذلك بخلاف المدونات الممتدة open-ended التي تسمح بالإضافة إليها بين الحين والأخر
كيف يحدد الحجم؟
من المتفق عليه صعوبة تحديد حجم المُدَوَّنة التي تمثل اللغة بكل مفرداتها وتراكيبها وظواهرها وأبنيتها.
ولا يمكن أن يزعم أحد أنه كوَّن مثل هذه المُدَوَّنة. أما بالنسبة لصغر حجم المُدَوَّنة فيعتمد على عاملين أساسين هما:
- تحقيق رغبات المستخدمين من استخراج البيانات المطلوبة.
- طريقتهم في دراسة البيانات.
وبالنسبة لكبر حجمها فأكبر مُدَوَّنة معروفة هي:
http://www.pandia.com/sew/383-web-size.html
3. يمكن التعامل معها إلكترونيا
أصبحت المدونات في عصرنا الحالي في صورة إلكترونية حيث يسهل البحث فيها وتعديلها والإضافة إليها. أي تكون هناك نسخة إلكترونية في صورة txt or html وغيرها.
4. لها مرجع موثق Authentic :
يجب أن تكون المُدَوَّنة موثقة بمراجع معروفة ومحفوظ فيها حقوق التأليف.
5. الإتاحة Accessing:
يجب أن تكون المُدَوَّنة متاحة لكافة الباحثين بحيث تكون الاختلافات في الدراسات البحثية غير راجع إلى اختلاف البيانات وإنما إلى اختلاف الفرضيات والنظريات في هذه الدراسات.
6. تم جمعها بقيود محددة تلائم الدراسة المطلوبة مثل : اللغة، اللهجة، المجال...
7. خواص أخرى
- الجودة : أصلية وليست عن ترجمة مثلاً.
- التوثيق : موثقة كل بياناتها معروفة.
- البساطة: نص بسيط بطريقة txt . مثلاً.
4) الاختلافات بين المدونات
أ‌- حجم المُدَوَّنة الحجم ما هو الحجم المطلوب للمُدَوَّنة؟
ب‌- نوعية النصوص بالمُدَوَّنة:
1- مكتوبة أم منطوقة.
2- النوعية الأسلوبية:
 الكتابي:
أولًا:كتابة إخبارية :-
صحافة:تحقيقات صحفية / مقالات / عروض - دين. مهارات،و هوايات.
كتب،و مجلات - مذكرات،و سير ذاتية. - كتابات متنوعة. - مواد متنوعة.
ثانيًا: كتابة روائية : روايات عامة.- روايات غامضة بوليسية. -خيال علمي. -روايات مغامرات. -روايات رومانسية. -فكاهة.
3- الفن"صحافة- مسرح-…"
4- العصر "حديث _ إسلامي _قديم… "
5- الأسلوب وشكل الكتابة "جمل قصيرة / طويلة …- أسلوب أدبي / متأدب..".
 المنطوقة: (برامج حوارِيَّة، برامج ثقافِيَّة، نشرات إخبارِيَّة ومواجِز أنباء، وأحاديثَ دِينيَّة).
ت‌- بيانات عامة
اسم المُدَوَّنة - بلد المُدَوَّنة - اسم المؤلف - جنس المؤلف - لغة المُدَوَّنة - لهجة المُدَوَّنة إن وجدت على مستوى الدولة والمحافظة إن اختلفت - مصادر المُدَوَّنة - سنة التجميع (بداية ونهاية)- مجال المُدَوَّنة (الرئيسي / الجزئي) - الفترة الزمنية للنصوص.
8. المدونات باللغة العربية

1) نبذة عن اللغة العربية:
يوجد أكثر من 550 مليون بشري يتحدثون العربية في العالم. وتعتبر اللغة العربية من اللغات الرسمية الأولى في أكثر من ثلاثين دولة. وبالرغم من ذلك لا يوجد متحدثين باللغة الفصحى سواء الكلاسيكية القديمة أو الحديثة فقط تدرس بالمدارس أو الكليات المتخصصة. ومتحدثو العربية يستخدمون اللهجات العربية جنبا إلى جنب مع اللغة المعاصرة. ويطلق بعض اللغويون لغة العقل على اللغة العربية المعاصرة ولغة القلب على اللهجات العربية المحلية. وتتأثر اللغة بعوامل شتى منها؛ أسلوب الحياة والبيئة والمستوى الاجتماعي والتعليم وربما الديني أيضًا كذلك تتأثر بنوع الإنسان سواء أكان ذكرا أم أنثى.
2) صور اللغة العربية Forms of Arabic:
1- اللغة التقليدية الأصلية Traditional Arabic Language: وهى لغة الجزيرة العربية قبل الإسلام ولغة القرآن الكريم.
2- اللغة العربية الفصيحة Modern Standard Arabic: وهى اللغة المستخدمة في كتب اللغة والآداب.
3- اللغة العامية : وهى لغة الكلام وهى تختلف من محافظة إلى أخرى على مستوى البلد ومن بلد عربي لآخر.
4- اللغة العربية الخليطة Modern Standard Arabic Hybrid : وهي خليط من اللغة العربية الفصحى واللغة العامية وهى لغة الإعلام والجرائد اليومية.
شروط اختيارنا مُدَوَّنة ممثلة للغة العربية/ كيف تكون المُدَوَّنة ممثلة للغة العربية:
من البديهي أن من أولى خطوات المنهج العلمي السليم هي خطوة تحديد المادة الَّتي تخضع للبحث والتحليل. وفى حالتنا كانت نصوص اللُّغة العربية المعاصرة هي مادة البحث. غير أن انتقاء مجموعة النصوص اللغوية المعبرة عن هذه اللُّغة المعاصرة ينبغي أن يخضع لمجموعة من المعايير.
3) بعض المعايير الزمانية والمكانية والنوعية نوجزها فيما يلي:
 التطور اللغوي ؛وإذا كانت العربية الفصيحة المعاصرة هي مادة البحث قد دخلها الكثير من التغييرات والتعديلات والإضافات الَّتي يعد بعضها تطورا للغة بينما يعد بعضها الآخر خطأ في استعمالها نظرا لخروجه عن بنياتها المنطقية، إذا كان الأمر كذلك فإن الجانب الوصفي من منهج التحليل وعدم الإغراق في النظرة المعيارية قد أفادا في معالجة مثل هذه الظواهر اللغوية الَّتي تعد خروجا عن الاستعمال المعهود للعربية، والَّتي شاعت في العربية المعاصرة لأسباب عديدة ليس هذا أوان مناقشتها ولكننا بصدد تحديدها وتوصيفها.
• ومن الناحية الزمنية؛ يتم تحديد مادة التحليل بانتمائها للغة العربية المعاصرة – وإذا كان التطور اللغوي أمر طبيعي ومطرد، وكذلك كانت اللغة؛ يتأثر كل جيل من مستعمليها بما يسبقه وما يليه من أجيال، فإن التأثير القوى يبقى الأقوى يبقى دائما للسياق اللغوي الأقرب تاريخيا وهو ما أتاح الامتداد في مادة التحليل زمنيا لمدة النصف الأخير من القرن الميلادي العشرين.
• ومن الناحية المكانية؛ لابد من عدم الاقتصار على كتابات من قطر عربي واحد ليتم إخضاعها للتحليل، فالسياق المكاني هو الآخر يلعب دورا في انتخاب أنماط قواعدية بعينها دون غيرها، كما أنه يضيف إلى المعجم بعض المفردات الَّتي يكثر استعمالها في قطر دون الآخر، مما يعمل على إضفاء طابع الشمول (النسبي) على النتائج المستخلصة من التحليل. ومن ناحية أخرى تتنوع اللهجات في البلد الواحد. وهناك العديد من النصوص المعاصرة تضم كتابات بلهجات عربية مختلفة. وهذه اللهجات تختلف على مستوى البلد الواحد حيث تضم جمهورية مصر العربية وحدها أكثر من خمس لهجات (الريفية – السواحلية – البدوية – الصعيدية - المدنية). وهذه اللهجات بدورها تتأثر بالمستوى الاجتماعي والثقافي والسني للأفراد المستخدمين لها. كما تختلف هذه اللهجة في كتابتها حيث أنها لا تخضع لقواعد معينة. لذلك لم تراعى هذه النوعية في النصوص المختارة للتحليل.
• ومن الناحية النوعية الأسلوبية؛ لابد من عدم الاقتصار على أعمال كاتب بعينه، وذلك حتى لا يقع العمل في شرك الأسلوب "الشخصي" للكاتب، ويؤثر ذلك بالتالي على نتائج التحليل الَّتي ينبغي أن تتسم بالموضوعية والشمول قدر الإمكان.
ومن الناحية النوعية النصية؛ عدم اقتصار مادة التحليل على جنس كتابي دون آخر، وإنما توزعت على عدد من هذه الأجناس الَّتي تتنوع بينها الأساليب اللغوية وأدوات التعبير اللغوِيّ وهو ما يصب في النهاية في دائرة من المنهجية والشمولية الَّتي تضمن المزيد من الدقة لنتائج البحث.
آخر مواضيعي
  رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 6 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

وجود نفس المعنى، وأنما معاني متقاربة أو متشابهة.
التعليق النهائي Conclusion
 المُدَوَّنة كلمة تعود على كمّ هائل من النصوص الإلكترونية المكتوبة أو المنطوقة . وذلك يُسَهِّل التعاملَ معها والاستفادة منها على عكس المدونات الورقية.
 تعود أهمية المُدَوَّنة إلى ما تمدنا به من معلومات متعددة لغوية أو غير لغوية.
 هناك أنواع عديدة من المدونات تبعا لمقاييس كثيرة كما سبق وأوضحنا.
 يجب وضع قواعد للتحقق من شمولية المُدَوَّنة للأعراض التي صنعت من أجلها وهذا دور صُناعها.
 يمكن أن تكون المُدَوَّنة بلا حدود أو أبعاد.
 يوجد العديد من المدونات العربية والإنجليزية والآليات التي تساعد في بناء المدونات متوفرة على الشبكات.
 اللغة العربية مازال أمامها طريق طويلة لاستكشاف مكنوناتها.


المراجع:
[1] (The Oxford Companion to the English Language, ed. McArthur & McArthur, 1992)
[2] David Crystal, A Dictionary of Linguistics and Phonetics, Blackwell, 3rd Edition, 1991
[3] John Sinclair, "Developing Linguistic Corpora: a Guide to Good Practice" ,http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm, 2004.
[4] Latifa Al-Sulaiti ,“Arabic corpora”,
http://www.comp.leeds.ac.uk/eric/latifa/arabic_corpora.htm
[5] محمد حسن، " الأخطاء الشائعة في الصحافة المعاصرة"، رسالة للحصول على درجة الدكتوراه في الفلسفة : كلية دار العلوم بالقاهرة، 1975.
[6] LDC Website,
http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2002L49, 2006.
[7] S. Hamada," Forms Of Ambiguity In Natural Languages, and its Disambiguation”, The 4th ACS/IEEE International Conference on Computer Systems and Applications in Dubai/ Sharjah, UAE (AICCSA-2006), AUE, March, 2006.
[8] S. Hamada, "Enrichment lexical Knowledge with interword based features", IEEE International Conference on Systems, Man and Cybernetic, Tunisia, October, 2002.
[9] د. نبيل علي، "اللغة العربية والحاسوب" مكتبة الأسرة، القاهرة، 2002.
آخر مواضيعي
  رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 7 )
@ بن سلمان @
ثمالي نشيط

الصورة الرمزية @ بن سلمان @

الملف الشخصي
رقــم العضويـــة : 156
تـاريخ التسجيـل : 01-10-2005
الـــــدولـــــــــــة :
المشاركـــــــات : 14,724
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : @ بن سلمان @ مبدع


@ بن سلمان @ غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

يعطيك العافية أبا ماجد
موضوع ماتع
اقتباس:
1- اللغة التقليدية الأصلية Traditional Arabic Language: وهى لغة الجزيرة العربية قبل الإسلام ولغة القرآن الكريم.
2- اللغة العربية الفصيحة Modern Standard Arabic: وهى اللغة المستخدمة في كتب اللغة والآداب.
قال سبحانه وتعالى: (إنا أنزلناه قرأنا عربياً) . يوسف 2
قال الطبري: إنا أنزلنا هذا الكتاب المبين، قرآناً عربياً على العرب، لأن لسانهم و كلامهم عربي، فأنزلنا هذا الكتاب بلسانهم ليعقلوه و يفقهوا فيه، و ذلك قوله: ]لَعَلَّكُمْ تَعْقِلُونَ / جامع البيان للطبري .
و قال ابن كثير: و ذلك لأن لغة العرب أفصح اللغات و أبينها وأوسعها، و أكثرها تأدية للمعاني التي تقوم بالنفوس، فلهذا أنزل أشرف الكتب بأشرف اللغات، على أشرف الرسل، بسفارة أشرف الملائكة، و كان ذلك في أشرف بقاع الأرض، و ابتُدئ إنزاله في أشرف شهور السنة وهو «رمضان»، فكمل من كل الوجوه / تفسير القرآن العظيم (2/466

وقوله تعالى : (قرأنا عربياً غير ذي عوج). الزمر 20


و قال البخاري في صحيحه: كتاب فضائل القرآن: باب نزَل القرآن بلسان قريش و العَرب ]قُرْآنًا عَرَبِيًّا[ ، ]بِلِسَانٍ عَرَبِيٍّ مُّبِينٍ [. ثم روى بسنده عن الزهري قال: و أخبرني أنس بن مالك قال: فأمر عثمانُ زيدَ بن ثابت و سعيد بن العاص و عبد الله بن الزبير وعبدالرحمن بن الحارث بن هشام أن ينسخوها في المصاحف، و قال لهم: إذا اختلفتم أنتم و زيدُ بن ثابت في عربيَّةٍ من عربيَّة القرآن، فاكتبوها بلسان قريش، فإنَّ القرآن أُنزل بلسانهم ففعلوا»-الفتح (9/8-9).
آخر مواضيعي
  رد مع اقتباس
قديم 08-18-2008   رقم المشاركة : ( 8 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

ابن سلمان سلمت اناملك على الإضافة القيمة
بارك الله فيك وجزاك خير الجزاء وجمعنا ووالدينا في الفردوس الأعلى
آخر مواضيعي
  رد مع اقتباس
قديم 08-20-2008   رقم المشاركة : ( 9 )
مناهل
ذهبي مشارك

الصورة الرمزية مناهل

الملف الشخصي
رقــم العضويـــة : 2376
تـاريخ التسجيـل : 22-03-2008
الـــــدولـــــــــــة :
المشاركـــــــات : 1,623
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 290
قوة التـرشيــــح : مناهل تميز فوق العادةمناهل تميز فوق العادةمناهل تميز فوق العادة


مناهل غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

بارك الله فيكم , و جزاكم خير الجزاء .
آخر مواضيعي
  رد مع اقتباس
قديم 08-20-2008   رقم المشاركة : ( 10 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

مناهل
ولك بمثل مادعوت وزيادة أن يرزقك الجنة ويغفر لنا أجمعين
آخر مواضيعي
  رد مع اقتباس
إضافة رد

مواقع النشر


ضوابط المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code متاحة
كود [IMG] متاحة
كود HTML معطلة

الانتقال السريع

المواضيع المتشابهه
الموضوع كاتب الموضوع المنتدى الردود آخر مشاركة
الترادف في اللغة العربية مناهل اللغة العربية وعلومها 7 05-24-2011 07:33 PM
ترجم اي موقع بأي لغة الي اللغة العربية :- بَنتْ الأصَآيلْ منتدى الكمبيوتر والأنترنت 6 01-29-2007 01:43 PM
مجلة اللغة العربية ABO TURKI الديوان الأدبي 22 09-07-2006 11:37 PM
اللغة العربية ....!!!!! أبو عبيدة الــمـنـتـدى الـعـام 8 04-28-2006 04:14 PM


الساعة الآن 02:38 PM.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Trans by