عرض مشاركة واحدة
قديم 08-18-2008   رقم المشاركة : ( 5 )
alsewaidi
أبو ماجد

الصورة الرمزية alsewaidi

الملف الشخصي
رقــم العضويـــة : 585
تـاريخ التسجيـل : 05-08-2006
الـــــدولـــــــــــة :
المشاركـــــــات : 2,046
آخــر تواجــــــــد : ()
عدد الـــنقــــــاط : 20
قوة التـرشيــــح : alsewaidi مبدع


alsewaidi غير متواجد حالياً

افتراضي رد: المُدَوَّنات النَّصِّيَّة ودور اللغة العربية في التعامل معها

3) ومن أهم خصائص المُدَوَّنة في علم اللغويات الحديث أن تكون :
1. عينة ممثلة للغة
يعد تجميع المُدَوَّنة من أصعب مهام معالجة اللغات الطبيعية Natural Language Processing والغرض الأساسي من تجميع المدونات أن تمثل كافة الجوانب اللغوية للغة التي نتعامل معها. ومن ثم، لابد وأن تحتوي على نصوص لمختلف الكُتاب والأنواع كما سنوضح فيما بعد.
2. ذات حجم محدد
تتألف المُدَوَّنة من عدد من الكلمات يتم تحديد بداية له إن كانت ممتدة أو تحديده كله إن كانت ثابتة وذلك قبل البدء في مشروع إنشائها. ويمكن أن تكون المُدَوَّنة قابلة للزيادة أو لا. فمُدَوَّنة براون على سبيل المثال تحتوي على مليون كلمة .وذلك بخلاف المدونات الممتدة open-ended التي تسمح بالإضافة إليها بين الحين والأخر
كيف يحدد الحجم؟
من المتفق عليه صعوبة تحديد حجم المُدَوَّنة التي تمثل اللغة بكل مفرداتها وتراكيبها وظواهرها وأبنيتها.
ولا يمكن أن يزعم أحد أنه كوَّن مثل هذه المُدَوَّنة. أما بالنسبة لصغر حجم المُدَوَّنة فيعتمد على عاملين أساسين هما:
- تحقيق رغبات المستخدمين من استخراج البيانات المطلوبة.
- طريقتهم في دراسة البيانات.
وبالنسبة لكبر حجمها فأكبر مُدَوَّنة معروفة هي:
http://www.pandia.com/sew/383-web-size.html
3. يمكن التعامل معها إلكترونيا
أصبحت المدونات في عصرنا الحالي في صورة إلكترونية حيث يسهل البحث فيها وتعديلها والإضافة إليها. أي تكون هناك نسخة إلكترونية في صورة txt or html وغيرها.
4. لها مرجع موثق Authentic :
يجب أن تكون المُدَوَّنة موثقة بمراجع معروفة ومحفوظ فيها حقوق التأليف.
5. الإتاحة Accessing:
يجب أن تكون المُدَوَّنة متاحة لكافة الباحثين بحيث تكون الاختلافات في الدراسات البحثية غير راجع إلى اختلاف البيانات وإنما إلى اختلاف الفرضيات والنظريات في هذه الدراسات.
6. تم جمعها بقيود محددة تلائم الدراسة المطلوبة مثل : اللغة، اللهجة، المجال...
7. خواص أخرى
- الجودة : أصلية وليست عن ترجمة مثلاً.
- التوثيق : موثقة كل بياناتها معروفة.
- البساطة: نص بسيط بطريقة txt . مثلاً.
4) الاختلافات بين المدونات
أ‌- حجم المُدَوَّنة الحجم ما هو الحجم المطلوب للمُدَوَّنة؟
ب‌- نوعية النصوص بالمُدَوَّنة:
1- مكتوبة أم منطوقة.
2- النوعية الأسلوبية:
 الكتابي:
أولًا:كتابة إخبارية :-
صحافة:تحقيقات صحفية / مقالات / عروض - دين. مهارات،و هوايات.
كتب،و مجلات - مذكرات،و سير ذاتية. - كتابات متنوعة. - مواد متنوعة.
ثانيًا: كتابة روائية : روايات عامة.- روايات غامضة بوليسية. -خيال علمي. -روايات مغامرات. -روايات رومانسية. -فكاهة.
3- الفن"صحافة- مسرح-…"
4- العصر "حديث _ إسلامي _قديم… "
5- الأسلوب وشكل الكتابة "جمل قصيرة / طويلة …- أسلوب أدبي / متأدب..".
 المنطوقة: (برامج حوارِيَّة، برامج ثقافِيَّة، نشرات إخبارِيَّة ومواجِز أنباء، وأحاديثَ دِينيَّة).
ت‌- بيانات عامة
اسم المُدَوَّنة - بلد المُدَوَّنة - اسم المؤلف - جنس المؤلف - لغة المُدَوَّنة - لهجة المُدَوَّنة إن وجدت على مستوى الدولة والمحافظة إن اختلفت - مصادر المُدَوَّنة - سنة التجميع (بداية ونهاية)- مجال المُدَوَّنة (الرئيسي / الجزئي) - الفترة الزمنية للنصوص.
8. المدونات باللغة العربية

1) نبذة عن اللغة العربية:
يوجد أكثر من 550 مليون بشري يتحدثون العربية في العالم. وتعتبر اللغة العربية من اللغات الرسمية الأولى في أكثر من ثلاثين دولة. وبالرغم من ذلك لا يوجد متحدثين باللغة الفصحى سواء الكلاسيكية القديمة أو الحديثة فقط تدرس بالمدارس أو الكليات المتخصصة. ومتحدثو العربية يستخدمون اللهجات العربية جنبا إلى جنب مع اللغة المعاصرة. ويطلق بعض اللغويون لغة العقل على اللغة العربية المعاصرة ولغة القلب على اللهجات العربية المحلية. وتتأثر اللغة بعوامل شتى منها؛ أسلوب الحياة والبيئة والمستوى الاجتماعي والتعليم وربما الديني أيضًا كذلك تتأثر بنوع الإنسان سواء أكان ذكرا أم أنثى.
2) صور اللغة العربية Forms of Arabic:
1- اللغة التقليدية الأصلية Traditional Arabic Language: وهى لغة الجزيرة العربية قبل الإسلام ولغة القرآن الكريم.
2- اللغة العربية الفصيحة Modern Standard Arabic: وهى اللغة المستخدمة في كتب اللغة والآداب.
3- اللغة العامية : وهى لغة الكلام وهى تختلف من محافظة إلى أخرى على مستوى البلد ومن بلد عربي لآخر.
4- اللغة العربية الخليطة Modern Standard Arabic Hybrid : وهي خليط من اللغة العربية الفصحى واللغة العامية وهى لغة الإعلام والجرائد اليومية.
شروط اختيارنا مُدَوَّنة ممثلة للغة العربية/ كيف تكون المُدَوَّنة ممثلة للغة العربية:
من البديهي أن من أولى خطوات المنهج العلمي السليم هي خطوة تحديد المادة الَّتي تخضع للبحث والتحليل. وفى حالتنا كانت نصوص اللُّغة العربية المعاصرة هي مادة البحث. غير أن انتقاء مجموعة النصوص اللغوية المعبرة عن هذه اللُّغة المعاصرة ينبغي أن يخضع لمجموعة من المعايير.
3) بعض المعايير الزمانية والمكانية والنوعية نوجزها فيما يلي:
 التطور اللغوي ؛وإذا كانت العربية الفصيحة المعاصرة هي مادة البحث قد دخلها الكثير من التغييرات والتعديلات والإضافات الَّتي يعد بعضها تطورا للغة بينما يعد بعضها الآخر خطأ في استعمالها نظرا لخروجه عن بنياتها المنطقية، إذا كان الأمر كذلك فإن الجانب الوصفي من منهج التحليل وعدم الإغراق في النظرة المعيارية قد أفادا في معالجة مثل هذه الظواهر اللغوية الَّتي تعد خروجا عن الاستعمال المعهود للعربية، والَّتي شاعت في العربية المعاصرة لأسباب عديدة ليس هذا أوان مناقشتها ولكننا بصدد تحديدها وتوصيفها.
• ومن الناحية الزمنية؛ يتم تحديد مادة التحليل بانتمائها للغة العربية المعاصرة – وإذا كان التطور اللغوي أمر طبيعي ومطرد، وكذلك كانت اللغة؛ يتأثر كل جيل من مستعمليها بما يسبقه وما يليه من أجيال، فإن التأثير القوى يبقى الأقوى يبقى دائما للسياق اللغوي الأقرب تاريخيا وهو ما أتاح الامتداد في مادة التحليل زمنيا لمدة النصف الأخير من القرن الميلادي العشرين.
• ومن الناحية المكانية؛ لابد من عدم الاقتصار على كتابات من قطر عربي واحد ليتم إخضاعها للتحليل، فالسياق المكاني هو الآخر يلعب دورا في انتخاب أنماط قواعدية بعينها دون غيرها، كما أنه يضيف إلى المعجم بعض المفردات الَّتي يكثر استعمالها في قطر دون الآخر، مما يعمل على إضفاء طابع الشمول (النسبي) على النتائج المستخلصة من التحليل. ومن ناحية أخرى تتنوع اللهجات في البلد الواحد. وهناك العديد من النصوص المعاصرة تضم كتابات بلهجات عربية مختلفة. وهذه اللهجات تختلف على مستوى البلد الواحد حيث تضم جمهورية مصر العربية وحدها أكثر من خمس لهجات (الريفية – السواحلية – البدوية – الصعيدية - المدنية). وهذه اللهجات بدورها تتأثر بالمستوى الاجتماعي والثقافي والسني للأفراد المستخدمين لها. كما تختلف هذه اللهجة في كتابتها حيث أنها لا تخضع لقواعد معينة. لذلك لم تراعى هذه النوعية في النصوص المختارة للتحليل.
• ومن الناحية النوعية الأسلوبية؛ لابد من عدم الاقتصار على أعمال كاتب بعينه، وذلك حتى لا يقع العمل في شرك الأسلوب "الشخصي" للكاتب، ويؤثر ذلك بالتالي على نتائج التحليل الَّتي ينبغي أن تتسم بالموضوعية والشمول قدر الإمكان.
ومن الناحية النوعية النصية؛ عدم اقتصار مادة التحليل على جنس كتابي دون آخر، وإنما توزعت على عدد من هذه الأجناس الَّتي تتنوع بينها الأساليب اللغوية وأدوات التعبير اللغوِيّ وهو ما يصب في النهاية في دائرة من المنهجية والشمولية الَّتي تضمن المزيد من الدقة لنتائج البحث.
آخر مواضيعي
  رد مع اقتباس