تحليل تركيبة الكلمات في مجموعة نصوص Corpus قد يكون مفيداً لأخذ صورة عامة عن طبيعة وتركيبة هذه المجموعة. على سبيل المثال، قام روب داوسون بتحليل تركيبة أشهر 100,000 كلمة في كتب قوقل الإنجليزية. كانت نتيجة هذا التحليل هو هذا الرسم:
برنامج التحول الوطني بالرسوم البيانية
تم الإعلان يوم الإثنين الماضي عن برنامج التحول الوطني 2020. ومن الأشياء التي شدتني في وثيقة البرنامج هو الملحق المتعلق بالمبادرات التي سيبدأ إطلاقها ابتداءً من عام 2016 م. ذكرت المبادرات في الوثيقة على شكل جداول مليئة بالأرقام. سأقوم هنا بمحاولة تحويل بعض هذه البيانات إلى رسوم.
تحليل: أسعار قطع الأراضي في المملكة
في هذه التدوينة، حاولت الإجابة على سؤال بسيط: كم سعر قطع الأراضي في كل حي سكني؟ قمتُ بجمع بيانات الصفقات السكنية لقطع الأراضي في الفترة من شهر محرم 1436 هـ حتى شهر جمادى الآخر 1437 هـ. كل ما عليك هو اختيار المنطقة والمدينة والحي، وستعرف عدد الصفقات التي تمت في الحي خلال هذه الفترة، ومتوسط سعر المتر المربع.
كيف نكتب “محمد” بالإنجليزية؟
عملية النقل الكتابي للأسماء العربية بالحرف الروماني (اختصاراً: الرومَنة) عملية معقدة بعض الشيء. يقول لورنس العرب في كتابه أعمدة الحكمة السبعة:
لا يمكن نقل الأسماء العربية إلى الإنجليزية نقلا دقيقا، بسبب صوامتها
التي تختلف عن صوامتنا، وصوائتها التي كصوائتنا تختلف من مكان إلى آخر.
وحتى تعرف مدى صحة هذه العبارة، كتب لورنس مدينة جدة في كتابه هذا بثلاث طرق: Jeddah ، Jidda ، Jedda . هذا هو أحد الأسباب في اختلاف الرسم الكتابي للأسماء العربية بالحرف الروماني. النظام الصوتي للغة العربية يختلف عن النظام الإنجليزي. أيضاً، الأسماء المركبة (مثل عبد الله و أبو سليمان) تزيد من صعوبة الرومَنة. وهناك عوامل أخرى يمكنك القراءة عنها هنا.