![]() |
الحرف العربي والحوسبة
الحرف العربي والحوسبة
الموسم الثقافي لمجمع اللغة العربية عمان – الأردن مقدمة: اللغة العربية أم اللغات السامية. والآثار المكتشفة عن الكتابة العربية لا تعود إلا لفترات متأخرة من تأريخ اللغة العربية. فاللغة العربية أساسا لغة متوارثة نطقا قبل أن تتوارث كتابة. وما يعنينا في هذه المحاضرة هو الحرف العربي بشكلية المنطوق والمكتوب وعلاقتهما بالحوسبة . وحيث أن حقل الحوسبة الذي يتعامل مع اللغات الطبيعية يدعى بالذكاء الإصطناعي فلا بد من إعطاء مقدمة عن هذا الحقل وتقدمه في العقود الأخيرة وما ينتظره من تطورات في المستقبل. إن أهمية معالجة اللغة العربية بالحاسوب لم يعد أمر رفاه أو أمرا ثانويا ، بل هو أمر في غاية الأهمية وعليه يعتمد مستقبل اللغة ومكانة العرب في الحضارة الحالية بل ومستقبلهم الإقتصادي والعلمي. الذكاء الإصطناعي بعد فترة وجيزة من إختراع الحواسيب ، تبين أن بإمكان الحاسوب القيام بعمليات غير الحسابات الرياضية. وأن السرعة التي يقوم بها الحاسب بعملياته يمكن إستعمالها في الكثير من المهام غير الرياضية البحتة. فقد تبين إن هناك إمكانية لإتخاذ القرارات وأن هناك إمكانية لتمييز الأنماط و أن هناك إمكانية للتعرف على الصور. وقد تكونت حقول جديدة تقع تحت مظلة الذكاء الإصطناعي كان من أهمها حقل معالجة اللغات الطبيعية. وقد تطور هذا الحقل ليشمل العديد من جوانب معالجة اللغات الطبيعية من نواحي الكتابة وتصحيح الإملاء والقواعد النحوية والصرف والمعاني والترجمة بل وحتى البلاغة والشعر. أما حقل التعرف على الأشكال والصور والنماذج فقد دخل في تطبيقات عديدة مثل التعرف على المواقع والتطبيقات العسكرية والتنقيب عن المعادن والإبحار في المحيطات وسفن الفضاء وغير ذلك. وما التعرف على الكتابة سوى واحد من هذه التطبيقات. ومن الجوانب الأخرى للذكاء الإصطناعي النظم الخبيرة التي تستخدم في معالجة المرضى وإصلاح الأعطال والتحكم الآلي وغيرها بعض الوسائل الحديثة في الذكاء الأصطناعي المنطق الظني (Fuzzy Logic ) يعيب الكثيرون على الحاسوب أنه يتعامل مع الأرقام بدقة هائلة بينما الحياة ليست كذلك . فأنت تقول الجو حار وقد يعني ذلك 30 درجة مئوية في عمان أما في دبي فحينما تقول الجو حار فلا يعني ذلك أقل من 40 درجة مئوية. ويعني ذلك أن لفظة حار نسبية وقد تعني هنا ما لا تعنيه هناك. ومثل ذلك كلمات مستعملة بكثرة في اللغة مثل طويل وقصير وثقيل وبعيد وما يشبهها . هذا بالإضافة إلى كلمات أخرى تضاف إلى مثل هذه الكلمات مثل "ما يقرب من" و"جدا " وغير ذلك من الإضافات. وهكذا وجد حقل جديد للتعامل مع الألفاظ اللغوية العادية بحيث يفهمها الحاسوب ويحسن التعامل معها كما يتعامل معها الإنسان مثال ذلك : إذا كان هناك مدَّة طويلة بين حرفين فعلى الغالب هي حرف سين وسطية إذا كان هناك حرف سين بثلاث ركزات وفوقه نقطة واحدة فربما هو حرف شين والثلاث نقط قد تجمعت بنقطة واحدة هذه القواعد ليست صارمة بحيث يمكن التعامل معه بالطرائق الرياضية التقليدية بل يجب أن تعامل وفق منطق الإحتمالات والمنطق الظني الشبكات العصبية ( Neural Networks) لقد تعلم الإنسان من خلقته التي خلقه الله عليها . فالشبكات العصبية في دماغ الإنسان وفي جسمه تعمل بطريقة غاية في الدقة والتعقيد. فقد وجد أن المعلومات لا تخزن في دماغ الإنسان في موقع معين بل تتوزع على خلايا عصبية عديدة وعندما يحاول المرء تذكر أمر ما فإنه يجمع هذه المعلومات من شتاتها. وهكذا إستطاع الإنسان أن يحاكي ذلك فيستعمل شبكات عصبية إصطناعية داخل برامج الحاسوب تقوم بحل مسائل عديدة خاصة ما يحتاج منها إلى تمرين وتعلم وإستفادة من الماضي . مثال ذلك إستعمال الشبكات العصبية في قواعد حروف الجر في اللغة العربية(1). الخوارزميات الجينية (Genetic Algorithms ) تعلم الإنسان مما يحدث في الكون من تطور وتغير دائم وحركة دائمة نحو السمو والكمال في كل شيئ والخالق جل شأنه خلق كل شيء فأحسن خلقه. وبمحاكاة ذلك أمكن إيجاد وسائل رياضية تحاول الوصول إلى حلول مسائل متعددة في الحياة العملية ومنها ما يتعلق باللغات الطبيعية وهي حقل جديد بدأ الدخول مؤخرا في معالجة اللغات الطبيعية. ترميز الحرف العربي على الحاسوب مر ترميز الحرف العربي على الحاسوب بمراحل عديدة كان آخرها ظهور الرمز العالمي الموحد (unicode) . ولمعرفة تفاصيل ذلك يمكن الرجوع إلى محاضرة المؤلف "الحروف العربية والحاسوب " التي ألقيت في الموسم الثقافي الرابع عشر للمجمع عام 1996 (2) بدأ مشروع الرمز العالمي الموحد وذلك عام 1988 لمعالجة التداخل بين اللغات المختلفة ومشكلة استعمال الرمز نفسه من قبل أكثر من لغة واحدة. فعند إدخال وثيقة تعمل بلغتين كانت الرموز قبل الرمز العالمي الموحد تؤدي إلى غموض وتداخل بين الرموز. وقد أقر استعمال الرمز العالمي الموحد عام 1991 وقد امتاز الرمز العالمي الموحد بمزايا منها الحسن ومنها السيئ ، فمثلا تم استعمال 16 رمزا ثنائيا أي ضعف عدد الرموز الذي كان مستعملا قبل ذلك وبذلك أصبح الحيز الذي يشغله النص المكتوب بهذا الرمز ضعف ما كان عليه سابقا. خصصت مواقع للرموز وليس لأشكال الحروف كما أن الرموز كانت للنصوص العادية دون أية إضافة كنوع الخط أو إضافة خط تحت الحرف وغير ذلك وقد استعمل الرمز نفسه للحرف الذي يظهر في أكثر من لغة فحرف الباء بالعربية له الرمز نفسه لحرف الباء بالفارسية أو الأوردية كما أن هذا الترميز يستطيع قبول التشكيل بما يناسب اللغة العربية ولكن رمز الحرف المشكول سيكون مضاعفا أي مكونا من رمز الحرف ورمز حركة التشكيل. وعلى هذا لم يخلُ هذا الترميز من مساوئ. أهم تلك المساوئ هو الكفاءة فهو كما ذكرنا يحتاج ضعف حجم طرائق الترميز السابقة كما أن استعمال الرمز نفسه للُّغات ذات الأبجديات المتداخلة قد يؤدي إلى التباس بين اللغات فربما كان هناك مجموعة حروف تعطي كلمة ذات معاني مختلفة بين لغتين مثل العربية والفارسية. فقد ترد الكلمة ويراد ترجمتها إلى الإنجليزية وليس هناك ما يشير هل أن الكلمة مراد ترجمتها من العربية أم من الفارسية كما أن مجموعات الحروف المشتركة قد وضعت بشكل لا يخدم كل اللغات بوقت واحد مما يتسبب في صعوبات في وضع تطبيقات لكل لغة على حدة وخاصة في ما يتعلق بالترتيب الأبجدي حيث لا يتوفر هذا الترتيب لكل اللغات المشتركة في الحروف الهجائية كما أن عمليات نقل المعلومات من الترميز القديم إلى هذا الترميز الموحد تعاني من مشاكل عديدة وكذلك من الترميز الموحد إلى الترميز القديم. يبين الشكلان (1) و (2) جدولين بمواقع الحروف العربية أو حروف اللغات القريبة من العربية في جدول الرمز العالمي الموحد. وهذان الشكلان هما صيغتان معدلتان عام 1996 عما سبق أن صدر عام 1991.(2) الترميز المتعدد في ضوء القصور الذي يعاني منه الرمز الموحد برزت هناك حاجة إلى رمز يعتمد على اللغات المختلفة فقد إقترح ما يسمى بالترميز ( المتعدد multicode ) (3)والذي يحوي على رمز خاص باللغة و8 رموز ثنائية للحروف ( أو 16 حرف إن إحتاجت اللغة ذلك) وبذلك يمكن شمول جميع لغات العالم عدا بعض اللغات ذات الأبجدية الطويلة كالصينية والكورية واليابانية فيمكن أن تعامل بشكل خاص. وقد إقترح في هذا الرمز أحد الرموز وهو الرمز وهو الرمز الأخير المرقم 255 ( FF بالنظام السداسي عشر ) لعملية الانتقال من لغة لأخرى لكي يبين كيف يمكن الانتقال من لغة إلى أخرى. ورغم كل ذلك فإن مسألة التشكيل في اللغة العربية لم تعالج بشكل مرضي لحد الآن حيث تعامل حركات التشكيل كحروف مستقلة مما يؤدي إلى صعوبات عديدة . تمييز الحروف العربية الكتابة هي سجل التاريخ الأنساني ، وقد حفظت لنا وقائع ونصوص آلاف السنين منذ نشأة الكتابة إلى يومنا هذا. وستبقى الكتابة على الورق أو غيره كذلك في المستقبل. ورغم أن هناك من يتصور إن الكتابة الألكترونية على رقائق السليكون في ذاكرات الحواسيب قد تحل محل الورق ، إلا أن ذلك مشكوك فيه على الأقل لحد هذا اليوم. الكتابة العربية مرت بمراحل عديدة ولم تصل وضعها الحالي إلا بعد تطورات عديدة. فالكتابة العربية قبل الأسلام وفي صدر الأسلام لم تكن منقوطة. ( أنظر الوثيقة المبينة في الشكل (3) والتي تبين كتاب النبي صلى الله عليه وسلم إلى المنذر بن ساوي أمير البحرين ) لكن التشكيل إضيف للكتابة حتى قبل التنقيط. وقد ظهرت العديد من أنواع الخطوط وتفنن الخطاطون العرب بابتداع خطوط في غاية الروعة والجمال. وبعد دخول الطباعة إلى العالم العربي ، شاعت خطوط معينة وقل إستعمال الشكل على الأقل في المشرق العربي. وقد أدى ذلك إلى شيوع اللحن في القراءة وضعف التزام القارئ العربي بضبط أواخر الكلمات. وعند دخول الحواسيب في العقود الأخيرة من القرن المنصرم ، استعملت الطابعات التي تكتب العربية ثم ظهرت الشاشات التي تظهر الكتابة العربية وتحسن جمال هذه الكتابة وأصبح بالأمكان تشكيل النصوص العربية إلا أن التشكيل إعتبر رمزا مستقلا ، شأنه شأن الحروف . وقد إعتبر لبعض الحروف رموز عديدة كالهمزة بحسب وضعها من الكلمة. وعلى هذا فإن استعمال الرموز في الحاسوب إستند إلى خدمة الكتابة كرمز وليس كشكل ولم يكن هذا الإستعمال خدمة أمينة لمحتوى الكلمة العربية أيضا. وإذا ما أريد لهذا الوضع أن يصحح ، فإن مقدارا من الذكاء يجب أن يدخل للبرامج العربية التي يتعامل معها المستخدم بحيث تساعده للأقتراب من اللغة العربية السليمة. تعتمد عملية قراءة النص العربي من قبل الحاسوب على المسح الضوئي للنصوص المطبوعة أو المكتوبة، وهي عملية سهلة ومتيسرة اليوم. لكن الصور التي تنتج نتيجة هذا المسح الضوئي قد تنتج بعض التشويش وما يسمى بالضوضاء التي قد تشوش عملية التمييز في المراحل اللاحقة ,, يتبع |
خطوات عملية التمييز: تتكون عملية التمييز من خطوات أولى تلك الخطوات هي عملية المسح الضوئي وذلك بتحويل الصفحة إلى مجموعة من النقط السوداء والبيضاء. ويعتمد عدد هذه النقط على دقة الماسح الضوئي وتتراوح دقة الماسحات حوالي 300 نقطة لكل بوصة أو أكثر من ذلك. تتضمن الخطوة التالية عمليات تهيئة تدعى بمرحلة ما قبل التمييز . وهذه المرحلة تتضمن معرفة المواصفات العامة للوثيقة. فهل تحتوي على رسوم وأشكال وهل تحتوي على عدد من الأعمدة أم عمود واحد وهل أصلا كان تصويرها مائلا أم عموديا وهل تحوي جداول .. إلى غير ذلك من المواصفات. وخلال هذه العملية يجري تحديد الأسطر ووضع حدود فارقة بين سطر وآخر وتحديد إرتفاع الكتابة في السطر الواحد وهكذا. أما الخطوة الأخرى فهي تتعلق بالتعرف على الكلمات والمقاطع والحروف بمختلف أشكالها ومواقعها في الكلمة. ثم استخلاص سمات كل جزء من المقطع وذلك تمهيدا للمرحلة اللاحقة التي تقوم بعملية مطابقة هذه السمات مع ما يعرف من مواصفات للحرف أو المقطع الواحد. وهذه أهم وأصعب خطوة في عملية التمييز . وقد أجريت أبحاث معمقة فيما يخص الكتابة المطبوعة . من السمات التي تميز حرفا عن غيره : عدد النقاط ومواقعها وإستقامة الحرف وعرضه وارتفاعه وعلوه عن متوسط السطر والميل وعدد الحلقات المقفلة وشكلها والحجم الكلي ومركز ثقل الحرف ومواقع نقاط الإتصال مع ما قبله أو مع ما بعده وغير ذلك من السمات الأخرى. يبين الشكل (4) مخططا يبين أحد الطرائق المقترحة للتعرف على الحروف العربية بشكل متسلسل وفق بعض مواصفاتها (4). أما الكتابة المكتوبة بخط اليد فلا تزال تعاني من إنخفاض في الدقة وكثر أخطاء ولبس بين حرف وآخر نظرا لإن الذكاء الإصطناعي المدخل في هذه البرامج لم يبلغ درجة عالية من النضج والعمق. وتتبع في عملية التمييز وسائل متعددة رياضية ومنطقية وشكلية وقواعد بيانات وغير ذلك. إلا أن ما تجدر الإشارة إليه أنه كلما كانت البرامج أقرب إلى ما يفعله الإنسان في قراءة النصوص كلما كانت الدقة أعلى . ولكن إستنباط ما يقوم به الإنسان ومحاكاته في الآلة ليست عملية سهلة على الإطلاق. وتجدر الإشارة إلى أن بعض مناهج تمييز الكتابة تعتمد تمييز المقطع أو الكلمة أصلا وليس الحرف. ويشبه ذلك ما تدعو إليه بعض المناهج التعليمية للأطفال من تعليم الطفل الكلمات قبل تعريفه على الحروف. وما يميز اللغة العربية هو تشابه حروف كثيرة مع اختلاف في عدد النقط ومواقعها. ورغم أن هذه الميزة ميزة مفيدة ، إلا أنها قد تكون عائقا في بعض الأحيان وذلك عند عدم قدرة الآلة على تمييز النقطة الضعيفة أصلا أو الخلط بين النقطة والنقطتين والثلاث أو الظن بوجود نقطة نتيجة عدم دقة الماسح الضوئي .. إلى غير ذلك من صعوبات . ويفيد في هذه الحقل وجود قاموس بالكلمات المتداولة وإعطاء احتمالات لماهية الكلمة المعنية إن كان لها معنى بوجود النقطة أو عدمه وكذلك التفريق بين أن يكون فيها نقطة واحدة أو أكثر. كما أن سياق الجملة قد يفيد في ذلك. لذلك فغن عملية تمييز الكتابة لا تنفصل عن معالجة الجملة العربية ككل ولا عن معالجة الكلمة والمقطع. المشكل الآلي المقترح فيما يأتي مشكل آلي مقترح يساعد الكاتب على تشكيل النص الذي يدخل إليه بأقل عناء ممكن. ولنأخذ مثالا على ذلك: إذا قام المرء بإدخال الآية التالية من القرآن الكريم: يا : إن الآلة بإمكانها أن تدرك بسهولة أن الياء مفتوحة فلا تقبل العربية أية حركة قبل الألف اللينة غير الفتح كما أنه ليس هناك حاجة لتشكيل الألف وعلى ذلك فيمكن للكاتب أن يكتب يا وتظهر الكلمة يَا أيها : هذه الكلمة كذلك ليس فيها غير إحتمال واحد وهو الفتح على الهمزة والشدة المضمومة على الياء والفتحة على الهاء فتصبح أَيُّهَا وهذه الكلمة من الكلمات التي يجب أن يحتفظ الحاسوب بتشكيلها شأنها شأن الكلمة الأولى يا الذين : هذه كلمة أخرى ليس فيها سوى نوع واحد من التشكيل : الَّذٍيِنَ آمنوا : إن هذه الكلمة تحتمل أن تكون آمِنوا أو آمَنوا فالميم يمكن أن تكون مفتوحة أو مكسورة ولكن سياق الجملة يوحي بأن الكلمة يجب أن تكون فعلا ماضيا وليس فعل أمر فإذا ما احتوى البرنامج على إعراب آلي فإن الكلمة سرعان ما يتبين أن هناك إحتمالا واحدا لتشكيلها لا غير. وعلى فرض أن البرنامج لم يصل بعد إلى ذلك المستوى من الذكاء الأصطناعي فإن البرنامج يمكن أن يظهر الأحتمالين معا ( آمَنُوا / آمِنُوا ) يختار الكاتب أحدهما بالضغط على الشكل الصحيح كتب : هذه الكلمة تحتمل ( كَتَبَ / كُتِبَ / كُتُبٌ / كُتُبٍ / كُتُبا ) وعلى أقل تقدير يمكن أن تظهر أمام الكاتب ليختار أحدها رغم أن السياق يمكن ان يحذف بعض هذه الأحتمالات. عليكم : تشكيل هذه الكلمة يكاد يكون مباشرا . كما أنه قد يشير فورا إلى أن كلمة كتب التي قبلها مبنية للمجهول وبذلك تصحح الكلمة التي سبقتها مباشرة وهكذا.. من المثال أعلاه يتبين إن تدريب الآلة على التشكيل الآني ليس مهمة صعبة ولكن تحتاج إلى بحث علمي وقليل من الدعم لنشر مثل هذا البرنامج كي يكون أداة على تصحيح اللفظ الصحيح. فالشكل يساعد القارئ على اللفظ الصحيح آنيا وعلى إمتلاك ملكة للفظ المشكول حتى وإن لم يكن الشكل ظاهرا على الكلمات. تمييز الحروف المطبوعة: تعتبر عملية تمييز الكتابة المطبوعة أسهل وأقل تعقيدا من عملية تمييز الكتابة المكتوبة بخط القلم. فالكتابة المطبوعة اليوم ما هي إلا صور متشابهة تماما للحرف نفسه حسب موقعه من الكلمة. فحرف الجيم التي في هذه الصفحة لها الشكل نفسه تماما إن وقعت في أول الكلمة أو حينما يسبقها حرف غير متصل مثل الواو أو الراء. والجيم نفسها تكون متطابقة مع أية جيم أخرى في الصفحة إن وقعت في وسط الكلمة واتصلت من جهتيها. وهكذا. وتتم عملية تمييز الحروف المطبوعة عادة بمطابقة شكل الحرف مع مخزون شكله في الحاسوب ومن ثم تستطيع الآلة التعرف على الحرف بمقارنة شكله مع الشكل المخزون فيها. ويمكن أن تقوم الآلة بخزن أنواع مختلفة من أشكال الحروف التي تدعى Fonts . وقد ظهرت أنواع مختلفة من أشكال الحروف الطباعية وتفنن الخطاطون العرب في رسم خطوط جميلة . ويتوفر على الأنترنيت اليوم عدد من المواقع المتخصصة بالخطوط العربية (أنظر الملحق – 1) ويتوفر في الأسواق أقراص مدمجة للكثير من أشكال الخطوط العربية الجميلة التي يمكن نصبها على أي حاسوب اليوم والإفادة منها في الكتابة. وعلى هذا فإن برامج تمييز الحروف والتي تدعى أحيانا بالقارئ الآلي تتعرف على الكتابة المطبوعة بالطابعات الحاسوبية الحديثة وقلما تستطيع التعرف على الطباعة القديمة . يبين الشكل (4) كيف تتم عملية تقطيع الكلمات المطبوعة إلى حروف متتالية (5). تمييز الحروف المكتوبة بخط اليد: إن عملية تمييز الحروف المكتوبة بخط اليد أكثر صعوبة من تمييز الحروف المطبوعة نظرا لأن الكاتب نفسه لا يعيد كتابة الحرف بالشكل نفسه تماما عند إعادة الحرف نفسه في موقع آخر من الكتابة. كذلك فإن الأشخاص المختلفين لا تتطابق كتاباتهم نهائيا مهما حاولوا ذلك. لذلك فإن عملية تدريب الحاسوب على التعرف على الكتابة اليدوية لا يزال في مراحل التطوير والبحث ولم يصل مراحل التطبيق الفعلي حتى في اللغات الأوربية لحد الآن. إن عملية تمييز الكتابة المكونة من حروف مقطعة كالإنكليزية مثلا أسهل من تمييز الكتابة المتصلة. لذلك فإن تمييز الكتابة العربية أصعب من تمييز الكتابة الإنكليزية نظرا لأن اللغة العربية لا تكتب إلا متصلة. وقد أجري العديد من الأبحاث العلمية على تمييز الكتابة العربية في جامعات عربية وأجنبية ومراكز أبحاث عديدة. ولا تزال الدراسات جارية في هذا الصدد. إن إحدى الصعوبات المهمة في تمييز الكتابة العربية بالإضافة إلى مسألة فصل الحروف عن بعضها مسألة كتابة بعض الحروف متداخلة عموديا أي بعضها أعلى بعض وقد يؤدي ذلك إلى تداخل الحروف والكلمات مع بعضها. يبين الشكل (5) كيف تتم عملية تقطيع الكلمات المكتوبة بخط اليد إلى حروف متتالية (5). تمييز الكتابة آنيا: عندما يتم ملاحقة يد الكاتب لحظة بلحظة، يمكن تمييز الحروف بسهولة أكثر من ملاحظة صفحة مكتوبة مسبقا. فالحاسوب يقوم بالتعرف على الحروف أولا بأول وهذه المعلومات التي تنقل للحاسوب هي معلومات مفيدة تسهل عملية التمييز. لكن الكتابة يجب أن تتم بقلم خاص وعلى لوحة خاصة متصلين بأسلاك. وهذا بحد ذاته عائق كبير جدا وسوف لن يكون بديلا لبرامج كفوءة للتعرف على الكتابة بخط اليد. هناك حاجة للتعرف على الخطوط عدا الغرض العادي وهو تمييز الحروف المكتوبة بخط اليد وذلك لنقلها الى خط مطبوع ومن ثم قابليتها للمعالجات الآلية المختلفة كالتشكيل والتصحيح والأعراب والترجمة وفهم النص واتخاذ إجراء معين نتيجة النص وغير ذلك من الأغراض. ومثل هذه الحاجات يمكن أن تكون توثيق توقيع شخص ما أو التأكد من أن الخط يعود لشخص ما أو حدوث تحريف ما في مخطوطة معينة.. إلى غير ذلك من الأغراض المختلفة. إن هناك تطبيقات عديدة لتمييز الكتابة منها عملية الفرز الآلي لرسائل البريد وذلك بالتعرف على العناوين وتوجيه الرسائل إلى الوجهة التي قصدها مرسل الرسالة. ومنها قراءة الصكوك المصرفية وصرفها آليا بعد التأكد من صحة التوقيع وقراءة المبلغ الذي تحويه. كما تجدر الإشارة إلى أن تمييز الكتابة لا تستدعي تفكيك الكتابة إلى حروف بل هناك محاولات للتعرف على الكلمات جملة واحدة بدل تفكيكها إلى مكوناتها حرفا حرفا . ولا شك بأن هذه المهمة أصعب من سابقتها. يتبع |
الصوتيات والحاسوب ينتج الصوت نتيجة حدوث تموجات في الهواء ولا ينقل إلا خلال وسط مادي سواء كان هواء أو مادة صلبة. والأصوات الكلامية تنتج في جهاز الصوت في الإنسان من خلال الهواء الخارج من الرئتين . فالرئتان تعملان كمنفاخ للهواء الذي عند مروره عبر الحنجرة والحلق والأنف والفم يحدث الصوت. ويتعرض الهواء لتضييق وتعديل في مساره فتنتج أصوات الحروف المختلفة. والصوت هو الوسيلة الطبيعية التي تنقل من خلالها اللغات الطبيعية. وتمر عملية الكلام بعدد من المراحل يمكن تلخيصها بما يأتي (6): 1 – مرحلة الترميز الدلالي بأن يصوغ المتكلم ما يريد قوله بلغته 2 – مرحلة الترميز القواعدي وذلك بأن يحدد المتكلم ما سيقوله وفق قواعد لغته 3 – مرحلة الترميز الصوتي ( الفونولوجي ) وذلك بأن يصوغ الكلام بسلسلة من المورفيمات وفق قواعد لغته 4 – يرسل الدماغ تعليماته إلى أعضاء النطق مبينا لها الحركات اللازمة لكل مورفيم 5 – قيام أعضاء النطق بالحركات المنتجة للأصوات 6 – تنتقل الأصوات في الهواء 7 – تدخل الذبذبات أذن السامع الداخلية والوسطى 8 – تنتقل الذبذبات من الأذن إلى الدماغ من خلال حوالي 30 ألف خيط عصبي 9 – يقوم الدماغ بفك رموز الصوت إلى فونولوجيا 10 – يقوم الدماغ بفك رموز الأصوات وفق اللغة التي يعرفها 11 – يقوم الدماغ بفك قواعد اللغة إلى معاني ( ومفاهيم ) الدلالة يبين الشكل ( 7 ) إنتقال الرسائل الشفوية من المتكلم إلى السامع وبالعكس. كما يبين الشكل ( 8 ) الجهاز النطقي لدى الإنسان أنواع الفونيمات فونيمات أولية أو أساسية وتنقسم الى نوعين ( أ ) الصوامت ومنها تتكون جزيئات الكلام . والكلام الإنساني هو حقيقة سلسلة صوتية متصل بعضها ببعض اتصالا وثيقا ولا وجود للأصوات المنفردة أو المنعزلة خارج السياق. فالجمل ليست تتابعات صوتية منفصلة ولا توجد فجوات بين الأصوات التي تتكون منها الكلمات كما لا توجد وقفات بين الكلمات المنطوقة. وتقسيم الأصوات الى صوامت وحركات هو الشائع لكنه ليس حاسما فهناك أصوات كلامية ذات حالة وسطية بين الصامت والحركة مثل الهاء المجهورة ، ويرجع ذلك أساسا الى صعوبة رسم الحدود بين الصوامت والحركات وذلك لإختلاف المعايير المستخدمة في تعريف كل منها. تتفاوت اللغات في عد الصوامت والحركات فيها وتبلغ أعلى نسبة من الحركات للصوامت في اللغة الفنلندية حيث تصل 40% أي 8 حركات من أصل 21 فونيم يقسم علماء الأصوات الصوامت حسب طريقة النطق الى سبعة أصناف هي الوقفات والمركبات والجانبيات والمكررات والأنفيات والأحتكاكيات ثم أشباه الحركات. وتقابل الوقفات ما كان يعرف عند الأقدمين من علماء العربية بالحروف الشديدة وتمتاز اللغة العربية بأن الأصوات الوقفية فيها تتوزع على خمسة مخارج ونادرا ما يلاحظ ذلك في لغات أخرى. والوقفات العربية هي الهمزة وتعرف بالوقفة الحنجرية والقاف والكاف أما الوقفات الأسنانية – اللثوية فتشمل الضاد والطاء والدال والتاء . أما حرف الباء فهو وقفي شفهي مجهور مرقق. أما المركبات ففي العربية صوت واحد هو الجيم . أما الأصوات الجانبية فتشمل اللام المرققة والمفخمة أما المكررات فتشمل الراء المكررة والراء غير المكررة . والأنفيات تشمل الميم والنون والأحتكاكيات تشمل الهاء والحاء والعين والخاء والشين والغين والسين والزاي والصاد . اما الثاء فتنطق بوضع طرف اللسان بين أطراف الثنايا ونحو ذلك تنطق الذال والظاء والفاء بمثلث بين الأسنان.وفي العربية حرفان هما الياء والواو وهما أشباه حركات . يبين الشكل (9) الأبجدية العالمية للأصوات كما يبين الشكل (10) رموز الأصوات العربية ويبين الشكل (11) الأصوات العربية الصامتة بحسب نطق المتخصصين وقراء القرآن الكريم. ( ب ) الحركات إن وصف الحركات أصعب بكثير من وصف الصوامت . وقد توصل المختصون الى تقسيم الحركات إلى ثماني حركات معيارية أولية وهي تمثل كما في الشكل ( 12) وتقع الحركات العربية الفتحة والكسرة والضمة ومواقع الحركات العربية منها وفي هذا الشكل تمثل الخطوط العرضية ( الأفقية) مستويات ارتفاع النقطة العليا للسان في الفم . أما الخطوط الطولية فتمثل جزء اللسان الذي تقع فيه النقطة العليا ونظرا لضيق الفراغ المحصور بين النقطة العليا للسان وبين الحنك سميت الحركات التي تقع على هذا الخط ضيقة أما الخط الأفقي السفلي يكون اللسان مسجى في قاع الفم فتكون سعة الفراغ المحصور بين جزء اللسان والحنك فتسمى الحركات متسعة. أما الخط الطولي الأيمن فيمثل الجزء الخلفي للسان فتسمى الحركات خلفية . أما الخط الأيسر المائل فيمثل الجزء الأمامي من اللسان فتسمى الحركات أمامية. فونيمات ثانوية وهي عبارة عن ملامح صوتية إضافية تؤثر في الأصوات الكلامية ومن هذه الملامح :النبر ووظيفتها التعبير عن التوكيد أو الأنفعال وهناك وظيفة أخرى للنبر في بعض اللغات للنبر داخل الكلمة. ويقع في اللغة العربية في مثل " الطلاب يكتبون دروسهم " ويقع النبر في " بو " من يكتبون أو في الكاف في كلمة " كتب " وهكذا يمكن استنتاج أن النبر في الكلمة العربية يعتمد على عدد المقاطع في الكلمةالنغمة والتنغيم وهي عبارة عن إضافة اللحن للكلام . ويستعمل التنغيم للتمييز بين صيغة جملة وأخرى مثل : ما أحسنَ زيدا! ما أحسنُ زيدٍ؟ ما أحسنِ زيدُ. (جـ) الطول أو الكمية أو المدة : وفي اللغة العربية نميز درجات كثيرة من الطول ربما خمسا أو ستا مثل الحركات القصيرة ( مثل كَتَبَ) والطويلة ( مثل كاتب) والطويلة جدا ( مثل صحراء وهدوء وبرئ) والمديدة ( مثل ضَّال ) (د) المفصل : وهو سكتة خفيفة بين كلمات أو بين مقاطع كلمة معينة مثل : هذا / كتاب / زيد أو مثل السكتة بين ها /ذا أو كـِ/ تاب يتبع |
تحليل الأصوات العربية تحتوي الأصوات بصورة عامة على تردد أساس يختلف وفق المتكلم. وتنحصر قيمة هذا التردد للرجال بين 80-200 دورة بالثانية وللنساء بين 150-450 دورة بالثانية بينا هي بين 200-600 دورة بالثانية للأطفال. تقسم الدراسات الحديثة الأصوات إلى قطع صوتية مكونة من أنواع مختلفة ولكل منها طول مختلف يتراوح بين حدود معينة. ويتم الرجوع إلى قاموس يحتوي على ترجمة معاني القطع اللفظية. إلا أن المشكلة الرئيسة تكمن في المراحل الانتقالية بيين القطع الصوتية المتتالية.يبين الشكل ( 14) لفظة كلمة " كَتَبَ " وكيفيات تقسيمها إلى فونيمات أو دايفونات مختلفة خاصة للصوامت. وقد أجريت العديد من الدراسات حول الصوامت المستعملة في اللغات الأوربية. أما الصوامت الخاصة باللغة العربية كحروف الضاد والطاء والقاف فقد لقيت هي الأخرى اهتماما خاصا من قبل الباحثين مؤخرا. أما تمييز الأصوات فيحتاج إلى تحليل للإشارة الصوتية ومعالجة كل حيز من الترددات على حدة لمعرفة الخواص الدقيقة لكل مكون من مكونات الصوت وتعتبر عملية تقسيم الصوت الى قطع متتالية من أصعب هذه المهام نظرا لاختلاف مواصفات الصوت بين متكلم وآخر بل واختلاف نطق المتكلم نفسه وسرعة كلامه ودقة نطقه وكيفية ربط الكلمات بعضها بالبعض. وتجري عملية التمييز بعد عملية التقطيع وهي لا تقل صعوبة عن سابقتها للأسباب نفسها. إن عملية تمييز الأصوات لا تقل تعقيدا عن تمييز الحروف المكتوبة بخط اليد نظرا لأن كليهما مختلف بين شخص وآخر بل وللشخص نفسه بين حرف وحرف آخر. إن إحدى التطبيقات المهمة المؤملة من تمييز الأصوات العربية هو تطوير وسيلة إملاء آلية بحيث يتم تحليل الصوت وتحويله إلى كتابة صحيحة. وبالطبع فإن تخليص الصوت المنطوق من شوائبه وإضافة ما لم ينطق بشكل كامل أو صحيح إلى الكتابة هو أمر في غاية الأهمية. إن المصاحف اليوم بما تحويه من علامات وقف وترتيل هي أمثلة على ما تحويه اللغة من مكنونات لفظية غير ظاهرة للعيان عند تدوينها بالحروف فقط. فهناك الحركات الخاصة بالشكل وهناك العلامات الأخرى اللازمة لضمان دقة اللفظ. إن النظرة السريعة للحركات في اللغة العربية توحي بوجود 3 حركات هي الفتحة والضمة والكسرة. إلا أن الحقيقة أن هناك عددا أكبر من ذلك نتيجة تعاقب الحركات مع حروف العلة ( الألف والواو والياء ) قبلها وبعدها وكذلك وجود الشدة على حرف العلة . فالكسرة قبل الواو المفتوحة ( مثل سوى ) هي غير الكسرة قبل الياء المفتوحة ( مثل عليّا ) وتجدر الإشارة كذلك إلى أن بعض الحروف العربية لها أكثر من فونيم كاللام المرققة والمفخمة والراء المرققة والمفخمة كما أن الياء والواو هما حرفات صامتان وهما حركات في الوقت نفسه . أما الهمزة فهي حرف صامت بينما الألف هو حركة فقط. كما أن بعض الحروف تنقلب إلى حروف إخرى وفق موقعها في الكلمة وحركتها مثل أسفَرَ ( سين ) وأسدَلَ ( زاي ) ويسطَع ( صاد ) . هل نحن بحاجة إلى دراسة االفصحى والعامية أيضا؟ نعم ! إن الحاجة إلى دراسة تحليل اللغة العربية الفصحى أمر في غاية الأهمية نظرا للحاجة إلى ذلك في فهم الكلام العربي المنطوق وتحويله إلى نص مكتوب أو ترجمته إلى لغة أخرى سواء كان ذلك ترجمة فورية أم غير فورية. أما فهم وتحليل اللهجات العامية فهو من الناحية العملية لا يقل أهمية عن فهم الفصحى وذلك لأن الحاسوب يمكن أن يكون وسيلة لتعليم الفصحى، وإن عملية فهم العامية واستنباط ما يقابلها من فصحى هو أمر في غاية الأهمية. فالمتكلمون بالعامية اليوم هو أكثر بكثير ممن يتقن اللغة الفصحى. لذلك فيمكن أن يكون الحاسوب وسيلة فعالة للقضاء على العامية من خلال التصحيح الفوري للحن بالفصحى أو استبدال العامية بالفصحى أو تصحيح الأخطاء اللفظية في تشكيل أواخر الكلمات أو غير ذلك من المعالجات اللفظية للغة العربية. وكل هذا يحتاج إلى دراسات وأبحاث للغة العربية وكيفية برمجة أصواتها. يلاحظ أن هناك أصوات في اللهجات العامية غير مستعملة في الفصحى مثل " بيت " العامية غير " بَيت " الفصحى. أو "لوح" غير "لَوح" الفصحى. أو "بيض" غير "بِيض" الفصحى وهي غير الكسرة في كلمة "بِيض" جمع أبيض . وهكذا تركيب الأصوات العربية كما سبق وأن تبين أن الأصوات العربية يمكن أن تفهم من الحاسوب فإن الحاسوب يمكن أن يكوِّن أصواتا عربية صحيحة. وبهذا الصدد فإن تكوين مثل هذه الأصوات في غاية الأهمية نظرا لأنه وسيلة لتعليم اللغة العربية الصحيحة نطقا وتشكيلا وتداولا وهو وسيلة للعودة إلى الفصحى بدل العامية. وتجدر الإشارة إلى أن بعض الباحثين يشيرون إلى أن مخارج الحروف الشائعة اليوم في بعض البلدان العربية مثل الضاد والظاء والجيم وغيرها بعيدة عن النطق العربي الصحيح كما وصفه علماء اللغة العربية في القرنين الثاني والثالث الهجري. وقد يكون الحاسوب وسيلة هامة في تصحيح هذا النطق وإعادته إلى سالف عهده بل وإلى توحيد النطق الصحيح بين العرب جميعا إذا ما أحسن استخدام ذلك. أهمية الدراسات الإحصائية للغة العربية لا شك بأن هناك مهام كثيرة يجب أن يقوم بها الباحثون العرب في حقل اللغة العربية نحوا وصرفا ودلالة وبلاغة ونطقا من قبل المتخصصين باللغة العربية وفي حقل برمجة اللغة العربية من قبل أخصائيي الحاسوب ومن قبل علماء اللسانيات فيما يتعلق بعلاقة اللغة العربية مع اللغات الأخرى ترجمة ومفاهيم. إن كثرة هذه المهام تفرض عليهم جميعا أن ينتقوا المهام الأكثر أهمية ومن ثم ينتقلوا إلى ما هو أقل أهمية بمضي الوقت. ونظرا لسعة اللغة العربية وتعقد نحوها وصرفها وبلاغتها ونطقها، فإن اختيار ما هو أكثر شيوعا للبدء به ثم الإنتقال إلى ما هو أقل شيوعا يجعل المهام أيسر وأقرب إلى التطبيق العملي. إن مما لا شك فيه أن اللغة العربية المتداولة في الحياة اليومية من مدرسة وسوق وصحف ومحطات فضائية لا تشكل سوى نسبة قلية من مجمل الألفاظ والمعاني الدلالية العربية المدونة في أمهات الكتب الخاصة باللغة العربية. لذلك فإن نقطة البداية يجب أن تكون من المتداول وليس من المعاجم العربية. وهذا لا يتأتى إلا من خلال دراسات إحصائية لما هو متداول اليوم تتطور شيئا فشيئا لتزداد دائرتها ولتقوم بتصحيح الخطأ ثم تحسين المتداول . يبين الجدول (1) إحصائية بسيطة على عدد الحروف العربية التي قمنا بها على أحد الكتب والتي تبين عدد الحروف المكونة للمقاطع ( من ناحية الرسم ) وهي تساعد على فهم تكون الكلمة العربية رسما ومن ثم تعطي فكرة عما يجب على الباحث في حقل تمييز الكتابة العربية فهمه ومن ثم تمييز الكلمة العربية حرفا حرفا أو مقطعا مقطعا. ترابط الدراسات مع بعضها إن الدراسات الخاصة باللغة العربية والحوسبة مترابطة مع بعضها البعض وكل منها يعتمد على الآخر. فالمخزون اللغوي المستعمل في حقل ما يمكن أن يستعمل في حقل آخر. ودراسة الدلالة من السياق يمكن أن يصحح كثيرا من الأخطاء عند تمييز الكتابة العربية أو فهم كلام منطوق بسرعة .. وهكذا. لذلك فإن نشر الأبحاث وعقد المؤتمرات وتعاون الباحثين ونشر المطبوعات وتعارف الباحثين مع بعضهم البعض ، كل ذلك مما يثري المعرفة في هذا المجال ويزيد من سرعة الوصول إلى أهداف خدمة اللغة العربية العاجلة منها والآجلة. يتبع |
خطر ترك الأبحاث عن اللغة العربية بيد غير العرب أصبحت كثير من المتعلقة باللغة العربية والحاسوب ذات طابع تجاري. وقد أدركت ذلك الشركات الكبرى ومراكز الأبحاث الغربية ، لذلك فهي تقوم بأبحاث ثرية متعلقة باللغة العربية وتنتج برامج تباع لمن يتعامل مع اللغة العربية على الحاسوب أو عبر الأنترنيت. وهذه تنشر ثقافات وتثبت قواعد وأسس لها ما بعدها وما يستند إليها وتوجه التعامل مع الحاسوب وجهات ليست في صالح العربية ولكن هي في أحسن أحوالها وجهات ذات أهداف تجارية. وقد تشيع لهجات عامية أو إنحراف عن القواعد النحوية أو انحراف في معاني ألفاظ عربية عن معناها المعتمد في اللغة. لذلك فإن خدمة اللغة العربية عبر التقنيات الحديثة لا تتم إلا بأيدي أبنائها من خلال مراكز أبحاث رصينة أو جامعات عربية تفهم اللغة وتدافع عنها وتحمل همومها. تقرير آخر لنفس الموضوع 1- مقدمة لم يكن تطور اللغات الحية منها والمندثرة إلا سماعا، وقلما كان هناك تخطيط لتطور اللغات إلا في العصر الحديث. فاللغة العربية تحدث بها العرب وتناقلتها أجيالهم جيلا بعد جيل فأضافوا لها وأهملوا منها. وحيث لم يكن هناك في تلك الأزمان وسائل لتسجيل الصوت ونقلها إلى الأجيال اللاحقة فإن الكتابة كانت هي الوسيلة الوحيدة (عدا المشافهة) لخزن اللغة ونقلها بدقة إلى الأجيال اللاحقة التي لم تلتق بالأجيال السالفة. ولكن عند بدء تدوين اللغة بدأت بالثبات خاصة بعد ظهور الإسلام ونزول القرآن الكريم وتدوينه، وبذلك ثبتت أسس اللغة العربية من نحو وصرف. وعلى هذا فإن اللغة العربية أُخذت أولا نطقا ثم تلتها الكتابة لاحقا، فالكتابة كان عليها أن تكون دقيقة في تمثيل النطق فأضيف لها التنقيط في القرن الهجري الأول ثم تلا ذلك التشكيل، وبذلك أمكن ضبط النص المكتوب لكي ينطق من قبل الأجيال اللاحقة وفق النطق نفسه الذي نطق به الأولون وكان الفضل في ذلك إلى نمط الكتابة العربية. فالمحافظة على نمط الكتابة يصل آخر الأمة بأولها. وهذا ما لمسه الخطاطون العرب على مر العصور حيث أضافوا للخط العربي جمالا وتفننوا في الإبداع في ذلك فظهرت الخطوط العربية المختلفة ثم أضيفت بعض الرموز كرموز الوقف والتجويد للقرآن الكريم ثم أضيفت رموز أخرى في العصر الحديث مقتبسة من اللغات الأخرى. وكل ذلك لم يغير من نمط الكتابة العربية ومواصفاتها الأصلية. وفي خلال نصف القرن الأخير وبعد فترة وجيزة من انتشار الحواسيب أمكن إدخال اللغات التي تستخدم الحروف اللاتينية إلى الحاسوب أولا. ثم ظهرت فكرة إدخال اللغات الأخرى بعد إجراء تطويرات متعددة في تركيب وبرمجة الحاسوب. وقد حشرت الحروف العربية وما يتكون منها من كلمات وجمل حشرا ضمن البرامج لكي تكتب كما تدخل... ثم تطور ذلك... إن الاستعمال الرئيس للحاسوب بالنسبة لمختلف اللغات لا يزال مجال الكتابة، أما مجال النطق والأصوات فقد حدثت فيه تطورات هامة خلال العقود الأخيرة إلا أنه لا يزال محدودا بالمقارنة مع مجال الكتابة. وعلى هذا فإنه سيتم التركيز على مجال الكتابة هنا على أمل أن تكون هناك فرص أخرى في المستقبل إن شاء الله تعالى لتناول موضوع النطق للغة العربية. إن خدمة الكتابة العربية من قبل الحاسوب تستدعي جملة فرضيات أساس، من الضروري أخذها بنظر الاعتبار. إن عمل الحاسوب يجب أن يكون وسيلة لخدمة اللغة العربية وحاكيا بدقة مختلف جوانبها وليس قاسرا لها بحيث يطوع اللغة العربية لما يناسب تصميم الحاسوب نفسه. وهذا لا يعني الجمود على الوضع الحالي للغة العربية بل يترك ذلك لعلماء اللغة وباحثيها وخطاطيها، وهؤلاء ليسوا مجبرين على أن ينحوا نحوا قسريا معينا وفق آراء واجتهادات المتخصصين بالحاسوب أو الجهات المصممة له. أما الأمر الثاني الواجب توفره فهو أمانة تمثيل اللغة العربية من قبل الحاسوب. ويستوجب ذلك الاستيعاب الكامل لإمكانية إدخال اللغة العربية إلى الحاسوب، وإمكانية معالجتها داخل الحاسوب بتفصيل ودقة ولكل الاحتمالات المتوقعة في المستقبل، إضافة لإمكانية طباعتها بشكل اعتيادي مع الأخذ بنظر الاعتبار الطابع الجمالي المخرج من الحواسيب. وإذا ما أخذنا بنظر الاعتبار أن الحاسوب تكون وتطور أصلا في بيئة غير عربية فإن خدمة اللغة العربية لابد وأن تكون -في الوقت الحاضر على الأقل- محدودة بالإمكانيات التقنية الحالية دون أن نهمل وضع القواعد والأسس الواجب أخذها بنظر الاعتبار لتطورات الحاسوب المستقبلية لكي يكون أكثر مطاوعة لخدمة اللغة العربية خاصة إذا ما تطورت حواسيب تحوي ذكاء اصطناعيا لا بأس به لخدمة اللغات المختلفة، فعند ذلك يصبح بالإمكان ظهور حواسيب أكثر خدمة للغة العربية مما هو متوفر الآن. وحتى يأتي ذلك الوقت فإن هناك حاجة لبحوث كثيرة في اللغة العربية وفي علم الحاسوب حول اللغة العربية خدمة للناطقين بها من أبناء هذا الجيل والأجيال القادمة. 2- نبذة تاريخية: بعد فترة وجيزة من دخول الحاسوب إلى الحياة العملية في مختلف القطاعات وجد أن بالإمكان استخدام الطابعات السطرية Line Printers بلغات لا تستعمل الحروف اللاتينية. وعند ذلك صنعت أحزمة Belts من حروف طباعية عربية وكان ذلك في نهاية الستينات من هذا القرن. وقد احتوت تلك الأحزمة على طواقم من حروف عربية أغلبها ذات شكل واحد للحرف الواحد (عند استخدام الحرف الأول في أول الكلمة أو وسطها أو آخرها) نظرا لقلة عدد الأماكن المتوفرة على تلك الأحزمة وضرورة احتوائها على الأحرف الإنكليزية (الكبيرة والصغيرة) بجانب الأحرف العربية. وقد كانت قراءة ما يطبع من تلك الطابعات صعبة. وقد استوجبت تلك المحاولة اصطلاح مواقع رموز الأحرف ضمن جداول الرموز الحاسوبية المعروفة بـ (ASCII Code) والتي وضعت أصلا للغة الإنكليزية من معهد التقييس في الولايات المتحدة الأمريكية. كما استوجب وضع رموز الحروف العربية منفصلة عن بعضها تفصل بينها فواصل صغيرة قد تكون مرئية للقارئ وقد تكون غير مرئية بحيث تظهر وكأنها كتابة متصلة. وقد اتخذت الشركات المصنعة لتلك الطابعات لنفسها قرارات حددت بموجبها عدد ونوع الحروف التي تحويها الطابعات التي تصنعها. ولكنها بدافع تسويق منتجاتها، ولكونها شركات غربية لا خبرة لها باللغة العربية، بدأت بالاتصال بالمستخدمين العرب (وخاصة الجامعات ومراكز الحواسيب الكبيرة في العالم العربي) لاستمزاج رأيها في تحسين شكل الحروف الطباعية وعددها وأسلوب توزيعها بين الأحرف اللاتينية وبدأت تجري تحسينات عليها. وبعد انتشار استخدام الشاشات المرئية قامت تلك الشركات بإنتاج شاشات للمستخدمين العرب تظهر الحروف العربية بشكل مجموعة من النقاط المضيئة. وقد حدثت نقلة نوعية مهمة في منتصف السبعينات حينما قامت إحدى الشركات بإنتاج شاشة عربية بإمكانها إظهار الحرف العربي المتكون من مصفوفة مضيئة بحيث يختلف شكله حسب موقع الحرف من الكلمة العربية ذاتيا. ثم انتقلت الفكرة نفسها بعد ذلك إلى الطابعات عند انتشار الطابعات النقطية Dot Matrix Printers. وقد كان عدد النقاط المضيئة للشاشة أو دبابيس الطابعات محدودا أولا فكان شكل الحروف رديئا. إلا أنه بعد زيادة دقة الشاشات والطابعات أصبح بالإمكان طباعة أشكال جميلة من الحروف العربية بمختلف مواقعها إضافة إلى تغيير عرض الحرف وإضافة التشكيل. وكان في خلال هذه العملية أن أضيف إلى الحواسيب ذكاء محدود لكي يتم وفقه تحديد شكل الحرف (من بين الأشكال الأربعة: الأولية والوسطية والآخرية والمنفصلة) ذاتيا حسب موقعها من الكلمة. وقد زاد خلال هذه الفترة الضغط على الجهات العربية المسؤولة عن المقاييس العربية وكثرت المناقشات والمداولات في الندوات والمؤتمرات العربية حول الحواسيب. |
3- المواصفات القياسية العربية: ساهمت عدة منظمات ومؤسسات عربية ودولية في بلورة واختيار مواصفة قياسية عربية مناسبة للحاسوب. ومن تلك المنظمات(1) : المنظمة العربية للتربية والثقافة والعلوم، ومعهد اللسانيات في المغرب، والمنظمة العربية للمواصفات والمقاييس، والمنظمة السعودية للمواصفات والمقاييس، والمركز القومي للحاسبات الإلكترونية في العراق، والاتحاد العربي للاتصالات، ومعهد الكويت للأبحاث، وشركة أليس بكندا، ومكتب ما بين الحكومات للمعلوماتية، والاتحاد الأوربي لمصنعي الحاسوب. وفي عام 1981 شكلت المنظمة العربية للمواصفات والمقاييس التي كانت تابعة للجامعة العربية ومقرها في عمان، لجنة لتحديد مواصفة قياسية عربية للحروف العربية في حقل المعلومات. وقد أصدرت المنظمة المواصفة القياسية رقم 449 (ASMO 449) وسجلت عالميا بـ (ISO/9036) وقد احتوت 120 حرفا للاستعمال في حقل معالجة المعلومات وقد أُقرت في كانون الثاني عام 1985. ويبين الشكل (1) توزيع الحروف على المواقع وهي تحوي على سبعة أرقام ثنائية (7 bits).(2)(3) وفي تشرين الأول عام 1985 أقرت المنظمة مواصفة قياسية أخرى برقم 662 (ASMO 662) تتطابق مع المواصفة الأولى في مواقع الأحرف مضافا إليها حروف التحكم وكانت ذات ثمانية أرقام ثنائية (8 bits). وبعد عام من ذلك تقريبا (تشرين الثاني عام 1986) أقرت المنظمة المواصفات القياسية 708 (ASMO 708) لتبادل المعلومات على الحاسوب بثمانية أرقام ثنائية وسجلت عالميا تحت رقم (ISO/8895-6). ويبين الشكل (2) توزيع الأحرف العربية على النصف العلوي من الجدول فيما أبقيت الأحرف الإنجليزية على النصف السفلي من الجدول كما هي. ويلاحظ في هذا المواصفة أن الحروف العربية متطابقة في مواقعها مع المواصفة 449 وكذلك أدوات التشكيل الثمانية وهي على التعاقب:تنوين الفتح ثم تنوين الضم ثم تنوين الكسر ثم الفتحة فالضمة فالكسرة فالشدة فالسكون. أما الأرقام العربية فقد احتلت في المواصفة 708 مواقع الأرقام الإنجليزية نفسها وليس من موضوعنا بحث مواقع أحرف التحكم في هذه المواصفات. ونظراً لتأخر صدور هاتين المواصفتين القياسيتين أكثر من عشر سنين على بدء استخدام اللغة العربية في الحاسوب فقد وضعت الشركات المنتجة للحواسيب مواصفاتها الخاصة بها مما جعل من الصعب عليها التراجع عنها بسبب ما قد يكلفها ذلك من تكاليف عالية. لذلك استمر وجود أطقم عديدة من أنظمة الحروف بحسب الشركات المنتجة للحواسيب. 4- أطقم الحروف العربية يبين الملحق (1) معظم الأطقم للحروف العربية الشائعة. وفيما يأتي ملاحظات عن أكثر هذه الطواقم انتشاراً: 4-1 المواصفتين القياسيتين للمنظمة العربية للمواصفات والمقاييس المرقمتين 449 و 708 وقد سبقت الإشارة لهما. وتمتازان بما يأتي: أ) وجود موقع لكل حرف من الحروف الثماني والعشرين. ب) وجود ستة مواقع للهمزة بأشكالها المختلفة ء أ إ ؤ ئـ آ ج) وجود موقع للتاء المربوطة وآخر للألف المقصورة. د) وجود ثمانية مواقع للتشكيل هي ً ٌ ٍ َ ُ ِ ّ ْ وحسب الترتيب المبين. هـ) وجود موقع للكشيدة (التطويلة) بين الحروف المتصلة. 4-2 مجموعات أطقم الحروف الخاصة بالدوس العربي: أصدرت شركة أليس تعريباً لنظام التشغيل وعرف بالدوز العربي، وقد استندت الشركة إلى أطقم المواصفة القياسية العربية 708 ثم أجريت تعديلات على المواصفة القياسية 449 وأعطيت الرقم 709 وبعد ذلك أنتجت طواقم أخرى برقم 710 و 720. فالطاقم المرقم 709 يتطابق مع المواصفة 449 مضافا إليها مجموعة من التشكيل المزدوج على التوالي : ًّ ٌّ ٍّ َّ ُّ ٍّ. أما الطاقم 710 فلا يحوي تشكيلاً وتنقسم الحروف العربية فيه إلى سلسلتين الأولى تحوي أشكال الهمزة والألف والباء والتاء المربوطة، يليها سلسلة من الرموز غير الحرفية ثم تأتي السلسلة الثانية من الحروف العربية من التاء إلى الياء والكشيدة ولا يحوي هذا الطاقم على التشكيل. أما الطاقم 720 فقد احتوى على التشكيل الأساسي بثمانية مواقع مع الحروف العربية موزعة على عدة سلاسل، تتوزع بينها رموز أخرى غير الحروف العربية. 4-3 مجموعات النافذة العربية أصدرت شركة 01 البحرينية نظاما للتعريب يعتمد على أساس شفافية الحروف العربية بحيث يتواءم مع أطقم الحروف اللاتينة وقد أصدرت الشركة عدة طواقم للحروف أشهرها المرقم 711 ويحوي الحروف العربية إضافة إلى التشكيل وحسب الترتيب الآتي: أ) التشكيل ْ ّ َ َّ ً ًّ ُ ُّ ٌ ٌّ ِ ِّ ٍ ٍّ. ب) الهمزات بأشكالها الستة ثم الألف والباء والتاء المربوطة. جـ) الحروف من التاء إلى الغين. د) الكشيدة. هـ) الفاء إلى الميم. و) النون والهاء. ز) الواو والألف المقصورة والياء. و) يتخلل مواقع هذه الحروف رموز بيانية. 4-4 أطقم صخر العربية أصدرت شركة العالمية (صخر) تعريبها الخاص بها وقد احتوى طاقم الحروف العربية لها على ما يأتي: أ) أدوات التشكيل الأساسية الثماني ً ٌ ٍ َ ُ ِ ّ ْ. ب) الهمزات الستة ثم الألف والباء والتاء المربوطة. جـ) الحروف الأخرى من التاء وحتى الياء ثم الكشيدة. ويتخلل الحروف (بين التاء المربوطة والتاء) الرموز البيانية. 4-5 طاقم شركة ا.ب.م المرقم 864 أصدرت شركة ا.ب.م الأمريكية طاقما خاصا بها أسمته: IBM Arabic National Supplement 864 ويحوي هذا الطاقم على ما يأتي: أ) مجموعات اللام ألف وهي ثمانية مواقع لأ ـلأ لإ ـلإ لا ـلا لآ ـلآ. ب) التعريقة . جـ) الهمزات على الألف آ ـآ أ ـأ إ ـإ. د) الشدة ّ ـّ. هـ) الحروف العربية بشكلين لكل حرف بحيث يمكن كتابة أشكال الحروف مع التعريقة. وقد تم توزيع الحروف والرموز البيانية متداخلة بينها على غير تسلسل معين وبتجميع بعضها مع بعض أحيانا. 4-6 طاقم شركة مايكروسوفت بعد انتشار نظام النوافذ windows المنتج من شركة مايكروسوفت الأمريكية أصدرت الشركة تعريبا له وقامت باستحداث طاقم خاص بها ويحوي هذا الطاقم على: ا) الأشكال الستة للهمزة. ب) الحروف العربية من الألف إلى الضاد تتخللها التاء المربوطة بين الباء والتاء. جـ) حروف الطاء والظاء والعين والغين تليها الكشيدة ثم الفاء والقاف والكاف. د) حرف اللام. هـ) حروف الميم والنون والهاء والواو. و) حرفي الألف المقصورة والياء. ز) التشكيل ً ٌ ٍ َ ُ ِ ّ ْ تتخللها رموز أخرى. وقد بدأ هذا الطاقم بالانتشار أكثر من غيره بعد طغيان استعمال النوافذ هذا ويخشى أن يبقى هو السائد، طاغيا وملغيا لجميع الأشكال الأخرى أو معظمها. تبين الأشكال 3-9 توزيع الحروف العربية لعدد من الأطقم المذكورة أعلاه(6). وتجدر الإشارة إلى أن هناك إمكانية في بعض الأنظمة (أو البرامج الجاهزة) التي يمكن بواسطتها التحويل من طاقم لآخر كما هو الحال في نظام ويندوز الخاص بمايكروسوفت ونظام النافذة.ولكن بالطبع فإن عملية التحويل هذه لا تخلو من مشاكل نظرا لعدم تكافؤ الطواقم تماما في محتوياتها. 5- أنظمة تعريب الحاسوب نظرا لما للحروف العربية من علاقة بأنظمة تعريب الحاسوب التي ظهرت لحد الآن فسنعطي فكرة مبسطة عن أنظمة التعريب التي عرفت لحد الآن، فإن من يستعمل اللغة العربية يجابه عددا من المعضلات التي أخذت أنظمة التعريب على نفسها مهمة حلها. ومن هذه المعضلات: أ) الكتابة من اليمين إلى اليسار بخلاف اللغات التي تستعمل الحروف اللاتينية التي تكتب من اليسار إلى اليمين. ب) إمكانية إدخال نص عربي ضمن الكتابة الإنكليزية (أو الفرنسية)، وبالعكس إمكانية إدخال نص إنكليزي (أو فرنسي) ضمن النص العربي. جـ) الاختيار بين الأرقام العربية الغبارية المستعملة في المشرق العربي والأرقام المستعملة في المغرب االعربي وأوربا. د) الشفافية، والمقصود بها المحافظة عند التعريب على إمكانية استخدام البرامج الإنكليزية الأصلية بحيث لا تؤثر الحروف العربية سوى على مواقع بعض الرموز البيانية. هـ) التعامل مع الحروف الحيادية (بين العربية واللاتينية) مثل الفراغ والعلامات والأرقام (كقيم وليس كشكل) بشكل منطقي ومقبول. وقد قامت الجمعية العلمية الملكية بعمان عام 1989 بإجراء دراسة مقارنة عن أنظمة التعريب(7) بين أحد عشر نظام تعريب شائع، بينها: تعريب ا.ب.م، والمساعد العربي، والأمير، والدوز العربي، والنافذة، والأستاذ، وغيرها. وقد ألقيت الدراسة كبحث في المؤتمر الأول للحاسوب في الكويت الذي عقد بين 27-29/3/89. ويجدر بالذكر نظامان آخران مهمان للتعريب هما النظامان الذين أنتجتهما شركة صخر ونظام النوافذ windows الذي أنتجته شركة مايكروسوفت. وقد طورت الأولى نظامها الذي كان أصلا يعتمد على أجهزة صخر فقط ثم أنتجت النوافذ العربية مستندة إلى شفافية خاصة بها. أما نظام النوافذ الذي أنتجته شركة مايكروسوفت فقد أصدرت منه نظاما معربا ثم أنتجت طبعة جديدة عام 1995 سميت النوافذ 95 ويتوقع أن تصدر تعريبا لها في وقت لاحق من هذا العام. أما شركة أبل ماكنتوش فقد أصدرت تعريبا خاصا بها على أجهزتها غير المتوافقة مع ا.ب.م واستندت في طاقم الحروف العربية إلى توزيع خاص بها لكن يقرب من الطاقم المرقم 711. وتمتاز برامج هذه الشركة بقابلية إظهار الحروف العربية بدقة عالية مما مكن من إنتاج خطوط عربية جميلة بواسطة أجهزة هذه الشركة. ويلاحظ بين أنظمة التعريب أن مسألة ترتيب الحروف الهجائية يعتمد على الطاقم المستعمل حيث أن كل هذه الطواقم قد اعتبرت التشكيل عبارة عن حروف، لذلك فإن ترتيب الحروف عند الكتابة المشكولة يعتبر التشكيل حرفا يؤخذ بعين الاعتبار عند الترتيب. ومن ذلك ينتج أن الطاقم نفسه يحدد أسلوب الترتيب. وإذا ما كانت الحروف مبعثرة في الجدول فإن الترتيب سيكون ذي إشكالات عديدة وخاصة إذا ما أخذ شكل الحرف حسب موقعه في الجدول كما هو الحال في الطاقم الخاص بشركة ا.ب.م المرقم 864. كما أن مواقع الحروف الخاصة (الهمزة والتاء المربوطة والألف المقصورة والكشيدة) كلها تختلف من طاقم لآخر مما يولد ترتيبا مختلفا عند استعمال طاقم معين عن الطاقم الآخر. ويجدر بالإشارة إلى أنه لحد الآن لم يتم عمل برنامج للتحاور باللغة العربية مع الشبكة العالمية Internet وهذا البرنامج له ضرورة بالوقت الحاضر لتطوير التحاور ونقل البريد الإلكتروني بدون استخدام أنظمة التعريب الأخرى. |
6- الرمز الدولي الموحد Unicode إن أكثر نظام انتشارا في ترميز الحروف والرموز هو نظام ANSI للحروف اللاتينية (وهو موضوع من قبل معهد المقاييس الأمريكية (American National Standards Institute وهو مناسب للغات المستخدمة للحروف اللاتينية. وقد تمت استعارة قسم من المواقع المخصصة للزخرفة Graphics لوضع الحروف العربية (أو غيرها من الحروف عند استخدام أنظمة ثنائية اللغة) مع المحافظة على مواقع الحروف اللاتينية. وقد وجد أن هناك لغات كالصينية والكورية واليابانية يزيد عدد الحروف فيها عن عشرة آلاف حرف وبذلك لا يصلح نظام ANSI لها. كما أن أي نظام ثنائي اللغة ليس بينهما إحدى اللغات المستخدمة للحروف اللاتينية يعني أن تحل حروف إحداهما محل الحروف اللاتينية وبذلك تغير موقعها المستخدم عند استخدامها مع الحروف اللاتينية. هذا بالإضافة إلى أن هناك كثيرا من الرموز الرياضية والتقنية الحديثة التي وجدت ضرورة لتحديد مواقع لها في طواقم الحروف. وكل ذلك يزيد عن العدد 256 المخصص ضمن بايت byte واحد ذي ثماني أرقام ثنائية (8 bits). ولغرض تلافي هذا الإشكال فقدت اتفقت عدة شركات عالمية على تشكيل منظمة عالمية غير ربحية سميت منظمة الرمز الموحد Unicode لغرض تعريف نظام قياسي عالمي يمكنه أن يضم كافة الحروف المستخدمة في كافة لغات العالم الحية (وحتى المنقرضة منها كالمصرية القديمة والسنسكريتية). كما أن المنظمة العالمية للتقييس ISO بدأت بتطوير نظام للتقيس المناسب لذلك. وهكذا تكون الرمز العالمي الموحد Unicode. 6-1 اللغات غير العربية المستخدمة للحروف العربية يبين الشكل (10) البلاد المستخدمة للحروف العربية وتشمل بالإضافة للبلدان العربية أفغانستان، وإيران، ومالطا، والهند، وباكستان، وإقليم كينيانج في الصين، وكازخستان، وتترستان، وهاتان اللغتان بالرغم من صلتهما الوثيقة باللغة التركية إلا أنهما لا تزالان تستخدمان الحروف العربية رغم أن تركيا تستخدم الحروف اللاتينية. أما ماليزيا، وإندونيسيا، والصومال فإنها رغم استخدامها للحروف اللاتينية إلا أن هناك صحفا تستخدم اللغة العربية في ماليزيا وجاوا. وفي إفريقيا فإن اللغات البربرية، والهوسا، والسواحلية تستخدم الحروف العربية أحيانا. ويبين الشكل (11) أبجديات بعض اللغات غير العربية التي تستخدم الحروف العربية. فبالرغم من أن الأبجدية العربية تحوي 28 حرفا، إلا أن اللغات التي تستخدم الحروف العربية تحوي أبجدياتها حروفا فوق الحروف العربية الثمانية والعشرين وبعضها مشتق منها. فالفارسية تحوي 32 حرفا، والأُردية تحوي 36 حرفا، والسندية تحوي 52 حرفا. كما تحوي لغة الباشتو المستخدمة في أفغانستان وإقليم بلوجستان في الباكستان على 10 حروف إضافية، كما تستخدم لغة اليوغر المعروفة في شمال غرب الصين على 10 حروف إضافية .... وهكذا. 6-2 الحروف العربية وما يشتق منها في الرمز العالمي الموحد أصدرت منظمة Unicode الرمز العالمي الموحد الذي يحوي على 65536 حرفا وقد تم تخصيص حوالي 34000 حرفا منها للغات الحية. ويبين الشكلان (12) و (13) جدولي الحروف العربية الأصلية والحروف المشتقة منها المستعملة في غير العربية. ويلاحظ أن الجدول يحوي ستة أشكال للهمزة والحروف الأبجدية الثماني والعشرين يتخللها حرف التاء المربوطة بين الباء والتاء وحرف الألف المقصورة بين الواو والياء. والكشيدة قبل الفاء. وأدوات التشكيل الثمانية ً ٌ ٍ َ ُ ِ ّ ْ. كما تحوي على الأرقام المستعملة في المشرق العربي وتحوي كذلك حرفين آخرين لهما أهميتهما وهما الألف الخنجرية وهمزة الوصل. أما باقي الأحرف في الشكل (12) فهي ليست مستخدمة باللغة العربية بل باللغات الأخرى المستخدمة للغة العربية. ويتضح أن الأحرف هذه تحتل المواقع من 0600 في الجدول العالمي الموحد إلى 067F للجدول الأول ومن 0680 إلى 06FF للجدول الثاني كما خصصت المواقع من 0700 لغاية 08FF لأية تطورات في الحروف العربية وذات الصلة بها وهي الآن فارغة (احتياطية). 7- الوضع الراهن للحروف العربية في الحاسوب هناك أربعة مجالات مختلفة للعلاقة بين الحروف العربية والحاسوب. وهي مجال إدخال المعلومات ومجال إخراجها ومجال معالجتها والجانب الجمالي للحرف العربي. ورغم الترابط بين هذه المجالات إلا أن لكل منها خصوصيات خاصة بها. 7-1 إدخال المعلومات والحرف العربي هناك طريقتان لإدخال المعلومات المكتوبة للحاسوب هما عن طريق لوحة المفاتيح keyboard وتمييز الحروف ضوئيا المعروفة بـ OCR. ففيما يتعلق بلوحة المفاتيح يجب أن تحوي هذه اللوحة على كل الإمكانيات الخاصة بالإدخال فهي يجب أن تحوي الحروف الثماني والعشرين والهمزة بأشكالها والتاء المربوطة والألف المقصورة وأدوات التشكيل الثمانية والأرقام العربية وربما الألف الخنجرية وهمزة الوصل. وليس هناك أية لوحة مفاتيح تحوي هذين الحرفين في الوقت الحاضر. إلا أنه يلاحظ أن هناك إمكانية في لوحات مفاتيح متعددة لإدخال اللام ألف جملة واحدة بل وبأشكال متعددة: لا لأ لإ لآ. ورغم أن برامج التعريب تأخذ بنظر الاعتبار تحويل اللام ثم الألف إلى لام ألف غالبا، إلا أن إدخال اللام ألف جملة واحدة عملية لا بأس بها في تسهيل الإدخال. ولا بأس أن تحوي لوحات المفاتيح أية مجموعات من الحروف لتسهيل الإدخال مثل ألف لام التعريف. ويلاحظ في الإدخال أنه يجب أن يكون متوافقا مع الرموز التي يتعامل بها الحاسوب داخليا إلا أنه لا يشترط شكل واحد للوحة المفاتيح. وقد لوحظ هناك اختلافات في مواقع بعض الحروف كالدال والذال والطاء وأدوات التشكيل بين لوحة مفاتيح وأخرى. ولذلك ينبغي أن يكون هناك توافق أكبر في لوحات المفاتيح الحاسوبية تسهيلا لعملية الإدخال. ولكن الأكثر ضرورة هو تحديد الحد الأدنى من الحروف المتفق عليها ومواقعها. أما أجهزة تمييز الحروف العربية OCR فقد ظهرت مؤخرا أربعة برامج منها(10). وهذه الأجهزة تقوم بعملية مسح (scanning) للصفحة المطلوب تمييز حروفها ثم تقوم بمطابقة الحروف حرفا حرفا مع ما مخزون بداخلها من نماذج سبق أن دربت عليها. وبعضها يحوي إمكانيات أوسع من ذلك دون الحاجة إلى تدريب. لقد تطورت أجهزة تمييز الحروف اللاتينية إلى درجة إمكانية تمييز الكتابة اليدوية. أما في اللغة العربية فان البرامج المتوفرة لحد الآن تنحصر دقتها في الخطوط الطباعية الجيدة والحديثة الطباعة. أما الكتابة القديمة فإن تمييزها لا يزال صعبا.وليس هناك أية برامج بإمكانها تمييز الحروف المكتوبة بخط اليد بعد. يمكن النظر إلى الحروف العربية كمجموعات تتألف من 15 مجموعة كما مبين في الشكل (14) فالجيم والحاء والخاء مثلا لا تمييز بينها إلا بالنقط. وهذا التقسيم يسهل عملية التمييز، وبالطبع اذا ما أريد له ان يكتمل فيجب أن يحوي الهمزات وأشكال اللام ألف والتشكيل وغير ذلك. إن تمييز الحروف العربية ذو علاقة وثيقة بأشكال طباعة الحروف مطبعيا وهذا يخضع لمسألة جمال الخط العربي والتي ستناقش فيما بعد. 7-2 إخراج الخط العربي إن متطلبات إخراج الخط العربي من حيث عدد الحروف لا يختلف عن متطلبات الادخال فالقراءة هي لخط مكتوب والكتابة هي عكس عملية القراءة. أما من ناحية جمال الخط العربي فهي مسألة أخرى. إلا أن هناك جملة أمور تتعلق بأسلوب الكتابة العربية. فقد كانت الحروف المطبوعة أول استخدام الحاسوب ذات شكل واحد مع إضافة التعريقات أحيانا، ثم أدخل عليها تحسين جوهري بتمييز شكل الحرف في أول الكلمة أو وسطها أو آخرها أو الحرف المنفصل. وكان عرض الحرف مبدئيا متساو فالصاد المنفصلة كانت تحتل عرضا مساويا للباء الوسطية مثلا. وبتطور تقنية الطباعة (والإخراج على الشاشة) أمكن تخصيص عرض مختلف حسب الحاجة لكل شكل من أشكال الحروف. أما التشكيل فقد كان يعتبر حرفا له عرض الحروف الأخرى سواء كان مع الكشيدة أو بدونها (مثلا الفتحة وسط الكلمة تحتاج إلى كشيدة أما الفتحة على حرف غير متصل من جهة اليسار مثل الواو فلا تحتاج إلى كشيدة). وهكذا برزت الحاجة إلى صورتين للتشكيل إحداهن مع الكشيدة والأخرى بدونها. إلا أن تطور تقنية معالجة المعلومات بتغيير عرض الحرف مكن من وضع التشكيل فوق الحرف السابق مباشرة، بل وأمكن دمج الشدة مع الفتحة والضمة والكسرة ذاتيا، فكلما وردت شدة بعدها فتحة مثلا دمجتا ووضعتا فوق الحرف السابق. وهكذا يظهر باب الإخراج مختلف عن الإدخال. ففي الإدخال يجب إدخال الحرف ثم الشدة ثم الفتحة بينما عند الإخراج يظهر الحرف وفوقه الشدة وفوقها الفتحة. وهذا تطور لا بأس به في جمال الكتابة العربية. 7-3 جمال الكتابة العربية مع تطور تقنية الطباعة وإظهار الكتابة على الشاشة بدقة أعلى، ظهرت تقنيات خاصة بالحروف (اللاتينية وغيرها). وأحد هذه التقنيات ما سمي بالنوع الحقيقي للفونط True Type Font ويرمز له بـ (TTF) وتستند هذه التقنية على أساس خزن المواصفات العامة للحرف المطلوب إظهاره مهما كان حجم الطباعة أو الإظهار على الشاشة المطلوب فالشكل يبقى كما هو مهما كان الحجم. ويمكن بواسطة هذه التقنية إظهار حروف متلاصقة وبأية أشكال يرتأيها الخطاطون. يبين الشكل (15) أحد جداول الخطوط العربية لشركة مايكروسوفت المسمى بالخط العربي التقليدي، ويلاحظ فيه وجود موقع لمجموعات من الحروف المتلاصقة المكونة من حرفين مثل (محـ، ـبن، نجـ.. الخ). وهكذا بإمكان الخطاط أن يضع ما يريد من مجموعات حرفية تزيد من جمال الخط، ولكن يجب أن تبرمج بنسق معين لكي يقوم الحاسوب بإخراج هذه المجموعة من الحروف بالصيغة المطلوبة كلما تمت مصادفتها أثناء الكتابة. وقد ظهرت مؤخرا أشكال جميلة للكتابة العربية بخطوط مختلفة قامت باصدارها بيوت البرمجة العربية في لبنان والسعودية ومصر وأخرى في الدول الغربية. يبين الشكل (16) سورة الفاتحة مكتوبة بالرسم العثماني للقرآن الكريم، ويلاحظ فيها وجود أكثر من نوع للميم في آخر الكلمة وكذلك النون. إضافة إلى أي شكل من أشكال الحروف كالألف الخنجرية وهمزة الوصل بل وإضافة علامات الوقف والتجويد.. الخ. كما أن الهمزة المكسورة توضع تحت الكلمة (مثل الملـبكة). إلى غير ذلك من خصوصيات كتابة المصحف. 7-4 معالجة اللغة العربية داخليا في الحاسوب سبق وأن أوضحنا أن الحروف العربية يرمز لها برمز واحد داخل الحاسوب وهذا الرمز يتطابق مع موقع واحد على لوحة المفاتيح. أما الإخراج فيمكن أن يظهر مختلفا حسب موقع الحرف من الكلمة. ومن ذلك يظهر أنه ليس من الضروري تطابق شكل الحرف عند الإدخال مع ما مخزون داخل الحاسبة مع ما يطبع. فاللام ألف ليس لها موقع في جدول الحروف العربية ولكنها تظهر كحرف واحد عند الطباعة وقد يكون إدخالها دفعة واحدة أو بالكبس على اللام ثم الألف حسب لوحة المفاتيح. وهذا المقدار من الذكاء الداخلي موجود في بعض أنظمة التعريب حاليا. إلا أن هناك امور كثيرة لا تزال بحاجة إلى عناية حيث أن هناك قصورا في معالجتها وسنأتي على ذكر بعض منها. 7-4-1 ترتيب الحروف العربية عمل بعض علماء اللغة العرب القدامى على ترتيب حروف المعاجم العربية حسب مخارج الحروف. وهناك لا شك الترتيب الهجائي المعروف (ا ب ت ...) والأبجدي ( ا ب ج د هـ و ز ...). لقد وضعت معظم طواقم الحروف العربية التي سبق ذكرها بالاستناد إلى الترتيب الهجائي (ا ب ت ...) إلا أن هناك اختلافات متعددة فيما يتعلق بوضع فجوات بينها تضم رموزا أو حروفا غير عربية كما أن الحروف الإضافية (كالتاء المربوطة والألف المقصورة وأشكال الهمزة .. الخ) كلها غير مجمع على عددها ولا على مواقعها في الطواقم. كما أن التشكيل الذي تعتبره الحواسيب حروفا مستقلة هو الآخر موضوع بتسلسل مختلف بين طاقم وآخر. إن تأثير وضع الحروف حسب تسلسل معين يؤثر في ترتيب كلمات تضم تلك الحروف. فإن موقع التاء المربوطة (قبل التاء الطويلة أو بعدها) يؤثر على ترتيب كلمات مثل (قائمة، قائمتان). كما أن ترتيب الهمزة يؤثر في كلمات مثل ( فاني، فأنك، فإنما، فآت، فئته) فرغم أن الكلمات هذه تحوي ألفا أو همزة تلي الفاء إلا أن ترتيبها يخضع لتسلسل ترتيب أنواع الهمزات في طواقم الحروف المختلفة. وكذلك الحال بالنسبة للتشكيل، فالفتحة مثلا تسبق الضمة في بعض الطواقم، ويعني ذلك أن الكلمات المحتوية على حرف مفتوح يسبق الكلمة نفسها التي فيها حرف مضموم حتى ولو كان الحرف الذي يلي المضموم قبل الحرف الذي يلي الحرف المفتوح في الكلمتين. مثال على ذلك كلمتي ( قَفَلَ تسبق قُتِل لأن القاف الأولى تليها الفتحة ثم الفاء بينما القاف الثانية تليها الضمة ثم التاء والفتحة قبل الضمة رغم أن التاء تأتي قبل الفاء!! رغم أن ترتيب هاتين الكلمتين يكون صحيحاً بدون تشكيل). والحال تتكرر بالنسبة للشدة فهي تعتبر حرفاً مستقلاً شأنه شأن أدوات التشكيل الأخرى ولا يعتبر تكراراً للحرف الذي سبقه. لا شك أن بعض المشاكل التي صاحبت هذه الوضعية هي مستحدثة ليس لها حلول لغوية قديمة، حيث نجم بسبب التطورات التقنية الحديثة وبعضها ربما له حلول لغوية قديمة لكن عدم إحياء تلك الحلول جعل الاجتهادات المختلفة الحديثة تتجه اتجاهات متباينة. 7-4-2 أنواع الألف في الأطقم المستعملة في الوقت الحاضر هناك الألف اللينة والألف المقصورة وفي الرمز الدولي الموحد هناك اختيار للألف الخنجرية التي لم تستعمل بعد في الأنظمة المشهورة وهي مطلوبة في الكتابة غير المشكولة لكلمات عديدة مثل (الله، الرحمن، إله، ذلك، هؤلاء، هذا، .. الخ) كما أن هناك خلطاً في الكتابة العادية بين الألف اللينة والألف المهموزة عند غياب التشكيل. إن عمل أي ترتيب أو إحصاء لأعداد الحروف في نص معين سيعطي نتائج متباينة حسب الطاقم المستعمل وعند الخلط مع الألف المهموزة. كما أن الألف المقصورة والألف اللينة الآن تعتبران حرفين مستقلين لا علاقة بينهما. إن دخول النحو والصرف العربي في مجال معالجة اللغة العربية في الحاسوب سوف يبرز مشاكل عند قلب الحرف نفسه من شكل لآخر، وكمثال على ذلك كلمة عصى عند إضافته إلى ضمير الغائب تصبح عصاه. كما أن الأنظمة المتوفرة في الوقت الحاضر يمكن أن تؤدي إلى لبس عند الضغط علىمفاتيح (ع ص ى ه) سوف تظهر الكلمة (عصىه) وذلك نتيجة خلو الحاسوب عن ذكاء يتعلق بالأف المقصورة واتصالها مع غيرها . كما أن هناك نقصاً في همزة الوصل حيث تعتبر ألفاً. أما (ألف واو) الجماعة التي لا تلفظ بل تكتب فقط، فهي تعتبر ألفاً عند الترتيب والتشكيل والإحصاء وهو أمر قد يحتاج إلى تفكير وإعادة نظر. 7-4-3 أنواع الهمزات تتوفر في معظم الطواقم الآن الهمزة المنفردة ء والهمزة على كرسي الياء بأشكالها الأربعة ئـ ـئـ ـئ ئ والهمزة على كرسي الواو بشكليها ـؤ ؤ والهمزة مع الألف بأشكالها الأربعة أ إ ـأ ـإ فالهمزة فوق الألف تستعمل للضم والفتح، وتحت الألف للكسر. وبذلك يحصل التمييز بين الهمزات وفق تشكيلها بخلاف باقي الحروف حتى وإن كان التشكيل غائباً! وهو أمر فيه بعض الغرابة. أما الهمزة الممدودة بشكليها آ ـآ فتعني حقيقة همزة مع ألف لينة (ء ا) كما أن الهمزة فوق وتحت الألف عند ورودها بعد اللام تصبح لام ألف كما سيرد ذكره. 7-4-4 اللام ألف تتفق طواقم الحروف العربية تقريباً ( فيما عدا ا.ب.م 864) على أن اللام ألف تعتبر في الطاقم حرفين حتى وإن أدخل الحرفان بواسطة مفتاح واحد معنون (لام ألف). وهناك عدد من المفاتيح المخصصة للام ألف هي لا، لأ، لإ، لآ وتظهر هذه الحروف بشكلين (منفصل ومتصل أي لا و ـلا و ـلأ و ـلإ الخ ). إلا أن كل أنظمة التعريب الحالية تفشل في خدمة اللام الف خدمة مناسبة عند وجود تشكيل على اللام فإذا ما أدخلت الحروف (ل َ ا ) فالناتج على الحواسيب حاليا يظهر (لَــا) وهو شكل غير مقبول ويستدعي الإصلاح رغم أن إدخال (ل ا) يعطي الشكل المقبول (لا) في معظم أنظمة التعريب الحالية. ولإصلاح الوضع ينبغي دراسة وضع التشكيل على اللام والألف وأحوال الألف المهموزة وغير المهموزة، وعند إمعان النظر في ذلك يتضح أن هناك حالات كثيرة ولعل جدول (1) يوضح كافة الحالات سواء الممكنة منها في اللغة العربية أو غير الممكنة التي أشير إليها بالرمز *. ولغرض معالجة تشكيل اللام ألف فإن من الجدير أخذ ما يأتي بنظر الاعتبار: أ) إبقاء المفاتيح الأربعة الخاصة باللام ألف كما هي لاستعمالها عند عدم التشكيل. ب) عندما يراد إدخال التشكيل يدخل اللام والألف كحرفين منفصلين بينهما التشكيل المطلوب مثلا لكتابة كلمة كلا تدخل ( ك َ ل ّ َ ا) فتظهر كلا أي الشدة والفتحة فوق اللام وليس الألف. وهكذا بالنسبة للهمزة فوق الألف أو تحته مع التشكيل الخاص بها. جـ) يقترح على مصممي الأنظمة أن تدخل معالجة اللام والألف بحيث تسمح للمدخل ان يدخلها كما يشاء من ناحية التشكيل على أن يترك للمدقق الإملائي أو برامج التشكيل الآلي إلغاء الحالات غير الممكنة في اللغة العربية. 7-4-5 التاء المربوطة التاء المربوطة هي تاء عند اتصالها بضمير بعدها (مثل نكرة نكرتين) ولكن بعد انقلاب التاء المربوطة إلى تاء طويلة لا يعرف الحاسوب أصلها. فإذا ما أجريت لها عمليات تحليل صرفي أو نحوي فان أصلها سيكون مجهولا ما لم يتم الرجوع إلى المعاجم. كما أن المعالجة الحالية غير مناسبة عند إدخال التاء المربوطة وبعدها حرف فإن الكتابة تكون غير مناسبة (مثل نكرةين). لذلك فإن من الضروري إدخال نوع من الذكاء لمعالجة التاء المربوطة شأنها شأن الألف المقصورة. 8- المناقشة والتوصيات 8-1 تطوير الوضع الحالي مرت رحلة إدخال الحروف العربية إلى الحاسوب بجملة تطورات ظهرت أثناءها اجتهادات شتى في أسلوب معالجة الحروف العربية، وقد ساهمت الجهات العربية في الوصول إلى بعض الحلول المناسبة إلا أن الشركات الأجنبة الكبرى لا يزال لها التأثير الكبير في فرض المنهج الذي تتبعه في معالجة الحروف العربية وفلسفة تعريب الحاسوب بشكل عام ونظرا لعدم وجود مرجعية عربية قياسية واحدة، فإنه ربما يمر زمن ليس بالقصير حتى تصل الأمور إلى أسلوب مناسب. إن عدد الحروف العربية الأدنى المطلوب لمعالجة الحروف العربية يجب أن يشمل: أ) الحروف العربية التماني والعشرين بأشكال كتابتها المختلفة أول الكلمة ووسطها وآخرها ومنفصلة. ب) التاء المربوطة والألف المقصورة. جـ) الهمزة بأشكال كتابتها المختلفة ء ئـ ـئـ ـئ ئ ؤ ـؤ أ إ آ ـأ ـإ ـآ. د) الكشيدة. هـ) همزة الوصل ا ـا وهي غير مستعملة لحد الآن. و) الألف الخنجرية وهي غير مستعملة لحد الآن . ز) أدوات التشكيل وهي ً ٌ ٍ َ ُ ِ ّ ْ مع إمكان الجمع بين الشدة وأدوات التشكيل التي سبقتها. ح) اللام ألف ليست حرفاً واحدا له موقع، لكنه مكون من حرفين في النص. أما الإدخال فلا بأس بان يدخل بالكبس على مفتاح واحد. ويمكن أن يكون له أشكال متعددة لا ـلا لأ ـلأ لإ ـلإ لآ ـلآ. كما أن تشكيل اللام والألف يجب أن يكون بالإمكان إدخاله وإظهاره بشكل مناسب فهذا غير موجود لحد الآن. إن المناقشة أعلاه ما هي إلا تثبيت للوضع الحالي مع إجراء التحويرات والتعديلات المناسبة والضرورية عليه، حيث أن التشكيل في كل هذه الحالات يعتبر حرفاً مستقلا بل وإن الشدة مع الفتحة بعد الحرف ستجعل الحرف المشكول ثلاثة حروف داخل الحاسوب. 8-2 مقترح لمعالجة التشكيل كما أن الحرف العربي المشكول يعتبر في اللغة العربية حرفاً واحداً، ألا يحق لنا أن نتساءل لماذا لا يمكن اعتبار الحرف المشكول حرفاً واحداً في الحاسوب؟ وللأجابة على ذلك فإنه يتبادر للذهن أن المواقع المخصصة في البايت الواحد البالغة 256 موقعاً لا تكفي لتمثيل الحرف مع تشكيله. ولكن ألم تقم الشركات العالمية باستحداث الرمز الدولي الموحد Unicode لتمثيل الحروف لكل اللغات بحيث يمثل الحرف الواحد ستة عشرة رقما ثنائيا (16 bits) فلماذا لا يمثل الحرف العربي لغرض التشكيل بستة عشر رقم ثنائي، وعند ذلك يمكن أن يضم الرمز ما يأتي: أ) الحروف العربية الثماني والعشرين مع أشكال الهمزة والتاء المربوطة والألف المقصورة وهمزة الوصل والألف الخنجرية وعددها لا يزيد عن 64 رمزاً أي 6 أرقام ثنائية (6 bits). ب) أدوات التشكيل منفردة ومجتمعة مع الشدة ويمكن أن يخصص لها أربعة أرقام ثنائية (4 bits) حيث أن عددها لا يزيد عن 16. جـ) رمز يشير إلى الحالة اللفظية للحرف مثل (ألف واو) الجماعة. د) رمز يشير إلى أصل الحرف أنه كان منقلباَ عن حرف آخرمثل التاء الطويلة التي أصلها تاء مربوطة أو الألف اللينة التي كان أصلها ألفا مقصورة. هـ) طالما أنه هناك متسع فمن الممكن أنه تكون الحروف المذكورة في الفقرة (أ) بشكل واحد ويرمز إلى شكل كتابتها (خاصة الهمزة وأنواع الألف) بحيث يشار بعدد من الأرقام الثنائية (ثلاثة أو أربعة مثلاً) إلى شكل كتابتتها (على كرسي الياء أو الألف أو منفردة .. الخ). إن هذا المقترح يناسب الحالة المشكولة للغة العربية وأية معالجة صرفية أو نحوية. ويجب أن يأخذ بنظر الاعتبار المحافظة على الاتساق مع الكتابة غير المشكولة دون تعارض. قد يبدو هذا متناقضا مع الرمز الدولي الموحد، ولكن الحل المتفق مع الرمز الدولي الموحد سيؤدي بنا إلى استعمال 48 رقم ثنائي لتمثيل الحرف المشكول بشدة مع فتحة مثلاً، أي أن الحجم سيكون ستة أضعاف الحجم الحالي للكلمة غير المشكولة. أليس ذلك يستوجب حلاً؟ هذا المقترح مطروح للمناقشة من قبل ذوي الاهتمام باللغة العربية والحاسوب لعل حلاًمناسباً يتبلور ويأخذ طريقه في الدخول إلى حواسيب القرن الحادي والعشرين والتي ستكون أكثر ذكاء من حواسيبنا اليوم. ...والله الموفق |
الساعة الآن 01:21 AM. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. منتديات المُنى والأرب
جميع المشاركات المكتوبة تعبّر عن وجهة نظر كاتبها ... ولا تعبّر عن وجهة نظر إدارة المنتدى |