"علاّم" السعودية يجمع أشتات العربية في 500 مليار كلمة

آخر تحديث 2024-09-15 15:00:05 - المصدر: اندبندنت عربية

نموذج "علام" طور تقنية لتطويع اللغة العربية لاستخدامات الذكاء الاصطناعي (واس)

إذا كان فرسان العربية الأوائل مثل الأصمعي والفراهيدي بذلوا كل الوقت والجهد في سبيل جمع أشتات مادتها من جذورها الأصلية قبل أن تتحول لاحقاً إلى معاجم وأسفار، فإن أحفادهم السعوديين حاولوا المضي على الخطى نفسها في سياق آخر، هو مسابقة الزمن إلى توليد ذلك الإرث الضخم بواسطة "الذكاء الاصطناعي" ليكون طوع العربي المعاصر وكل المستخدمين، ليس نيابة عن امرئ القيس والأعشى وشعراء المعلقات وسيبويه وحسب، ولكن كذلك على طريقة بيكاسو ومايكروسوفت و"تشات جي بي تي" وأخواتها.

وكشف عبدالله الغامدي رئيس الهيئة السعودية للذكاء الاصطناعي "سدايا" التي أشرفت على بناء نموذج "علام"، أن ما جمع من البيانات في هذا الصدد "قد يكون الأكثر في تاريخ اللغة العربية، إذ بلغ مجموعه 500 مليار كلمة، ليس فقط جمعت، ولكن تم تدريب النموذج عليها، من خلال صياغة الأسئلة والأجوبة، وما يسمى ضبط الدقة الموجهة لتسريع النموذج ورفع جودته بمشاركة 400 خبير من حقول معرفية عدة".

وكشف الغامدي أن النموذج الذي أصبح تطبيقاً على غرار "تشات جي بي تي" ولا يزال طور الإطلاق، يتوفر على 12 مهارة وقدرة، تغطي 24 مجالاً أساسياً مثل العلوم والاقتصاد والسياسة، إلى جانب ثمانية مجالات فرعية مثل الثقافة الإسلامية والتاريخ وغيرها، مشيراً إلى أن قدراته سيكون من ضمنها على سبيل المثال، "التلخيص، وكتابة الشعر، وقياس الأداء والتقييم"، فضلاً عن عدد من المهارات التي قدر المسؤول السعودي أنها ستقدم خدمة فائقة في الدقة وتوفير الجهد على الأجهزة الحكومية وأيضاً المستخدمين.

بماذا يختلف "علام" عن تطبيقات الذكاء؟

ولدى تجربة "اندبندنت عربية" استخدام نموذج "علام" الذي أصبح موجوداً على متاجر الهواتف الذكية، تبين أنه لا يزال غير متاح للاستخدام المباشر، فعند تحميله وتوثيق دخوله عبر منصة "نفاذ" السعودية الرقمية، يقدم لك الانضمام إلى لائحة الانتظار، خياراً لمن يرغب في استخدامه مستقبلاً، أسوة بمنصة "تشات جي بي تي" في مرحلته الأولى، إضافة إلى عدد من الأسئلة الشائعة والأجوبة المستفيضة عن قصة النموذج الذي أوضحت الجهة المصممة أنه سيمكنها من إخراج عدد من التطبيقات التي تخدم القطاعات في السعودية والمنطقة العربية.

ويتميز التطبيق وفق ما يقول عن نفسه إنه "يوفر مصدراً معرفياً شاملاً وموثوقاً للباحثين والمهتمين بالمعرفة في مجالات متنوعة مثل التاريخ والعلوم والثقافة والصحة والتعليم عبر استخدام تقنيات الذكاء الاصطناعي التوليدي"، كما أنه لا يقتصر على المتحدثين باللغة العربية الفصحى، ولكن أيضاً يفهم اللهجات العامية السعودية المتعددة ونظيرتها في الدول العربية إلا أنه يؤكد أن "الفصحى" ستبقى لغة إجاباته الرئيسة.

والأهم من ذلك في نظر كثيرين أنه "يعتمد على مصادر معلومات موثوقة من المملكة والعالم العربي، ويشمل مئات الملايين من المقالات المتخصصة في مجالات متنوعة" التي أعاد الخبراء هندستها من خلال تدريب "علام" على توظيفها وإعادة تقديمها بالطريقة التي تناسب المستخدم الذي يراهن التطبيق على التنبؤ أفضل من غيره بما سيطرحه من الأسئلة إن كان عربياً أو مسلماً، كما أنه سيكون مجانياً.

لن يقترح على الباحث "شرب المسكر"

ولدى سؤال أحد المهندسين العاملين في المشروع هشام اليحيى عن أمثلة حول ذلك، كشف في حديث مع "اندبندنت عربية" أن التطبيق رغم أنه أصبح جاهزاً إلا أن التحديات التي واجهها لا تزال قائمة، فمثلاً موضوع اللهجات السعودية لا تزال قدراته فيه محدودة، بسبب عدم توفر قاعدة معلومات كافية لإغناء التجربة.

أما عن الأمثلة التي يتفوق فيها التطبيق مقارنة بمنافسيه، فهو أنه يفكر بطريقة عربية وإسلامية، "فإذا سألته على سبيل المثال، إنني صليت المغرب وأريد أن أشرب، فماذا تقترح علي؟ فإنه لن يقول لك: اشرب ويسكي، أو بيره، ولكن سيقترح عليك أي مشروب حلال مثل الماء أو اللبن، لكنه في الوقت نفسه قد لا تكون إجابته: عليك أن تشرب زمزم، فهو يفهمك".

وعند اختبار اللهجات المحلية، سألناه بالعامية "وشو حمار القايله"؟ فأجاب بما يعني أنه "مثل شعبي في منطقة الجزيرة العربية".

اقرأ المزيد

يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)

وتفيد الجهة المبرمجة أن النموذج قادر على إعراب الجُمل العربية بشكل دقيق، مع تطوير نموذج يساعد الأطفال على تعلم اللغة العربية بطريقة ممتعة وفعالة، وتطوير نموذج ذكاء اصطناعي يقوم بمحاكاة وعمل حوار مع شخصية عربية أو محاكاة أسلوب الكتابة لهذه الشخصية، وبذلك يمثل تطبيق "علام" الذي أدرج على منصة "WatsonX" التابعة لشركة IBM""، أحد أبرز النماذج اللغوية للذكاء الاصطناعي التوليدي الذي يخدم الناطقين باللغة العربية في أنحاء العالم، وفق وكالة أنباء "واس" السعودية.

العربية بوصفها "لغة حية متداولة"

 الهدف الأكبر من "علام" كما يرى مهندسوه، خدمة اللغة العربية وتسخير تقنيات الذكاء الاصطناعي لتحسين تطبيقاتها التقنية، مما يعزز من مكانتها كلغة حية ثرية متداولة على جميع الصعد، وهي جهود بدأتها الرياض في وقت مبكر، مما دفع أحد رواد خدمة اللغة العربية في مجال التقنية الكويتي محمد الشارخ قبل وفاته أخيراً إلى تسليم راية خدمتها لوزارة الثقافة السعودية، عند تمكينها من إحدى عصارات جهده الممتد "معجم صخر المعاصر"، وهو بذلك كمن يسلم الأمانة إلى من يصون حماها، إذ رفض عروضاً كثيرة من قبل ذلك حتى من "أبل" وأسطورتها ستيف جوبز لأسباب عدة شرحها، أخيراً، على برنامج "الليوان" السعودي قبل عامين، الذي يقدمه الزميل عبدالله المديفر على "روتانا خليجية".

ويعد "معجم صخر المعاصر" الذي انتقلت قبل نحو عام حقوق الملكية الفكرية الخاصة به إلى السعودية، مشتملاً على المادة اللغوية المعاصرة وتطبيقاتها المتوائمة مع مبادئ الصناعة المعجمية الحديثة، وقدرتها على تحديد الأهداف وتعيين المصادر واختيار المادة وترتيبها وتفسيرها وشرحه، وعرضها الميسر للمستخدمين، مما جعله مؤهلاً ليكون أحد المصادر الرئيسة في تغذية تطبيق "علام" الوليد الذي يعد "تشات جي بي تي" العرب الأوسع نطاقاً.

ومنذ إطلاق "جي بي تي" ظهر منافسون إقليميون عدة حظوا بشعبية مماثلة بين المتحدثين بالعربية، يساعد في ذلك كون العربية واحدة من أكثر اللغات شيوعاً في العالم، مع أكثر من 400 مليون متحدث عالمياً، ولكن يشير بعضهم إلى أن اللغة العربية تتأخر في مواكبة التكنولوجيا المصممة خصيصاً لمتحدثيها، إلا أن حال تمدد تقنية الذكاء الاصطناعي في المنطقة تشير إلى حدوث العكس هذه المرة، ولذلك تبذل الشركات المتخصصة مجهوداً لإنشاء منصات عربية متقدمة في مستوى أدائها، مثل "جيس" الإماراتي و"علام" السعودي.

كيف جمعت اللغة العربية؟

لكن قبل ذلك ليس جديداً على العرب تتبع آدابها ولغاتها وتكييفها مع العصر، إذ خلدوا في مناهجهم الدراسية حتى اليوم الآباء المؤسسون لذلك النهج أبو عمرو بن العلاء والخليل بن أحمد ويونس بن حبيب والأصمعي وأبو زيد الأنصاري إذ كانوا أئمة اللغة بلا منازع امتازوا من دون سائر الرواة بما حفظوه منها.

 سار على طريقة أولئك المؤسسين آخرون في العصور المتأخرة أمثال الأنثروبولوجي السعودي سعد الصويان الذي كرم أخيراً في بلاده لقاء موسوعاته العلمية التي تتبع فيها الأمثال والقصائد والأساطير الشعبية من بوادي السعودية، حتى جمع فيها أجزاء ضخمة، من بين أجلها "حداء الخيل" و"الصحراء العربية" و"أيام العرب الأواخر" و"فهرست الشعر النبطي"، ومثله مواطنه الراحل عبدالكريم الجهيمان الذي تخصص في جمع الأمثال، والرحالة الأكبر محمد بن ناصر العبودي الذي ورث المكتبة العربية مما يزيد على 200 مؤلف.

ويروي المفكر المصري الراحل أحمد أمين قصة التحول في تدوين اللغة وحفظها، قائلاً في كتابه "فيض الخاطر"، إن المثقفين في العهد الأول وصدر من الدولة العباسية "لا يلتفتون إلى جمع اللغة، فاللغة تؤخذ من أفواه العرب، ومن شاء أن يتعلمها فليتعلمها من بادية البصرة والكوفة في العراق، أو بادية العرب في الشام، فكان ابن المقفع وبشار بن برد مثلاً يخرجان إلى هذه البادية ويقيمان فيها ويتعلمان ما طابت لهما الإقامة، شأنهم في ذلك شأن الطفل ينشأ بين أبويه وقومه، ويتثقف بثقافتهم، وينطق لسانه بلغتهم، وهذا هو التعلم الطبيعي للغة".

من الحديث إلى اللغة

 جاءت موجة التدوين، في فترة لاحقة عندما "تخصصت كل فرقة لعلم، فقوم للفقه، وآخرون للنحو، اشرأب قوم لجمع اللغة فجمعوها أولاً من لغة القرآن الكريم، مستعينين على ذلك بتفسير المفسرين، وبالأحاديث التي صحت عندهم، ومستعينين أيضاً بتفسير المحدثين، ولم يكتفوا بذلك، بل ساحوا في جزيرة العرب بين القبائل العربية، يجمعون كل ما يسمعون".

ووثق أن من أشهر رواد تلك الحقبة عبدالملك بن قريب الأصمعي والكسائي والأزهري وكان الأصمعي أميل إلى جمع نوادر العرب، يتحدث بها إلى الملوك، وكان الكسائي يخرج من حين لآخر ومعه قنينة مملوءة خبزاً وكاغد، وقد أسر الأزهري من القرامطة ومكث نحو سنتين في الجزيرة بين القبائل يصيف في الستارين، ويشتي في الدهناء، ويرتبع في الصمان، وألف في اللغة كتاب "التهذيب" الذي أخذه ابن منظور في "لسان العرب".