العلوم والتكنولوجيا

2025.03.13

المعهد الوطني للغة الكورية يعقد ندوة أكاديمية دولية كل عام للبحث عن اتجاهات لتأمين الموارد اللغوية والثقافية الكورية في عصر الذكاء الاصطناعي. وتظهر الصورة هذه الندوة الأكاديمية الدولية لهذا العام التي عُقدت في غرفة التجارة والصناعة الكورية بحي جونغغو، سيئول في يوم 4 ديسمبر من العام الماضي. (الصورة من المعهد الوطني للغة الكورية)

المعهد الوطني للغة الكورية يعقد ندوة أكاديمية دولية كل عام للبحث عن اتجاهات لتأمين الموارد اللغوية والثقافية الكورية في عصر الذكاء الاصطناعي. وتظهر الصورة الندوة الأكاديمية الدولية لهذا العام التي عُقدت في غرفة التجارة والصناعة الكورية بحي جونغغو، سيئول في يوم 4 ديسمبر من العام الماضي. (الصورة من المعهد الوطني للغة الكورية)



سيئول = تيريزيا مارغريت

يدعم المعهد الوطني للغة الكورية التابع لوزارة الثقافة والرياضة والسياحة، تطوير تكنولوجيا الذكاء الاصطناعي التي تعمل باللغة الكورية، لأنه يعتبر جمع البيانات أمرا مهما لتعزيز القدرة التنافسية الوطنية.

وفي السياق، يقوم المعهد الوطني للغة الكورية بجمع البيانات باللغة الكورية بشكل منهجي، لبناء النظام ما يُسمى ’مالمونغتشي (مجموعة من البيانات باللغة الكورية)‘.

ويشير مصطلح ’مالمونغتشي‘ إلى مجموعة من البيانات اللغوية التي تمت معالجتها حتى تتمكن لأجهزة الكمبيوتر من التعرف عليها، باستخدام ما يقوله الأشخاص فعليا في حياتهم اليومية مثل الكتب ومقالات الصحف ونصوص اليوتيوب والمدونات ومحادثات الرسائل. وبهذا، يُعد مالمونغتشي كموارد أساسية ليس فقط لأبحاث اللغة والتعليم، ولكن أيضا لتطوير تقنية الذكاء الاصطناعي.

ويعمل المعهد الوطني للغة الكورية على تطوير ثلاثة أنواع من مالمونغتشي، وهي ’مالمونغتشي في شكله الأصلي‘ (البيانات التي تم رقمنتها في شكلها الأصلي دون تحليل منفصل)، و’ملمونغتشي للتحليل‘ (بيانات الجمل أو العبارات المرفقة بمعلومات تحليلية محددة)، و’ملمونغتشي يصف نفس المحتوى بلغتين أو أكثر‘.

’إرشادات ترجمة اللغة الكورية لبناء نظام مالمونغتشي‘ (على اليسار) نُشرت في عام ٢٠٢٣ بناء على بيانات مالمونغتشي، التي تم جمعها منذ عام ٢٠٢١. وتظهر الصورة ملصقا رسميا للندوة الأكاديمية الدولية ذات الصلة للعام الماضي (على اليمين). (الصورة من المعهد الوطني للغة الكورية)

’إرشادات ترجمة اللغة الكورية لبناء نظام مالمونغتشي‘ (على اليسار) نُشرت في عام ٢٠٢٣ بناء على بيانات مالمونغتشي، التي تم جمعها منذ عام ٢٠٢١. وتظهر الصورة ملصقا رسميا للندوة الأكاديمية الدولية ذات الصلة للعام الماضي (على اليمين). (الصورة من المعهد الوطني للغة الكورية)


وقالت الباحثة في قسم معلومات اللغة بالمعهد الوطني للغة الكورية بارك مي-يونغ "لقد أطلقنا مشروع بناء نظام مالمونغتشي، لتطوير تكنولوجيا الذكاء الاصطناعي المتخصصة في ترجمة اللغة الكورية لتوسيع قاعدة الموجة الكورية (الهاليو) من خلال الذكاء الاصطناعي، والبحث عن محرك النمو للصناعات اللغوية والثقافية.

وقد أعلنت وزارة الثقافة والرياضة والسياحة في عام ٢٠٢١ عن خطتها الإستراتيجية متوسطة وطويلة الأجل لإنشاء قاعدة بيانات ضخمة للصناعات اللغوية والثقافية الكورية. واستنادا إليها، يستمر المعهد الوطني للغة الكورية في إنشاء قاعدة بيانات اللغات الأجنبية التي تفتقر إلى مواد الترجمة الكورية.

ومع الأخذ في اعتبار الطلب على تعلم اللغة الكورية والحاجة إلى ترجمتها، تم اختيار ما مجموعه ثماني لغات، وهي الفيتنامية والإندونيسية والتايلاندية والهندية والخميرية (كمبوديا) والتاغالوغية (الفلبين) والروسية والأوزبكية.

وتتمتع قاعدة بيانات مالمونغتشي بجودتها العالية لترجمة بين اللغات الأجنبية والكورية نظرا لإنتاجها بواسطة مترجمين محترفين، وليس الترجمة الآلية. ونُشرت البيانات المُجمعة من عام 2021 إلى عام 2023 على الموقع الرسمي للمعهد الوطني للغة الكورية. ومن المقرر نشر البيانات المُجمعة في العام الماضي بحلول أواخر هذا العام.

ويُستخدم نظام مالمونغتشي على نطاق واسع لتحسين تقنية الترجمة المبنية على الذكاء الاصطناعي. وعلى سبيل المثال، تتعلم نماذج الذكاء الاصطناعي الرئيسية، بما في ذلك هايبركلوبا إكس من شركة نايفر وأيدات من شركة إس كيه، هذه البيانات بالفعل.


بيانات مالمونغتشي لترجمة بين اللغات الكورية والأجنبية المُجمعة في الفترة من عام 2021 إلى عام 2023 نُشرت على *الموقع الرسمي للمعهد الوطني للغة الكورية. (لقطة شاشة للموقع الرسمي للمعهد الوطني للغة الكورية)

بيانات مالمونغتشي لترجمة بين اللغات الكورية والأجنبية المُجمعة في الفترة من عام 2021 إلى عام 2023 نُشرت على *الموقع الرسمي للمعهد الوطني للغة الكورية. (لقطة شاشة للموقع الرسمي للمعهد الوطني للغة الكورية)


وأوضحت بارك "يتزايد عدد الأجانب المقيمين في كوريا، لكن لا تزال الهيئات الإدارية العامة تفتقر إلى خدمات الترجمة لبعض الغات الأجنبية"، مضيفة "هناك الحاجة لمواصلة المضي قدما في المشروع الأول (2021-2025) والمشروع الثاني (2026-2030) لتطوير تكنولوجيا الترجمة الآلية".

وأضافت "لتعزيز وظائف الذكاء الاصطناعي بشكل فعال، يتعين علينا جمع ليس فقط النصوص، بل أيضا البيانات المختلفة مثل الصور والتسجيلات الصوتية ومقاطع الفيديو"، مؤكدة "سنواصل جمع بيانات مالمونغتشي أكثر تنوعا لتوسيع قاعدة الموجة الكورية (الهاليو) من خلال الذكاء الاصطناعي".

وتتوفر بيانات مالمونغتشي لترجمة بين اللغات الأجنبية والكورية‘ مجانا على *هذا الموقع الإلكتروني:
(kli.korean.go.kr/corpus)*


margareth@korea.kr

محتوى متعلق