دوره 6، شماره 2 - ( زبان کاوی کاربردی (JSAL) 1402 )                   جلد 6 شماره 2 صفحات 130-101 | برگشت به فهرست نسخه ها


XML English Abstract Print


1- دانشجوی دکتری علوم قرآن و حدیث، دانشکده الهیات، دانشگاه کاشان، ایران ، Z.Shams@qom.ac.ir
2- کارشناس ارشد هوش مصنوعی دانشگاه علوم تحقیقات تهران
چکیده:   (1103 مشاهده)
به فرآیند برگرداندن مطلبی از زبان مبدأ به زبان مقصد که با یافتن هم ارزهای معناشناختی میان دو زبان صورت می­گیرد، ترجمه می­گویند. مهم­ترین مشکلات ترجمه، ابهاماتی است که در واژگان و ساختار جملات وجود دارند. در یک تقسیم­بندی، پنج نوع مهم ابهام واژگانی (ابهام­های مقوله­ای، واژه­های هم­آوا، واژه­های هم­نویسه، چند معنایی و ابهام انتقالی) و دو نوع مهم ابهام ساختاری (ابهام­های ساختاری واقعی و ابهام­های سیستمی) وجود دارد. ترجمه ماشینی (Machine translation: MT) که بخشی از حوزه پردازش زبان طبیعی(Natural Language Processing: NLP) مبتنی بر کامپیوتر در زبان­شناسی رایانه­ای و هوش مصنوعی بوده به عنوان یکی از تکنیک‌های خودکاری است که متن بدون ساختار را به داده‌های ساختاری تبدیل می‌کند با تبدیل متن به اطلاعات، توانسته است تحلیل‌های بیشتری را به داده‌ها اعمال کرده تا اطلاعات مفیدی استخراج شود. در این نوشتار که به روش کتابخانه­ای تدوین شده، جهت رفع مسائل پیرامون معنای واژگان در ترجمه ماشینی قرآن، طرحی به صورت نظری پیشنهاد شده که هدف آن کمک به فهم بهتر معنای واژگان قرآن، با بهرمندی از قرینه سیاق و بافت عبارت است. در روش پیشنهادی با بهره­مندی از قاعده سیاق و تکنیک­های متن کاوی، و با استناد به آن، واژه معادل مناسب­تری در زبان مقصد برگزیند. در این طرح، سیاق را در مقیاس کلمات دانسته که می­توان آن را به شرط احراز شرایط به انواع دیگر توسعه داد. به طور خلاصه این طرح دو مرحله دارد: اولویت­بندی (وزن­دهی) واژگان هم­جوارِ هم ورودی (هر واژه در محدوده آیاتی که در مورد نزول یک­باره آن­ها اتفاق نظر وجود دارد) و سپس مقایسه با کلماتی که اشتراک لفظی (چندمعنا) دارند و  نیز مقایسه هم‌نظیران یک واژه با هم‌نظیران سایر واژگان (مترادف­یابی). می باشد.  برای دقیق­تر شدن نتایج می­توان مشخصات بیشتری از کلمات را به صورت دستی تهیه نمود، جداولی شامل مواردی چون مکّی یا مدنی بود آیات، ترتیب نزول سوره، مفاهیم و تعابیری که در معنای کلمات قرآن در فرهنگ لغاتی چون لسان العرب ابن منظور و فرهنگ لغت راغب اصفهانی آمده است و غیره. برای بدست آوردن داده­های ورودی از تکنیک­های نمایه­سازی استفاده می­شود. در مرحله پیش پردازش باید داده­هایی که دارای اهمیت کمتری است(Stop Words) (مانند"الذی"، "التی"، "لم"،"کان"،" کانما" و غیره) حذف شود تا خروجی بهتری بدست آید. برای تغییر شکل داده می­توان اعراب را حذف کرد تا کدنویسی راحت­تر انجام شود، برای کاهش نمونه نیز می­توان از ریشه میانوندی کلمات استفاده نمود. برای اینکه با استناد به قاعده سیاق،  برای یکایک کلماتی که به عنوان ورودی مورد پردازش قرار می­گیرند، رکوردی از مشخصات تهیه نمود، لازم است ابتدا واحد سازی(Tokenizer) صورت گیرد، در داده­های اولیه تهیه شده، در کل مجموعه آیات ورودی، بر اساس دو معیار قرابت مکانی و فراوانی تکرار، به هر کلمه وزنی اختصاص یابد. هر چه کلمات به کلمه مورد نظر نزدیک­تر و یا بیشترتکرار شده باشد، وزن بیشتری به آن اختصاص داده می شود که معرف ارتباط معنایی قوی­تر آنان است و  برعکس. طبیعتاَ  کلماتی که در یک آیه قرار دارند (شماره آیه یکسانی دارند) نسب به کلماتی که در آیات دیگر و فاصله دورتر قرار دارند از ظریب تأثیر بیشتری برخوردار هستند. در سنجش معیار فراوانی: برای نشان دادن اهمیت کلمه در سوره از فراوانی وزنی (TF/IDF Weight) استفاده می­شود، مقدار TF/IDF  به تناسب تعداد تکرار کلمه در هر سوره یا مجموعه آیات ورودی، افزایش می‌یابد و توسط تعداد آیاتی که در سوره هستند و شامل کلمه نیز می‌باشند متعادل می‌شود. در نهایت این نتیجه حاصل آمد که از هم­جواری کلمات و روابط معنایی بین آن­ها و با کمک تکنیک­های متن کاوی، فهم بیشتری از واژگان حاصل شده که این مهم گزینش مناسب­تر واژه معادل در زبان مقصد را منجر می شود.
متن کامل [PDF 537 kb]   (846 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: زبان شناسی اجتماعی
دریافت: 1400/7/2 | پذیرش: 1401/5/6 | انتشار: 1402/2/2

فهرست منابع
1. Alshaari, M., Elfitori, K., (2014). "Computable Difference Matrix for Synonyms in the Holy Quran". World Academy of Science, Engineering and Technology International Journal of Social, Behavioral, Educational, Economic, Business and Industrial Engineering, Vol. 8, No. 5, Pp. 1401-1404. Doi: 10.1999/1307-6892/9998243
2. AlSukhni, E. A., Mohammed N. Alsmadi, Izzat M. (2016). "An Automatic Evaluation for Online Machine Translation: Holy Quran Case Study", (IJACSA) International Journal of Advanced Computer Science and Applications, Vol. 7, No. 6, Doi: 10.14569/IJACSA.2016.070614 [DOI:10.14569/IJACSA.2016.070614]
3. Esmaili, M., (2012). Concepts and techniques of data mining. Kashan: Kashan Azad University.
4. Falahati, M., (2006). "Ambiguity in machine translation", Library and Information Sciences, Vol. 9, No. 3, pp. 21-38.
5. Izadi, M., & Zandieh, N. (2012). "Context and Spontaneous Occurrence of Meaning in the Exegetic School of Allameh Tabatabaee". Quran and Hadith Studies‎, Vol. 5, No. 2, pp. 5-23. Doi: 10.30497/quran.2012.1005
6. Javadipour, M., (2014). Overview of machine translation. The second electronic conference of new researches in science and technology.
7. Lyons, J. (1970). Semantics, 2th edition. Cambridge: Cambridge University Press
8. Naseh, A. A., (2006). "The functions of context in the interpretation of the Holy Quran". Qur'an and Hadith research, Vol. 1, No. 1, pp. 107-130.
9. Paktchi, A., (2012). Translation of the Holy Quran; A theoretical and practical approach (studying from vocabulary level to sentence construction), 3th edition Tehran: Imam Sadegh University (AS).
10. Rajabi, M., (1967). The method of interpretation of the Qur'an. Qom: University and District Research Institute.
11. Rezaei Esfahani, M. A., (2011). The logic of Quran translation, 2th edition, Qom: Al-Mustafa International Translation and Publishing Center.
12. Saeed, J. I. (2003). Semantics, Malden (MA)/Oxford: Blackwell.
13. Soyuti, A., (2000). Al-Itqan fi Ulum al-Qur'an, 2th edition, Beirut: Dar al-Kitab al-Arabi,
14. Tabari, M., (1984). Al-Tafsir al-Jame'i (Jame'i al-Bayan), Beirut: Dar al-Fekr.
15. Tadin, M. A., (2011). Studying the current problems of solving ambiguity in machine translation, Master thesis, Shiraz University.

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.