ترجمه مقاله با عنوان شناسایی بدون نظارت افعال مرکب فارسی

ترجمه مقاله با عنوان شناسایی بدون نظارت افعال مرکب فارسی

ترجمه مقاله با عنوان شناسایی بدون نظارت افعال مرکب فارسی , اصطلاح چند جزئی , ساختار افعال سبک , شناسایی بدون نظارت , روش بوت استرپ , Kmean , فارسی

رفتن به سایت اصلی

چکیده. یکی از امور مهم مربوط به عبارات چند جزئی (MWEs) شناسایی فعل مرکب است. آثار بسیاری در زمینه شناسایی بدون افعال چند جزئی در بسیاری از زبان ها وجود دارد، اما هیچ مطالعه‌ی برجسته ای در زبان فارسی دیده نشده است. افعال چند جزئی فارسی  (که افعال مرکب نامیده می شوند)، نوعی ساختار فعل سبک یا همکرد (LVC) است که دارای انعطاف پذیری نحوی است مثلا بین بخش فعل سبک و عنصر غیر کلامی فاصله نامحدودی وجود دارد. علاوه بر این، این عنصر غیر فعلی را می توان صرف کرد. این ویژگی ها کار را در فارسی بسیار مشکل ساخته است. در این مقاله، دو روش بدون نظارت پیشنهاد شده است به طور خودکار به شناسایی افعال مرکب در زبان فارسی می پردازد. در روش اول، با گسترش مفهوم اندازه گیری نقطه به نقطه اطلاعات متقابل (PMI)  ، روش بوت استرپ استفاده شده است. در روش دوم، الگوریتم خوشه بندی K-means مورد استفاده قرار گرفته است. آزمایش های ما نشان می دهد که روش های ارائه شده با توجه به استاندارد سازی، به نتایجی فراتر از آغاز مطالعه که از اندازه گیری PMI  استفاده شده بود، دست یافته است. واژگان کلیدی: اصطلاح چند جزئی، ساختار افعال سبک، شناسایی بدون نظارت، روش بوت استرپ، K-mean، فارسی. Abstract. One of the main tasks related to multiword expressions (MWEs) iscompound verb identification. There have been so many works on unsupervisedidentification of multiword verbs in many languages, but there has not been anyconspicuous work on Persian language yet. Persian multiword verbs (known ascompound verbs), are a kind of light verb construction (LVC) that have syntacticflexibility such as unrestricted word distance between the light verb and thenonverbal element. Furthermore, the nonverbal element can be inflected. Thesecharacteristics have made the task in Persian very difficult. In this paper, twodifferent unsupervised methods have been proposed to automatically detectcompound verbs in Persian. In the first method, extending the concept ofpointwise mutual information (PMI) measure, a bootstrapping method has beenapplied. In the second approach, K-means clustering algorithm is used. Our experimentsshow that the proposed approaches have gained results superior to thebaseline which uses PMI measure as its association metric.Keywords: multiword expression, light verb constructions, unsupervised identification,bootstrapping, K-means, Persian.

  • بررسی ارتباط بین متغیرهای كلان اقتصادی با ساختار سرمایه در بازار سرمایه ایران

    بررسی ارتباط بین متغیرهای كلان اقتصادی با ساختار سرمایه در بازار سرمایه ایران بررسی ارتباط بین متغیرهای كلان اقتصادی با ساختار سرمایه در بازار سرمایه ایران , بررسی ارتباط بین متغیرهای كلان اقتصادی با ساختار سرمایه در بازار سرمایه ایران…

  • پاورپوینت لغات درس یکم زبان انگلیسی سال دوم متوسطه

    پاورپوینت لغات درس یکم زبان انگلیسی سال دوم متوسطه پاورپوینت لغات درس یکم زبان انگلیسی سال دوم متوسطه , لغات درس زبان انگلیسی درس اول کتاب زبان انگلیسی سال دوم متوسطه رفتن به سایت اصلی در این پاورپوینت لغات درس…

  • فرم طرح نویسی

    فرم طرح نویسی فرم طرح نویسی , ویژه فراگیران دوره‌های كارآفرینی و مهارتهای كسب و كار رفتن به سایت اصلی ویژه فراگیران دوره‌های كارآفرینی و مهارتهای كسب و كار

  • طراحی 4 دیتابیس شرکت ها

    طراحی 4 دیتابیس شرکت ها طراحی 4 دیتابیس شرکت ها , طراحی پایگاه داده های شرکت های , سیستم آژانس هواپیمایی , سیستم باشگاه ورزشی , سیستم ثبت جرائم خودرو , سیستم حقوق و دستمزد , SQL Server2008 , دیاگرام…

  • بررسی تأثیر کد بین المللی امنیت کشتی و تسهیلات بندری بر صنعت حمل و نقل دریایی ایران

    بررسی تأثیر کد بین المللی امنیت کشتی و تسهیلات بندری بر صنعت حمل و نقل دریایی ایران بررسی تأثیر کد بین المللی امنیت کشتی و تسهیلات بندری بر صنعت حمل و نقل دریایی ایران , صنعت دریانوردی ایران , تسهیلات…

  • پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *