فرمت فایل :powerpoint تعداد صفحات ۲۳ صفحه
بخشی از اسلایدها:
مشکلات:
ساختواژه فارسی و کلمات
وندها مانند نشانه جمع، ضمایر ملکی، کسره اضافه و ...
کتابــهــایـــم
ساختواژه افعال
ابهام در ساختواژه
مردی: نکره ، شناسه دوم شخص
تشخیص کران کلمات
«کتابها»، «کتاب ها»، «کتابها»
کارهای انجام شده:
اولین کار برای برچسب گذاری زبان فارسی
آسی و حاجی عبدالحسینی 2000
Megerdoomian 2004
Raja et al 2007
ارومچیان 2006 و 2007
(مرادزاده، 1383 )
(بی جن خان و مرادزاده، 1383 )
پیکره متنی زبان فارسی:
چند نمونه پیکره
پیکره موازی زبان فارسی
همشهری
پیکره بی جن خان*
2.6 میلیون تگ دستی
4300 موضوع: حقوقی، سیاسی، حسابداری، اقتصادی و ...
76706 واژه
برچسب های پیکره:
دو نسخه
حدود 500 تا 600 برچسب
برچسبها در سه دسته
1 برچسب های نحوی –ساختواژی
اسم، فعل، صفت، قید، حرف ربط، حرف اضافه، حرف
2 برچسب های خاص
ادات شرط، کیفیت نما، کلمه پرسشی، جمله واره، حرف ندا، منادی،
3 برچسب های متفرقه
جداکننده، علامت ریاضی.
تحلیلگر ساختواژی:
وجود انواع تکواژها در زبانهای خاص مثل فارسی
تکواژهای تصریفی
معمولا برای ساخت کلماتی استفاده می شوند که حامل مفاهیم دستوری در جمله باشند
تکواژهای اشتقاقی
کلمات جدید را می سازند که بار مفهومی خاصی را منتقل می کنند.
تکواژهای ترکیبی
پاورپوینت درباره برچسب گذاری اجزای کلام زبان فارسی