FRANSIZ DİLÇİLİYİNDƏ ONOMASTİK VAHİDLƏRİN AVTOMATİK İDENTİFİKASİYA XÜSUSİYYƏTLƏRİ
Xülasə
Məqalə fransız dilçiliyində xüsusi isimlərin avtomatik tanınması xüsusiyyətlərini araşdırır, xüsusi isimləri ümumi isimlərdən fərqləndirən xüsusiyyətləri tədqiq edir və xüsusi ismin ayrıca bir fərd və ya obyekt kimi mövcudluğu ilə bağlı müxtəlif dilçi alimlərin baxışlarını təhlil edir. Qeyd olunur ki, mətn daxilində xüsusi isimlərin tanınması bəzən dilçilər üçün çətinliklər yaradır. Avtomatik dil işlənməsi baxımından, xüsusi isimlərin tanınması üzrə aparılan işlər kompüter mütəxəssislərini kompüter işi üçün daha sadə tiplər və praktik həllər təklif etməyə vadar edir, eyni zamanda xüsusi isimlərin reallığını yetərincə nəzərə almağa çalışır. Xüsusi adların çıxarılması, tanınması və kateqoriyalaşdırılması üçün üç tip obyektin fərqləndirilməsi təklif olunur: ENAMEX, TIMEX və NUMEX. Xüsusi isimləri ayırd etmək üçün üç əsas sistem tipi təqdim olunur: qaydalara əsaslanan sistemlər, öyrənməyə əsaslanan sistemlər və hibrid sistemlər. Məqalədə göstərilir ki, xüsusi isimlərin aşkarlanması və təsnifatı üçün ən etibarlı ipucu onların sol və ya sağ konteksti və daxili quruluşudur. Xüsusi isimlər cümlə quruluşunda epitet, təyin, mübtəda, tamamlıq və ya təsrifləyici kimi də çıxış edə bilər. Tədqiqat göstərir ki, müxtəlif tipli xüsusi isimlər identifikasiya baxımından bərabər deyil, çünki onların kontekstual görünüşü və qəzet məqalələrində rastgəlmə tezliyi əhəmiyyətli dərəcədə fərqlənir. Buna görə də, xüsusi isimlərin identifikasiyası üçün istifadə olunan alətlər bu fərqlərə uyğunlaşdırılmalıdır.
