MALİYYƏ FIRILDAQÇILIĞININ QARŞISININ ALINMASINDA EKSTREMAL QRADİYENT GÜCLƏNDİRMƏNİN (XGBOOST) ROLU
Xülasə
Maliyyə fırıldaqçılığının vaxtında və dəqiq şəkildə aşkarlanması banklar və maliyyə institutları üçün strateji əhəmiyyət daşıyır. Məqalədə maliyyə fırıldaqçılığının aşkarlanmasında Ekstremal Qradiyent Gücləndirmə (Extreme Gradient Boosting – XGBoost) modelinin rolu, üstünlükləri və tətbiq zamanı qarşılaşılan əsas çətinliklərin təhlili edilir. Xüsusilə, fırıldaqçılıq məlumatlarının ciddi sinif balanssızlığı şəraitində XGBoost modelinin yüksək əhatəlilik (recall) əldə etməsinə baxmayaraq, aşağı dəqiqlik (precision) səbəbindən çoxsaylı yalnış müsbət hallar yaratması əsas problem kimi ön plana çıxarılmışdır. Bu kimi məhdudiyyətlərin aradan qaldırılması üçün balanslaşdırma texnikalarının və hibrid yanaşmaların rolu empirik nəticələr əsasında qiymətləndirilmişdir. K-SMOTEENN kimi hibrid resampling metodunun tətbiqinin XGBoost modelinin dəqiqlik–əhatəlilik balansını əhəmiyyətli dərəcədə yaxşılaşdırdığı və beləliklə F1-score kimi əsas göstəricilərdə daha stabil nəticələr verdiyi araşdırmada qeyd edilmişdir. Qraf neyron şəbəkələri vasitəsilə gücləndirilmiş XgBoost modelinin səmərəliliyini artıraraq daha yüksək nəticələr əldə etməsi aşkarlanmışdır. Bundan əlavə, Random Forest və stacking ensemble modelləri ilə aparılan müqayisələr XGBoost-un təkbaşına deyil, daha geniş ansambl və hibrid arxitekturalar daxilində daha səmərəli fəaliyyət göstərdiyini sübut edir.
Abstract (EN)
The timely and accurate detection of financial fraud is of strategic importance for banks and financial institutions. This paper analyzes the role, advantages, and main challenges encountered during the implementation of the Extreme Gradient Boosting (XGBoost) model in financial fraud detection. Specifically, the issue of the XGBoost model generating numerous false positives due to low precision—despite achieving high recall under conditions of severe class imbalance in fraud data—is highlighted as a primary concern. To mitigate these limitations, the role of balancing techniques and hybrid approaches has been evaluated based on empirical results. The study notes that the application of a hybrid resampling method, such as K-SMOTEENN, significantly improves the precision-recall balance of the XGBoost model, thereby yielding more stable results in key metrics like the F1-score. It was also found that enhancing the XGBoost model through Graph Neural Networks increases its efficiency and leads to superior results. Furthermore, comparisons with Random Forest and stacking ensemble models demonstrate that XGBoost performs more effectively within broader ensemble and hybrid architectures rather than in isolation.
Резюме (RU)
Своевременное и точное выявление финансового мошенничества имеет стратегическое значение для банков и финансовых институтов. В статье анализируются роль, преимущества и основные трудности, возникающие при применении модели Extreme Gradient Boosting (XGBoost) для обнаружения финансового мошенничества. В частности, в качестве основной проблемы выделяется то, что в условиях серьезного дисбаланса классов данных о мошенничестве модель XGBoost, несмотря на достижение высокой полноты (recall), генерирует множество ложноположительных срабатываний из-за низкой точности (precision). Для устранения подобных ограничений на основе эмпирических результатов была оценена роль методов балансировки и гибридных подходов. В исследовании отмечается, что применение гибридного метода ресемплинга, такого как K-SMOTEENN, значительно улучшает баланс точности и полноты модели XGBoost, обеспечивая более стабильные результаты по ключевым показателям, таким как F1-score. Было выявлено, что усиление модели XGBoost с помощью графовых нейронных сетей повышает ее эффективность и позволяет достичь более высоких результатов. Кроме того, сравнения с моделями Random Forest и стекингом ансамблей (stacking ensemble) доказывают, что XGBoost работает более эффективно не изолированно, а в составе более широких ансамблевых и гибридных архитектур.
