Günümüzde çevrimiçi alışveriş alışkanlıklarının artması ile müşteriler, birçok farklı firmanın ürününe kolayca ulaşıp fiyat, kalite karşılaştırması yaparak satın almaya karar vermektedirler. Bu durum e-ticaret şirketleri arasında rekabeti arttırırken, geçmiş alışveriş verilerinden hareketle müşterilerin gelecekteki satın alma eğilimlerini tahmin etmenin önemini ortaya çıkarmıştır. Müşterilerin, tüm alternatifleri inceledikten sonra bile fiyatta veya kalitede beklenti sebebi ile alışveriş yapmadıkları bilinmektedir. Bu nedenle, satın alma eğilimi verisinde genellikle sınıf dengesizliği problemi ile karşılaşılmaktadır. Sınıf dengesizliği problemi, sınıflandırma analizinin performansını düşürürken yanlı tahmin yapılmasına sebep olmaktadır. Bu çalışmada, sınıf dengesizliğine sahip bir veri seti üzerinden sınıflama analizi yapılacaktır. Çalışmada, dengesiz veri problemini gidermek için 2 farklı yöntem kullanılacaktır: İlki, dengesiz veri seti için en uygun kesim noktası ROC analizi ile bulunacaktır. İkincisi, yeniden örnekleme teknikleri kullanılarak veri seti dengeli hale getirilecektir. ROC analizi için Youden indeksi, Duyarlılık=Belirleyicilik kriteri ve Minimax kriterleri; yeniden örnekleme teknikleri için aşırı örnekleme (oversampling), alt örnekleme (undersampling) ve sentetik veri üretilmesi (Smote) kullanılacaktır. Dengesiz veri setini sınıflandırmak için lojistik regresyon yöntemi kullanılacaktır. Araştırmanın amacı, dengesiz veri seti ile sınıflandırma analizi yaparken ROC analizi ve yeniden örnekleme tekniklerinin model performansına etkisini incelemek ve en başarılı performans gösteren modeli belirlemektir. Çalışmanın yöntemi, bir e-ticaret şirketine ait veri seti üzerinde uygulanacaktır. Çalışmadan elde edilecek sonuçlara göre, müşterilerin alışveriş yapma ya da yapmama eğilimlerini sınıflandırmanın e-ticaret şirketlerinin pazarlama faaliyetlerine yön vererek karlarını arttırmalarına yardımcı olması umulmaktadır. Bu çalışma Yıldız Teknik Üniversitesi Bilimsel Araştırma Projeleri Koordinasyon Birimi tarafından FYL-2022-4857 nolu proje kapsamında desteklenmiştir.
Anahtar Kelimeler: Dengesiz Veri, Satın Alma Eğilimi, Sınıflandırma Analizi, Makine Öğrenimi
|