Günümüzde çevrimiçi alýþveriþ alýþkanlýklarýnýn artmasý ile müþteriler, birçok farklý firmanýn ürününe kolayca ulaþýp fiyat, kalite karþýlaþtýrmasý yaparak satýn almaya karar vermektedirler. Bu durum e-ticaret þirketleri arasýnda rekabeti arttýrýrken, geçmiþ alýþveriþ verilerinden hareketle müþterilerin gelecekteki satýn alma eðilimlerini tahmin etmenin önemini ortaya çýkarmýþtýr. Müþterilerin, tüm alternatifleri inceledikten sonra bile fiyatta veya kalitede beklenti sebebi ile alýþveriþ yapmadýklarý bilinmektedir. Bu nedenle, satýn alma eðilimi verisinde genellikle sýnýf dengesizliði problemi ile karþýlaþýlmaktadýr. Sýnýf dengesizliði problemi, sýnýflandýrma analizinin performansýný düþürürken yanlý tahmin yapýlmasýna sebep olmaktadýr. Bu çalýþmada, sýnýf dengesizliðine sahip bir veri seti üzerinden sýnýflama analizi yapýlacaktýr. Çalýþmada, dengesiz veri problemini gidermek için 2 farklý yöntem kullanýlacaktýr: Ýlki, dengesiz veri seti için en uygun kesim noktasý ROC analizi ile bulunacaktýr. Ýkincisi, yeniden örnekleme teknikleri kullanýlarak veri seti dengeli hale getirilecektir. ROC analizi için Youden indeksi, Duyarlýlýk=Belirleyicilik kriteri ve Minimax kriterleri; yeniden örnekleme teknikleri için aþýrý örnekleme (oversampling), alt örnekleme (undersampling) ve sentetik veri üretilmesi (Smote) kullanýlacaktýr. Dengesiz veri setini sýnýflandýrmak için lojistik regresyon yöntemi kullanýlacaktýr. Araþtýrmanýn amacý, dengesiz veri seti ile sýnýflandýrma analizi yaparken ROC analizi ve yeniden örnekleme tekniklerinin model performansýna etkisini incelemek ve en baþarýlý performans gösteren modeli belirlemektir. Çalýþmanýn yöntemi, bir e-ticaret þirketine ait veri seti üzerinde uygulanacaktýr. Çalýþmadan elde edilecek sonuçlara göre, müþterilerin alýþveriþ yapma ya da yapmama eðilimlerini sýnýflandýrmanýn e-ticaret þirketlerinin pazarlama faaliyetlerine yön vererek karlarýný arttýrmalarýna yardýmcý olmasý umulmaktadýr. Bu çalýþma Yýldýz Teknik Üniversitesi Bilimsel Araþtýrma Projeleri Koordinasyon Birimi tarafýndan FYL-2022-4857 nolu proje kapsamýnda desteklenmiþtir.
Anahtar Kelimeler: Dengesiz Veri, Satýn Alma Eðilimi, Sýnýflandýrma Analizi, Makine Öðrenimi
|