Zararlý yazýlýmlarýn oluþturulmasý kapsamýnda gelinen aþamada klasik anti-virüs sistemleri yeterli korumayý saðlayamamaktadýr. Bunun sebebi zararlý yazýlýmlarýn kodlanmasý sürecinde sadece yazýlýmýn temel kötücül fonksiyonlarýna deðil bunun yanýnda güvenlik sistemlerini atlatma yeteneklerine de aðýrlýk verilmesidir. Bu doðrultuda modern güvenlik sistemlerinde bilgi tabanlý (knowledge base) ve sezgisel (heuristic) yaklaþýmlar yerine; tüm zararlý yazýlýmlarý türü ve iþlevine bakýlmaksýzýn en az hata oraný ile tespit edebilmeye yönelik modeller geliþtirilmesi esas hale gelmiþtir. Bu noktada makine öðrenmesi algoritmalarý karþýmýza çýkmaktadýr. Makine öðrenmesi algoritmalarý temelde denetimli ve denetimsiz öðrenme olmaz üzere iki ayrý grupta toplanmaktadýr. Bu çalýþmada denetimli öðrenme metotlarýndan J48 ve Rastgele Aðaç algoritmalarý ile öznitelik seçme yöntemlerinden Bilgi Kazanýmý ve Temel Bileþen Analizinin etkinliði oluþturulan yeni bir veri seti üzerinde incelenmiþtir. Çalýþmanýn özgünlüðü noktasýnda literatür taramasýnda öne çýkan iki önemli husus bulunmaktadýr. Ýlki analiz için kullanýlan veri setinin bu çalýþma için oluþturulan yeni bir veri seti olmasýdýr. Diðeri ise veri seti üzerinde J48 ile Rastgele Orman algoritmalarýnýn özellikle belirlenen öznitelik seçme yöntemleri ile fazlalýk (redundancy) özniteliklerden arýndýrýlmýþ performanslarýnýn kýyaslanmasýdýr. Çalýþma sonuçlarý ayný algoritmalarýn kullanýldýðý statik zararlý yazýlým analizi ve balýk yaþ tahmini alanlarýnda yapýlan çalýþmalarýn sonuçlarý ile ayrýca kýyaslanmýþtýr. Karþýlaþtýrma sonucunda tüm çalýþmalarda Rastgele Orman algoritmasýnýn diðer denetimli öðrenme metotlarýna göre daha yüksek doðruluk oranýna sahip olduðu görülmüþtür.
Anahtar Kelimeler: Makine öðrenmesi, Öznitelik seçimi, J48, Rastgele orman, Zararlý yazýlýmlar
|