BİLDİRİLER

BİLDİRİ DETAY

Fırat GÖKKİS, Tahsin ÇETİNYOKUŞ
J48 VE RASTGELE ORMAN SINIFLANDIRICILARININ BİLGİ KAZANIMI VE TEMEL BİLEŞEN ANALİZİ YÖNTEMLERİ İLE OLUŞTURULAN FARKLI BOYUTLU VERİ SETLERİ ÜZERİNDE PERFORMANSLARININ KIYASLANMASI
 
Zararlı yazılımların oluşturulması kapsamında gelinen aşamada klasik anti-virüs sistemleri yeterli korumayı sağlayamamaktadır. Bunun sebebi zararlı yazılımların kodlanması sürecinde sadece yazılımın temel kötücül fonksiyonlarına değil bunun yanında güvenlik sistemlerini atlatma yeteneklerine de ağırlık verilmesidir. Bu doğrultuda modern güvenlik sistemlerinde bilgi tabanlı (knowledge base) ve sezgisel (heuristic) yaklaşımlar yerine; tüm zararlı yazılımları türü ve işlevine bakılmaksızın en az hata oranı ile tespit edebilmeye yönelik modeller geliştirilmesi esas hale gelmiştir. Bu noktada makine öğrenmesi algoritmaları karşımıza çıkmaktadır. Makine öğrenmesi algoritmaları temelde denetimli ve denetimsiz öğrenme olmaz üzere iki ayrı grupta toplanmaktadır. Bu çalışmada denetimli öğrenme metotlarından J48 ve Rastgele Ağaç algoritmaları ile öznitelik seçme yöntemlerinden Bilgi Kazanımı ve Temel Bileşen Analizinin etkinliği oluşturulan yeni bir veri seti üzerinde incelenmiştir. Çalışmanın özgünlüğü noktasında literatür taramasında öne çıkan iki önemli husus bulunmaktadır. İlki analiz için kullanılan veri setinin bu çalışma için oluşturulan yeni bir veri seti olmasıdır. Diğeri ise veri seti üzerinde J48 ile Rastgele Orman algoritmalarının özellikle belirlenen öznitelik seçme yöntemleri ile fazlalık (redundancy) özniteliklerden arındırılmış performanslarının kıyaslanmasıdır. Çalışma sonuçları aynı algoritmaların kullanıldığı statik zararlı yazılım analizi ve balık yaş tahmini alanlarında yapılan çalışmaların sonuçları ile ayrıca kıyaslanmıştır. Karşılaştırma sonucunda tüm çalışmalarda Rastgele Orman algoritmasının diğer denetimli öğrenme metotlarına göre daha yüksek doğruluk oranına sahip olduğu görülmüştür.

Anahtar Kelimeler: Makine öğrenmesi, Öznitelik seçimi, J48, Rastgele orman, Zararlı yazılımlar



 


Keywords: