12th INTERNATIONAL CONGRESS ON ENGINEERING AND TECHNOLOGY MANAGEMENT

SUBMISSION DETAIL

Fırat GÖKKİS, Tahsin ÇETİNYOKUŞ

Keywords:

J48 VE RASTGELE ORMAN SINIFLANDIRICILARININ BİLGİ KAZANIMI VE TEMEL BİLEŞEN ANALİZİ YÖNTEMLERİ İLE OLUŞTURULAN FARKLI BOYUTLU VERİ SETLERİ ÜZERİNDE PERFORMANSLARININ KIYASLANMASI

Zararlı yazılımların oluşturulması kapsamında gelinen aşamada klasik anti-virüs sistemleri yeterli korumayı sağlayamamaktadır. Bunun sebebi zararlı yazılımların kodlanması sürecinde sadece yazılımın temel kötücül fonksiyonlarına değil bunun yanında güvenlik sistemlerini atlatma yeteneklerine de ağırlık verilmesidir. Bu doğrultuda modern güvenlik sistemlerinde bilgi tabanlı (knowledge base) ve sezgisel (heuristic) yaklaşımlar yerine; tüm zararlı yazılımları türü ve işlevine bakılmaksızın en az hata oranı ile tespit edebilmeye yönelik modeller geliştirilmesi esas hale gelmiştir. Bu noktada makine öğrenmesi algoritmaları karşımıza çıkmaktadır. Makine öğrenmesi algoritmaları temelde denetimli ve denetimsiz öğrenme olmaz üzere iki ayrı grupta toplanmaktadır. Bu çalışmada denetimli öğrenme metotlarından J48 ve Rastgele Ağaç algoritmaları ile öznitelik seçme yöntemlerinden Bilgi Kazanımı ve Temel Bileşen Analizinin etkinliği oluşturulan yeni bir veri seti üzerinde incelenmiştir. Çalışmanın özgünlüğü noktasında literatür taramasında öne çıkan iki önemli husus bulunmaktadır. İlki analiz için kullanılan veri setinin bu çalışma için oluşturulan yeni bir veri seti olmasıdır. Diğeri ise veri seti üzerinde J48 ile Rastgele Orman algoritmalarının özellikle belirlenen öznitelik seçme yöntemleri ile fazlalık (redundancy) özniteliklerden arındırılmış performanslarının kıyaslanmasıdır. Çalışma sonuçları aynı algoritmaların kullanıldığı statik zararlı yazılım analizi ve balık yaş tahmini alanlarında yapılan çalışmaların sonuçları ile ayrıca kıyaslanmıştır. Karşılaştırma sonucunda tüm çalışmalarda Rastgele Orman algoritmasının diğer denetimli öğrenme metotlarına göre daha yüksek doğruluk oranına sahip olduğu görülmüştür.

Anahtar Kelimeler: Makine öğrenmesi, Öznitelik seçimi, J48, Rastgele orman, Zararlı yazılımlar

SUBMISSIONS

MEMBER LOGIN

SUBMISSION DETAIL