Bilgisayarınız Gereksiz E-postaları Nasıl Algılıyor?

Dünya çapında gelecek 24 saat içinde gönderilecek e-postaların %70’i gereksiz, istenmeyen çöp mesajlar olacak. Gereksiz posta, tüm e-posta kullanıcıları için bir sorun ama bundan çok daha kötüsü de olabilir. Viagra hakkında hiçbir şey bilmeyen 18. yüzyıl İngiliz matematikçisine, bizi lazer göz cerrahisi ve organ büyütme çöplerinin azgın bir sel haline gelmesinden koruduğu için teşekkür etmeliyiz.

Rahip Thomas Bayes 1761’de öldü. Ölümünden iki yıl sonra Bayes teoremi olarak bilinen matematik kurallarının dâhil olduğu olasılıklar üzerine olan önemli bir makalesi yayınlandı. Aynı teorem şu anda gereksiz filtresinin temel taşını oluşturuyor.

Reklam
Reklam

Gereksiz postalar evriliyor. Gereksiz postaları yaratanlar gelen kutunuza ulaşmak için çok daha karmaşık yollar üretiyor ve sağlayıcıların hızla verdiği yanıtlara göre gereksiz postalarda mutasyon yaratıyorlar. Bu nedenle güçlü ve hızlı filtreleme kuralları iyi işlemiyor. Gereksiz postaları engellemek eskiden göndericileri kara listeye almak ve içeriklerde yasaklanmış kelimelerin listesini yapmak kadar kolay bir olaydı. Şu anda bu yaklaşımın yetmediği gibi üstelik gereksiz posta filtrelerin de evrilmesi gerekiyor.

Bayes tipi filtreler sadece isim veya e-posta adresleri listesi değil, aynı zamanda sınıflandırıcı listeleri de oluşturuyor. Bir e-postanın gereksiz (veya gerekli) olarak sınıflandırılması, Bayes tipi algoritmanın ileriki sınıflandırmaları için bir altın madeni haline geliyor. Bilgi motifleri resmin, yazı içeriğinin ya da üstbilgi verisinin kaynağında olsa bile algoritma tarafından yeni gelen postaları kıyaslayabilecekleri bir taslakmış gibi kullanılıyor (bir tür karar ağacı).

Reklam
Reklam

Bu nedenle sınıflandırıcıların doğru olması çok önemli. Algoritmanın doğruluğunu geliştirmesi için, filtrelerin yaptığı sınıflandırmanın doğru olup olmadığını öğrenmesi gerekiyor. Ve öğretici olarak bildiğimiz en iyi şey çoğu karmaşık sınıflandırma aracından çok daha iyi çalışan insan beyni. Beyin genellikle *g*erçeği gördüğü zaman onun ne olduğunu anlar.

Gereksiz posta almak can sıkıcı olsa da iyi bir e-postanın (bunlara bazen "ham" posta da denir) gereksiz olarak sınıflanması çok daha kötüdür. Bu posta filtreleme seçeneklerine göre, çok fazla kontrol etmediğiniz bir klasöre düşebilir ve hatta silinebilir. Filtre gereksiz olmayan postayı gereksiz olarak sınıflandırıldığında buna yanlış pozitif denir. Şanslıyız ki algoritmaya yanlış pozitif olduğunu anlatmak kolaydır ve böylelikle yanlış pozitifler gittikçe azalır.

Peki, bu sistem nasıl çalışıyor? Örnek olarak popular filtreleme programı Spam Assassin’i kullanabiliriz. Bu program genellikle e-posta sağlayıcınıza yüklenmiş olarak bulunur ve sa-learn adında Bayes tipi bir denklem bulundurur. E-posta istemcinizdeki klasörleri gereksiz değil ve gereksiz olarak düzenleyerek algoritmayı eğitebilirsiniz. Süreci başlatmak için, birçok gereksiz ve gereksiz olmayan postayı alakalı klasörlere koymak iyi bir fikir olabilir. Bundan sonra gelen kutunuzu gelen her gereksiz mesajı gereksiz klasörüne taşıyın ve yanlış pozitif olan bir mesaj aldığınızda bunu gereksiz değil klasörüne koyun.

Reklam
Reklam

Eğer sa-learn doğru ayarlandıysa, gereksiz ve gereksiz değil klasörlerinizi her gün tarayacak ve sınıflandırıcılarını orada bulduklarına daha iyi uyacak şekilde ayarlayacaktır.

Filtreler de bir çeşit Bayes tipi araçlardır. Daha teknik olarak belirtecek olursak, onlar naif Bayes tipi araçlardır, çünkü Bayes teoremini tam olarak uygulamak imkânsızdır. Algoritma gerçekten işlem bilgilerinden bağımsız olarak kendi başına birşey yapmaz. Ancak yardımcı program fonksiyonu ile birlikte 10 üzerinden gereksiz skoru atamak için bu bilgiyi kullanabilir ve böylece kullanışlı bir araç haline gelir. Yani, girişim ve eylem bize bir araç sağlar.

Spam filtresi, su filtresinden aslında çok da farklı değil. E-postaları bir sel gibi akıtarak bir ızgaradan geçirmeye çalıştığınızı düşünün, bu ızgaralar gittikçe daha küçük delikli olacak ve “saf gereksiz olmayan postalar” son ürün olarak çıkacak. İnternet servis sağlayıcılarının (ISP) sunucularındaki yüksek seviye filtreler ve engelleme listeleri büyük dalları ve büyük enkazları yakalayan birer ızgara rezervuarı olarak görev yaparlar. ISP posta sunucularındaki kullanıcı kontrollü filtreler yaprakları, küçük dalları ve çöpleri yakalarlar. Son kullanıcının e-posta hesabındaki bilgisayarlar otomatik ve kural tabanlı filtreler kullanarak kumları yakalarlar.

Reklam
Reklam

Böyle bakarsak bizim ilgimiz en küçük parçaları bile yakalayabilen çok aşırı küçük aralıklı ızgaralar üzerinedir. Ancak aslında gereksiz postaları oraya ulaşamadan durdurmak isteriz. Bayes tipi filtreler bunu yapmak için en iyi yöntemlerden biridir.

Söz konusu e-posta olunca, onu okuyamama olasılığınız vardır. Yazı içeriğinde birçok kere gereksiz geçen postalar bazı filtreler tarafından gelen kutunuza gelmeden önce seçilerek başka bir yere atılabilir. Bu tür gereksiz hikâyeleri anlatan ve postanın konusunda gereksiz yazan postaların illaki gereksiz olmadığını öğrenmek Bayes tipi araçlar için biraz zorlayıcı olabilir.

Ancak eğer bu e-postaları gözden geçiren Bayes tipi araçlar sa-learning ödevlerini yapıyorlarsa, ve eğer çok katı ya da naif değillerse, o zaman e-postanız size ulaşabilir.