3.3 Yorumlanabilirliğin Kapsamı
Algoritmalar tahminleri üreten modeli eğitir. Bu algoritmaların her adımı, şeffaflık ve yorumlanabilirlik kavramlarıyla değerlendirilebilir.
3.3.1 Algoritmanın Şeffaflığı
Algoritma modeli nasıl meydana getiriyor?
Algoritmalarda şeffaflık, bir algoritmanın veriden modeli nasıl öğrendiği ve ne gibi ilişkileri öğrenebileceğiyle ilgildiir. Görüntüleri sınıflandırmak için convolutional sinir ağları kullanırsanız, algoritmanın derinlerdeki katmanlarda, görsellerdeki kenarları tespit eden nitelikleri ve filtreleri öğrendiğini görebilirsiniz. Bu algoritmanın nasıl çalıştığına dair bir açıklamadır, fakat algoritmanın öğrendiği modelin veya belli tahminlerin nasıl yapıldığının bir açıklaması değildir. Algoritma şeffaflığı, sadece algoritmayla ilgili bilgiye ihtiyaç duyup verinin veya öğrenilen modelin bilgisine ihtiyaç duymaz. Bu kitapta algoritmaların şeffaflığına değil modellerin yorumlanabilirliğine odaklanacağız. Lineer modeller için kullanılan en küçük kareler yöntemi gibi algoritmalar üstünde iyice çalışılmış ve anlaşılmış metotlardır. Bundan dolayı yüksek şeffaflığa sahip olarak nitelendirilirler. Derin öğrenme yöntemleri (milyonlarca parametreye sahip bir sinir ağında gradyan vektörünü hesaplamak) daha az anlaşılmış yöntemlerdir ve içlerindeki mekanizmalar halen araştırmaların odağındadır, dolayısıyla daha az şeffaftırlar.
3.3.2 Evrensel (Bütünsel) Yorumlama
Eğitilmiş model nasıl tahmin yapar?
Tek seferde tümüyle anlayabildiğiniz bir modelin yorumlanabilir olduğunu söylersiniz (Lipton 20168). Modelin çıktısını açıklamak için, eğitilmiş modele, algoritmanın ne olduğunu bilmeye ve veriye ihtiyacınız vardır. Bu seviyede yorumlanabilirliğin amacı, modelin nasıl karar aldığını niteliklerini ve ağırlıklar veya yapılar (karar ağaçlarında derinlik vs.) gibi öğrenilen kısımlarını bütünsel bir bakış açısıyla ele alarak anlamaktır. Hangi nitelikler gerçekten önemli ve aralarında nasıl ilişkiler var? Evrensel yorumlanabilirlik niteliklere dayanarak hedef dağılımını anlamaya yardımcı olur. Evrensel yorumlanabilirliğin uygulanması çok zordur. Birkaç parametreden fazlasına sahip bir model ortalama bir insanın kısa süreli hafızasına sığamayacak büyüklüktedir. 5 niteliğe sahip bir lineer modeli hayal edemezsiniz çünkü bu 5-boyutlu bir uzayda bir hiperdüzlem çizebilmeyi gerektirir. 3 boyutun üzerindeki her nitelik uzayı insanlar için anlaşılmaz olacaktır. Genelde insanlar modelleri anlamaya çalışırken modellerin belli kısımlarına (lineer modellerde ağırlıklar gibi) odaklanırlar.
3.3.3 Modüler Seviyede Evrensel Yorumlama
Modelin hangi parçası sonucu nasıl etkiliyor?
Yüzlerce niteliğe sahip bir Naive Bayes modeli, aklımızda tutmamız için fazla büyük olurdu. Tüm parametreleri ezberlesek bile yeni veriler için hızlıca tahmin yapamazdık. Ek olarak, her niteliğin önemini ve ortalama olarak sonucu nasıl değiştirdiklerini anlamak için aklınızda niteliklerin ortak dağılımını (joint distribution) tutmanız gerekirdi. Tüm bunlar tabii ki de imkansız, ama tek bir ağırlığı kolayca anlayabilirsiniz. Evrensel yorumlanabilirlik genelde erişilemezken, bazı modelleri modüler seviyede anlamlandırabilme şansınız yüksektir. Her model parametreler bağlamında anlamlandırılabilir değildir. Lineer modeller için yorumlanabilir kısım ağırlıklarken karar ağaçları için bu kısım eşik değerleri (ve seçilen nitelikler) ve yapraklardaki tahminlerdir. Lineer modeller yorumlanırken mükemmel bir şekilde parça parça ele alınabilirmiş gibi gözükseler de aslında her bir ağırlık diğerleriyle bağlantılıdır. Bir ağırlık yorumlanırken diğer nitelik girdilerinin değerlerinin sabit kaldığı varsayılır, fakat bu pratikte çoğunlukla geçersizdir. Bir evin fiyatını evin büyüklüğü ve içerdiği oda sayısını hesaba katarak tahmin eden bir lineer model, oda sayısı niteliği için negatif bir ağırlığa sahip olabilir, çünkü zaten evin büyüklüğü niteliği evin fiyatıyla yüksek korelasyona sahiptir. Alıcıların büyük odaları tercih ettiği bir pazarda, daha az odaya sahip bir ev aynı büyüklükte ama daha çok odaya sahip olandan daha değerli olabilir. Her bir niteliğin ağırlığı diğer nitelikler bağlamında ele alındığında anlamlıdır, fakat yine de bir lineer modelin ağırlıkları bir derin sinir ağınınkilerden daha iyi yorumlanabilir.
3.3.4 Tekil Tahmin İçin Yerel Yorumlama
Model 'bu' örnek için neden 'bu' tahmini yaptı?
Verilerden sadece birinin girdilerine odaklanabilir ve modelin onun için yaptığı tahmini ve neden bu tahmini yaptığını açıklayabilirsiniz. Bir veriye baktığınızda, normalde karmaşık olan bir model daha pratik davranır. Yerel olarak, bu tahmin lineer veya monoton olarak sadece birkaç niteliğe dayanıyor olabilir. Örneğin bir evin fiyatı ve büyüklüğü arasında lineer olmayan bir ilişki olabilir, ama sadece spesifik olarak 100 metrekare evlere bakıyorsanız, verinin bu alt kümesi için evlerin fiyatı evlerin büyüklüğüne lineer olarak bağlı olabilir. Bu durumu, ev büyüklüğü değerini 10 metrekare arttırdığınızda veya azalttığınızda evin fiyat tahmininin nasıl değiştiğine bakarak gözlemleyebilirsiniz. Dolayısıyla yerel açıklamalar evrensel açıklamalardan daha tutarlı olabilir. Kitapta tekil tahminleri daha yorumlanabilir kılan metotlar modelden bağımsız metotlar kısmında anlatılıyor.
3.3.5 Bir Grubun Tahmini için Yerel Yorumlama
Model 'bu' gruptaki veriler için neden 'bu' tahmini yaptı?
Birkaç veri örneği için yapılan tahminler evrensel yorumlama metotlarıyla (modüler seviyede) ya da tekil tahminlerin açıklanmasıyla (yerel) yorumlanabilir. Evrensel metotlar kullanılırken bir grup veri alınır ve sanki tüm eğitim verisi ondan ibaretmiş gibi davranılarak evrensel metotlar uygulanır. Tekil açıklama metotları her bir veriye uygulanıp daha sonra listelenebilir veya metotların verdiği sonuçlar birleştirilebilir.
Lipton, Zachary C. “The mythos of model interpretability.” arXiv preprint arXiv:1606.03490, (2016).↩︎