Bölüm 5 Yorumlanabilir Modeller
Yorumlanabilirliğe erişmenin en kolay yolu tüm öğrenme algoritmalarının yorumlanabilen modeller oluşturan bir altkümesini kullanmaktır. Lineer regression, logistic regression ve karar ağaçları sıklıkla kullanılan yorumlanabilir modellerdir.
İlerleyen bölümlerde bu modellerden bahsedeceğiz. Detaylıca değil, sadece temellerini konuşacağız; zaten detaylara inen bir sürü kitap, video, ders, makale ve farklı materyal mevcut. Biz şu modellerin yorumlanmasına odaklanacağız: Lineer regression, logistic regression, lineer regression uzantısı modeller, karar ağaçları, karar kuralları, RuleFit algoritması ve diğer yorumlanabilir modeller.
Kitapta incelenen yorumlanabilir modeller, en yakın k-komşu metodu haricinde modüler seviyede yorumlanabilir modellerdir. Aşağıdaki tabloda yorumlanabilir model türlerinin belli özelliklerini görebilirsiniz. Lineer modeller nitelikler ve hedef arasında lineer bir ilişki modeller. Monotonluk, bir nitelik ve hedef arasındaki ilişkinin niteliğin tüm değer aralığı boyunca aynı yönde gittiğini gösterir: Nitelik değerindeki bir artış hedefte her zaman bir artışa veya azalışa neden olacaktır. Monoton bir model yorumlanmaya uygundur çünkü kurduğu ilişkiyi anlamak daha kolaydır. Bazı modeller farklı niteliklerin etkileşimiyle oluşan nitelikler kullanabilir. Bu etkileşim nitelikleri tahmin performansını arttırabilir fakat sayılarının çok fazla olması veya karmaşık etkileşimler olmaları yorumlanabilirliği kötü etkileyebilir. Bazı modeller ise belli görevlere özgüdür: bazıları regression için, bazıları sınıflandırma için, bazıları ise her ikisi için de kullanılabilir.
Bu tablodan amacınıza uygun bir yorumlanabilir model seçebilirsiniz:
Algoritma | Lineer | Monoton | Etkileşim | Görev |
---|---|---|---|---|
Lineer regression | Evet | Evet | Hayır | Regression |
Logistic regression | Hayır | Evet | Hayır | Sınıflandırma |
Karar ağaçlaır | Hayır | Bazıları | Evet | Sınıflandırma, Regression |
RuleFit | Evet | Hayır | Evet | Sınıflandırma, Regression |
Naive Bayes | Hayır | Evet | Hayır | Sınıflandırma |
En yakın k-komşu | Hayır | Hayır | Hayır | Sınıflandırma, Regression |
Logistic regression ve Naive Bayes modellerinin lineer açıklamalar üretebildiğini söyleyebilirsiniz, fakat bu sadece hedefin logaritması için doğrudur: Tüm diğer nitelikler sabitken bir niteliğin değerini bir birim arttırmak, hedef olasılığın logaritmasını belli bir miktar arttırır.