3.2 Yorumlama Metotlarının Sınıflandırılması

Makine öğrenmesinde yorumlanabilirlik metotları farklı kriterlere göre sınıflandırılabilir.

İçsel / optimizasyon sonrası (post hoc)? Bu kriter, yorumlamanın modelin karmaşıklığını azaltarak mı (içsel metotlar) yoksa modeli eğittikten sonra analiz eden metotlar kullanarak mı (optimizasyon sonrası) yapıldığı arasında bir ayrım yapıyor. İçsel yorumlanabilirlik, basit yapıları sayesinde yorumlanabilir olan modellerde (kısa karar ağaçları ve aralıklı lineer modeller) bulunur. Optimizasyon sonrasında yorumlanabilirlik, model eğitildikten sonra yorumlama metotların uygulanmasıdır. Örneğin nitelik değer sıralamasının permütasyonları, optimizasyon sonrası uygulanan bir metottur. Bu metotlar aynı zamanda içsel olarak yorumlanabilen modellere de uygulanabilir. Örneğin nitelik değer sıralamasının permütasyonları karar ağaçları için de hesaplanabilir. Kitabın bölümleri içsel yorumlanabilirlik ve optimizasyon sonrası (ve modelden bağımsız) yorumlama metotları farkına göre düzenlendi.

Yorumlama metodunun sonucu: Farklı yorumlama metotları verdikleri sonuçlara göre kabaca sınıflandırılabilir.

  • Nitelikleri özetleyen istatistikler: Bir çok yorumlama metodu nitelikleri özetleyen istatistikler verir. Bazıları her nitelik başına bir sayı verirken (nitelik değeri), nitelik çiftlerinin birbirine olan etkilerini inceleyen metot daha karmaşık bir sonuç verir (her özellik çifti için bir sayı).
  • Nitelikleri özetleyen görseller: Nitelikleri özetleyen istatistiklerin çoğu görselleştirilebilirdir. Bazı nitelik özetleri için tablo yanlış seçim olup görselleştirmek daha anlamlıdır. Bir niteliğin kısmi bağımlılığı buna bir örnektir. Kısmi bağımlılık grafikleri niteliği ve tahmin edilen ortalama değeri gösterir. Kısmi bağımlılıkları göstermenin en iyi yolu koordinatları yazdırmaktansa eğriyi çizmektir.
  • Dahili kısımlar (örn. optimize edilmiş parametreler): İçsel yorumlanabilir modellerin yorumlanması bu kategoriye dahildir. Lineer modellerde öğrenilmiş ağırlıklar veya karar ağaçlarının öğrenilen ağaç yapıları (özellikler ve eşik değerleri) örnek verilebilir. Örneğin lineer modellerde dahili kısımlar ve nitelikleri özetleyen istatistikler arasındaki fark belirsizdir çünkü ağırlıklar hem dahili kısımlar olup hem de özet istatistik değeri taşırlar. Dahili kısımları ortaya koyan bir başka metot ise convolutional sinir ağlarında öğrenilen özellik dedektörlerini görselleştirmektir. Modelin dahili kısımlarını çıktı olarak veren metotlar tanım gereği modellere özgüdür (sonraki kriteri inceleyin).
  • Veri tanesi: Var olan veya yeni oluşturulmuş bir veri örneği veren tüm metotlar bu kategoriye dahildir. Bunlardan biri karşıolgusal açıklamalardır. Bir veri tanesine dair tahmini açıklamak için metot tahmin edilen sonucu değiştiren niteliklerin değerlerini değiştirerek (ikili sınıflandırmada 0 yerine 1 tahmin edilmesi) başka bir veri bulur. Bir başka örnek ise tahmin edilen sınıfların prototiplerinin belirlenmesidir. Kullanışlı olabilmeleri için yeni bir veri tanesi oluşturan yorumlama metotlarının veri tanelerinin yorumlanabilmesine ihtiyaçları vardır. Bu metot görseller ve metin için iyi çalışsa da yüzlerce özelliğe sahip tablo verisinde pek kullanışlı değildir.
  • İçsel yorumlanabilir model: Kara kutu modelleri yorumlamanın bir diğer yöntemi ise onlara yorumlanabilir bir model ile yaklaşmaktır (evrensel veya yerel olarak). Bu yorumlanabilir model dahili kısımlara ya da niteliklerin özet istatisiklerine bakarak yorumlanır.

Modele özel / modelden bağımsız? Modele özel yorumlama metotları belli model sınıflarına özgüdür. Tanım gereği içsel yorumlanabilir modellerin yorumlanması modele özel olduğundan bir lineer modeldeki ağırlıkların yorumlanması modele özel yorumlamadır. Örneğin sadece sinir ağlarının yorumlanmasına yarayan araçlar modele özel yorumlama metotlarıdır. Modelden bağımsız metotlar ise her makine öğrenmesi modeline uygulanabilir ve model eğitildikten sonra uygulanırlar (optimizasyon sonrası). Bu agnostik metotlar genelde özellik girdilerini ve çıktı çiftlerini analiz eder. Tanım gereği bu metotlar modelin parametreleri veya yapısal detayları gibi dahili kısımlarına erişim sağlayamaz.

Yerel / global? Yorumlama metodu bir veri tanesi için yapılan tahmini mi açıklıyor yoksa modelin tüm davranışını mı? Yoksa kapsam ikisinin arasında bir yerde mi? Kapsam kriteriyle ilgili daha fazlası için sonraki bölümü okuyun.