Bölüm 1 Yazarın Önsözü
Klinik araştırmada istatistikçi olarak çalışırken bu kitaba bir yan proje olarak başladım. Haftanın dört günü işimde, "izin" günlerimde ise yan projeler üzerine çalışıyordum. Yorumlanabilir makine öğrenmesi zamanla yan projelerimden biri haline geldi. Başta kitap yazmak gibi bir niyetim yoktu. Sadece yorumlanabilir makine öğrenmesi hakkında daha fazla kaynak bulmak ve daha fazla öğrenmekle ilgileniyordum. Makine öğrenmesinin elde ettiği başarı ve yorumlanabilirliğin önemi gereği bu konuda bolca kaynak olur diye bekliyordum, fakat sadece birkaç makale ve blog yazısıyla karşılaşıp iyi bir inceleme bulamadım: Ne kitaplar, ne öğretici yazı, ne de inceleme makaleleri; hiçbir şey. Bu boşluk bana bu kitabı yazmam için ilham verdi. Yorumlanabilirlik üzerine çalışmaya başladığımda bulmayı umduğum kitabı yazmaya başladım. Kitapla yapmak istediğim iki şey vardı: kendi adıma öğrenmek ve bu yeni bilgiyi başkalarıyla paylaşmak.
Lisans ve yüksek lisansımı istatistik üzerine LMU Munich, Almanya'da yaptım. Makine öğrenmesi hakkında bildiğim şeylerin çoğu kendime online kurslar, yarışmalar, yan projeler ve profesyonel aktivitelerle öğrettiğim şeylerdi. İstatistik geçmişim makine öğrenmesi ve özellikle yorumlanabilirlik için çok iyi bir zemindi. İstatistikte yorumlanabilir regression modelleri kurmak büyük önem taşır. Yüksek lisansımı tamamladıktan sonra doktora yapmamaya karar verdim çünkü yüksek lisans tezini yazmaktan zevk almamıştım. Yazmak beni fazla strese sokmuştu. Ben de veri bilimci olarak bir Fintech start-up'ında ve klinik araştırmada istatistikçi olarak çalıştım. Endüstride geçen bu üç yılın ardından bu kitabı yazmaya ve yorumlanabilir makine öğrenmesi alanında doktora yapmaya başladım. Kitapla birlikte yazmanın hazzına tekrar kavuştum ve kitap bana araştırma tutkusu geliştirmemde yardımcı oldu.
Bu kitap yorumalanbilir makine öğrenmesindeki birçok tekniği inceliyor. İlk bölümlerde yorumlanabilirlik kavramını ele alıyorum ve neden önemli olduğuna işaret ediyorum. Birkaç kısa hikaye bile var! Kitap açıklamaların farklı özelliklerini ve insanların iyi açıklama kıstaslarını tartışıyor. Sonrasında ise doğuştan yorumlanabilir makine öğrenmesi modellerini, örneğin regression modellerini ve kara ağaçlarını inceliyoruz. Kitabın ana odağı modelden bağımsız (model-agnostic) yorumlanabilirlik metotları. "Modelden bağımsız" demek bu metotların herhangi bir makine öğrenmesi modeline uygulanabileceği ve model eğitildikten sonra uygulandığı anlamına geliyor. Modelin bağımsızlığı bu metotları çok esnek ve güçlü kılıyor. Bazı yöntemler tekil tahminlerin nasıl yapıldığını açıklıyor: yerel yorumlanabilir modelden bağımsız açıklamalar (LIME) ve Shapley değerleri gibi. Diğer yöntemler modelin veriseti boyunca gösteridiği ortalama davranışı açıklıyor. Burada kısmi bağımlılık (partial dependence) grafiği, birikmiş yerel etkiler (accumulated local effects), niteliklerin değerlerinin permütasyonları ve diğer birçok metodu öğreneceğiz. Farklı bir kategori ise açıklama olarak bir veri tanesi (data point) oluşturan örnek bazlı metotlarla ilgili. Karşıolgusal açıklamalar, prototipler, etkili örnekler (influencial instances) ve düşman örnekler (adversarial examples) kitapta tartışılan örnek bazlı metotlardır. Aynı zamanda kitabın sonunda yorumlanabilir makine öğrenmesinin geleceğiyle ilgili birkaç düşünceye yer verildi.
Kitabı bir bölümden diğerine doğrusal bir şekilde okumak zorunda değilsiniz, ileri geri gidebilir ve ilginizi daha çok çeken konulara odaklanabilirsiniz. Tek önerim giriş ve yorumlanabilirlik bölümlerinden başlamanız. İlk paragrafta metodu özetler, sonrasında onu sezgisel anlamda, matematiksel formüllere dayanmadan açıklamaya çalışırım. Sonra da metodun teorisini inceleriz ve nasıl çalıştığına dair derin bir anlayış kazanırız. Burada bağışlanmış olmayacaksınız çünkü teoriler formüller içerecek. Yeni bir metodun en iyi örneklerle anlaşıldığına inanırım, bu yüzden her metot gerçek veriye uygulanacak. Bazı insanlar istatistikçilerin çok eleştirel olduklarını söylerler. Bence bu doğru, çünkü her bölüm ilgili yorumlama metodunun avantajları ve dezavantajlarıyla ilgili eleştirel tartışmalar içeriyor. Bu kitap metotların reklamını yapmayı amaçlamanın aksine elinizdeki problem için uygun metoda karar vermenize yardımcı olmalı. Her bölümün son kısmında mevcut yazılım uygulamalarından bahsediliyor.
Makine öğrenmesi hem araştırmadan hem de endüstriden birçok insanın dikkatini topladı. Bazen aşırı büyütülse de fazlasıyla gerçek ve etkili bir uygulama alanı mevcut. Makine öğrenmesi ürün, araştırma ve otomasyon için güçlü bir teknoloji. Sahte finansal işlemleri yakalama, film tavsiye etme ve görsel sınıflandırma bugünkü kullanım alanlarına örnek. Makine öğrenmesi modellerinin yorumlanabilir olması sık sık hayati önem taşıyor. Yorumlanabilirlik üreticiye modeli güçlendirme, modele güvenme, modelin yaptığı tahminleri anlamlandırabilme ve içgörüler kazanma imkanı sunuyor. Yorumlanabilirliğe olan ihtiyacın artması makine öğrenmesinin kullanımının artmasının doğal sonucu. Bu kitap birçok kişi için değerli bir kaynak haline geldi. Öğretmenler öğrencileri yorumlanabilirlik kavramlarıyla tanıştırmak için bu kitabı kullanıyor. Farklı yüksek lisans ve doktora öğrencilerinden bu kitabın tezleri için başlangıç noktası olduğuna ve tezde önemli bir referans olduğuna dair email'ler aldım. Kitap aynı zamanda veriyi anlamak için makine öğrenmesini kullanan uygulamalı araştırmacılara ekoloji, finans, psikoloji gibi alanlarda yardımcı oldu. Endüstride çalışan veri bilimciler bana işleri için kitabı kullandıklarını ve meslektaşlarına tavsiye ettiklerini söyledi. Birçok insan bu kitaptan faydalandığı ve model yorumlama alanında uzman olduğu için mutluyum.
Bu kitabı, model yorumlama yöntemlerini incelemek isteyen ve mesleklerinde makine öğrenmesi kullananlara tavsiye ederdim. Öğrencilere ve araştırmacılara da (yani konuyla ilgilenen herkese) tavsiye edilir. Kitaptan faydalanmak için makine öğrenmesine dair basit bir anlayışa sahip olmanız gerekir. Aynı zamanda üniversiteye giriş seviyesinde matematik, kitaptaki teorileri ve formülleri takip edebilmek için gerekli. Fakat yine de, her bölümün başındaki sezgisel açıklamaları matematik olmadan anlayabilirsiniz.
Umarım kitabı beğenirsiniz!