4.1 Bisiklet Kiralama (Regression)
Bu veri seti, Washington D.C.'de bir bisiklet kiralama şirketi olan Capital-Bikeshare'den yapılan kiralamalar ile hava ve mevsimle ilgili bilgileri içeriyor. Veri, Capital-Bikeshare tarafından açıkça kullanıma sunuldu. Hava ve mevsimsel bilgiler Fanaee-T and Gama (2013)14 tarafından eklendi. Hedef hava ve mevsim verisinden yararlanarak kaç bisiklet kiralanacağını tahmin etmek. Veriyi şuradan indirebilirsiniz: UCI Machine Learning Repository
Kitaptaki örneklerde niteliklere yenileri eklendi ve bazı orijinal nitelikler kullanılmadı. Kullanılanlar şu şekilde:
- Günlük ve kayıtlı kullanıcıların kiraladığı bisiklet sayısı (regression'ın hedef niteliği).
- Mevsim: ilkbahar, yaz, sonbahar, kış.
- Günün tatil günü olup olmadığı bilgisi.
- Yıl: 2011 ya da 2012.
- 01.01.2011 tarihinden (veri setindeki ilk gün) itibaren geçen gün sayısı. Zamanla değişen trendi hesaplamak için kullanıldı.
- Günün iş günü mü yoksa haftasonu mu olduğu bilgisi.
- Günün hava durumu; şunlardan herhangi biri:
- temiz, az bulutlu, parçalı bulutlu, bulutlu
- sisli + bulutlu, sisli + parçalı bulutlu, sisli + az bulutlu, sisli
- hafif karlı, hafif yağmurlu + fırtınalı + dağınık bulutlu, hafif yağmurlu + dağınık bulutlu
- şiddetli yağmur + buz topakları + fırtına + sis, kar + sis
- Sıcaklık (derece Celsius).
- Bağıl nem (yüzde).
- Rüzgar hızı (km/saat).
Kitaptaki örnekler hazırlanırken veri hafifçe işlendi: işlemin R-script'ini kitabın Github repo'sunda final RData dosyasıyla birlikte bulabilirsiniz.
Fanaee-T, Hadi, and Joao Gama. “Event labeling combining ensemble detectors and background knowledge.” Progress in Artificial Intelligence. Springer Berlin Heidelberg, 1–15. doi:10.1007/s13748-013-0040-3. (2013).↩︎