CRISP-DM Veri Bilimi Metodolojisi
Veri Madenciliği için Sektörler Arası Standart Süreç(Cross-Industry Standard Process for Data Mining) anlamına gelen CRISP-DM, sektörde çok kullanılan bir Veri bilimi ve Veri Madenciliği metodolojisidir. Bu süreç, projeyi baştan sona yönetmek için adım adım bir yol haritası sunar. CRISP-DM, John Rollins metodolojisinde olduğu gibi yinelemeli…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 9-10)
Bu konuda Veri Bilimi Metodolojilerinin Dağıtım ve Geri Bildirim aşamalarından bahsederek seriyi tamamlayacağız. Dağıtım(Deployment) Bir veri bilimi modeli bir cevap sağlayacak olsa da, cevabın ilk soruyu ele aldığından emin olmalıyız. Bunun için çalışmamızı sorun ile alakalı ve kullanışlı hale getirmenin anahtarı, paydaşların ürettiğimiz uygulamayı anlamalarını,…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 7-8)
Bu başlık altında daha önceki başlıklarda incelediğimiz Veri Bilimi Metodolojileri’nin sonraki iki aşaması olan Modelleme ve Değerlendirme aşamalarına göz atacağız. Modelleme Modelleme, veri bilimi metodolojisindeki, veri bilimcisinin sosu örnekleme ve daha fazla baharata ihtiyacı olup olmadığını belirleme şansına sahip olduğu aşamadır! Bu aşama iki temel…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 5-6)
Bu başlık altında daha önceki başlıkta incelediğimiz Veri Bilimi Metodolojileri’nin ilk 4 aşamasından sonra gelen 2 aşamaya daha göz atacağız. Bunlar; 1- Veriyi Anlama Veri anlama, veri setinin oluşturulmasıyla ilgili tüm faaliyetleri kapsar. Temel olarak, veri bilimi metodolojileri içinde yer alan veri anlama bölümü, “Topladığınız…
Anaconda
Anaconda, veri bilimi ve makine öğreniminde kullanılan en iyi diller olan Python ve R için ücretsiz ve açık kaynaklı bir geliştirme ortamıdır. Veri Bilimi için en çok kullanılan 60’ın üzerinde kütüphane kullanıma hazır gelir.
Jupyter Notebook ile Çalışmak
Jupyter Notebook; içinde çalıştırılabilir kodlar, matematiksel denklemler, grafiksel görselleştirmeler, açıklama metinleri ve linkleri ile çok daha fazlasını içeren belgeler oluşturmanıza ve paylaşmanıza olanak tanıyan tarayıcı(browser) tabanlı bir uygulamadır. Bir bilim insanının deneylerini gerçekleştirmek için tüm adımları kaydettiği ve gelecekte yeniden gerçekleştirilebilmesi için sonuçları kaydettiği laboratuvar defterine benzetilebilir. …
IBM Watson ve DAX ile Paylaşılan Veri Setleri
IBM DAX; hem IBM Research, hem de güvenilir üçüncü taraf kaynaklardan seçilmiş bir açık veri seti koleksiyonu sağlar. Bu veri setleri IBM Watson ile IBM Cloud üzerinde kullanılabilir.
18- Düzenli İfadeler – Regular Expression(Regex)
Düzenli İfadeler(Regular Expression) ya da daha sık karşılaştığımız şekliyle Regex hemen hemen tüm dillerde kullanılan ve bir örüntüyü(belirli bir kurala göre tekrar eden şablon) ortaya çıkartarak metinler üzerinde arama, sınıflandırma, veri çekme gibi bir çok işlemi yapmamızı sağlayan kurallardır.
any() Fonksiyonu
Bu yazıda, Python’un dahili fonksiyonlarından biri olan any() fonksiyonunu keşfedeceğiz. any() fonksiyonu, bir tekrarlanabilir(iterable) nesne üzerindeki değerleri kontrol etmek ve en az bir değerin doğru (True) olduğunu belirlemek için kullanılır. Eğer tekrarlanabilir(iterable) nesne içinde hiçbir öğe True değilse veya tekrarlanabilir nesne boş ise, any() fonksiyonu…
all() Fonksiyonu
Python’da all() fonksiyonu, bir dizisel yapıyı parametre olarak alır. Fonksiyon, dizi içerisindeki her bir elemanın değerini True olup olmadığına göre kontrol eder. Dizi içerisindeki tüm elemanların değeri True ise fonksiyon True değerini döndürür. Dizi içerisindeki herhangi bir elemanın değeri False ise fonksiyon False değerini döndürür….
Bağlantıda Kalalım