CRISP-DM Veri Bilimi Metodolojisi
Veri Madenciliği için Sektörler Arası Standart Süreç(Cross-Industry Standard Process for Data Mining) anlamına gelen CRISP-DM, sektörde çok kullanılan bir Veri bilimi ve Veri Madenciliği metodolojisidir. Bu süreç, projeyi baştan sona yönetmek için adım adım bir yol haritası sunar. CRISP-DM, John Rollins metodolojisinde olduğu gibi yinelemeli…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 9-10)
Bu konuda Veri Bilimi Metodolojilerinin Dağıtım ve Geri Bildirim aşamalarından bahsederek seriyi tamamlayacağız. Dağıtım(Deployment) Bir veri bilimi modeli bir cevap sağlayacak olsa da, cevabın ilk soruyu ele aldığından emin olmalıyız. Bunun için çalışmamızı sorun ile alakalı ve kullanışlı hale getirmenin anahtarı, paydaşların ürettiğimiz uygulamayı anlamalarını,…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 7-8)
Bu başlık altında daha önceki başlıklarda incelediğimiz Veri Bilimi Metodolojileri’nin sonraki iki aşaması olan Modelleme ve Değerlendirme aşamalarına göz atacağız. Modelleme Modelleme, veri bilimi metodolojisindeki, veri bilimcisinin sosu örnekleme ve daha fazla baharata ihtiyacı olup olmadığını belirleme şansına sahip olduğu aşamadır! Bu aşama iki temel…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 5-6)
Bu başlık altında daha önceki başlıkta incelediğimiz Veri Bilimi Metodolojileri’nin ilk 4 aşamasından sonra gelen 2 aşamaya daha göz atacağız. Bunlar; 1- Veriyi Anlama Veri anlama, veri setinin oluşturulmasıyla ilgili tüm faaliyetleri kapsar. Temel olarak, veri bilimi metodolojileri içinde yer alan veri anlama bölümü, “Topladığınız…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 1-4)
Teknik bilgiyi endüstri uygulamalarına dönüştürmek ve iş dünyasının problemlerine çözümler geliştirmek için öncelikle çözüme yönelik veri bilimi metodolojileri geliştirmek gerekir. Burada bu yaklaşıma göz atacağız. Böylece zaman içinde kendi veri bilimi stratejilerinizi ve metodolojinizi geliştirmeye başladığınızı fark edeceksiniz. Veri bilimi, kapsamlı veri setlerinden değerli bilgiler…
Git ve Github ile Çalışmak
Her yazılımcının araç çantasında mutlaka bulunan Git ve GitHub’a göz atalım. Bu konu başlığı altında; uygulama kaynak kod dosyalarının ve projelerinin sürüm kontrolünü gerçekleştirmek ve aynı proje, hatta aynı kod üzerinde ekip arkadaşlarınız ile birlikte çalışabilmek için tüm yazılımcılar ve tabii ki veri bilimcileri arasında…
Anaconda
Anaconda, veri bilimi ve makine öğreniminde kullanılan en iyi diller olan Python ve R için ücretsiz ve açık kaynaklı bir geliştirme ortamıdır. Veri Bilimi için en çok kullanılan 60’ın üzerinde kütüphane kullanıma hazır gelir.
Jupyter Notebook ile Çalışmak
Jupyter Notebook; içinde çalıştırılabilir kodlar, matematiksel denklemler, grafiksel görselleştirmeler, açıklama metinleri ve linkleri ile çok daha fazlasını içeren belgeler oluşturmanıza ve paylaşmanıza olanak tanıyan tarayıcı(browser) tabanlı bir uygulamadır. Bir bilim insanının deneylerini gerçekleştirmek için tüm adımları kaydettiği ve gelecekte yeniden gerçekleştirilebilmesi için sonuçları kaydettiği laboratuvar defterine benzetilebilir. …
Kullanıma Hazır Makine Öğrenimi Modelleri
İnternet üzerinden önceden eğitilmiş ve kullanıma hazır makine öğrenimi modellerine ulaşmanızın 2 farklı yolu vardır. Bunlardan biri; microservice olarak sunuldukları bulut platformları üzerinden online kullanmaktır. Diğeri ise; çeşitli dağıtım kanalları ve model marketlerinden indirerek istediğiniz yerel ya da bulut ortamında kullanmaktır.
Makine Öğrenimi(Machine Learning) Modelleri
Makine öğrenimi(Machine Learning), verilerdeki kalıpları tanımlamak için “modeller” olarak da bilinen algoritmaları kullanır. Modelin bu kalıpları verilerden öğrendiği sürece ise “model eğitimi” denir.
Bir model eğitildikten sonra, tahminlerde bulunmak için kullanılabilir. Modele yeni veriler sunulduğunda, geçmiş verilerden öğrendiği kalıplara göre tahminler veya kararlar almaya çalışır.
Bağlantıda Kalalım