Veri Bilimi; verileri keşfetme, işleme ve analiz etme yolu ile soruları yanıtlamak veya önerilerde bulunmak için verileri kullanan bir alandır.

Veri analizi yeni bir kavram değildir. Ancak günümüzde çok çeşitli kaynaklardan büyük miktarda veri toplanabilmektedir. Log dosyaları, Email’ler, Sosyal Medya, Satış verileri, Hasta kayıtları, Sporcu performans kayıtları, Sensör verileri, Güvenlik kameraları gibi.

Günümüzde tüm zamanlardan daha çok veriye sahip olmanın yanı sıra bunları işleyebilecek ve verileri anlamlı bilgilere dönüştürebilecek hesaplama gücü de bilgisayarlar ile beraberinde geliştirilmektedir.

Veri bilimi işletmelerin;

  • Sektörlerini anlamalarına,
  • Mevcut sorunları analiz etmelerine,
  • Önceden gizlenmiş fırsatları ortaya çıkarmalarına

yardımcı olur.

Peki veri bilimi şirketlere bu katkıyı nasıl sağlar?

Şirketler veri biliminin belirli bir sorunlarına çözüm bulmasını talep edecekleri için, öncelikle sorunu netleştirmek gereklidir. Bu ilk adım veri bilimi projesinin nasıl ilerleyeceğini tanımladığı için çok önemlidir. Bu nedenle iyi bir veri bilimci, işletmenin ihtiyaçlarını anlayarak sorunu tespit edebilmek için sorular soran araştırmacı kişidir.

Bir sonraki adım ise sorunu çözmek için hangi verilere ihtiyacımız olduğunu ve bu verileri nasıl temin edebileceğimizi bulmaktır.

Veri bilimciler, bir çok kaynaktan alınan yapılandırılmış ve yapılandırılmamış verileri analiz edebilir ve verinin yapısına bağlı olarak farklı analiz yöntemlerinden hangisini uygulayacaklarına karar verirler.

Verileri keşfetmek için birden fazla modelin kullanılması kalıpları ve aykırı değerleri tespit etmenizi sağlar. Bu incelemeler bazen işletmelerin sorularını yanıtlarken bazen de yeni bilgiler edinilmesine vesile olur. Bu da işletmenin önünde yeni yollar açılmasını sağlar.

Veri bilimciler güçlü veri görselleştirme araçları kullanarak işletmenin ilgilendiği konudaki sorunun çözümü için alınacak önlemleri ve önerilecek yöntemleri sağlarlar.

Eski Problemler, Yeni Çözümler

Tüm şirketler mevcut sorunlara en uygun çözümleri bulabilmek için aynı veri bilimi ilkelerinden faydalanmaktadırlar.

Eski problemlere yeni çözümler sunan şu 3 veri bilimi örneğine göz atalım;

Uber, taşımacılık sektöründe kaç şoför ihtiyacı olduğunun ve daha fazla şoför ihtiyacı olduğunda yeni şoförlerin sisteme dahil olmasının sonuçları ile ilgili gerçek zamanlı verileri toplamaktadır. Uber, şoförün ödemeye hazır olduğu bir ücret ile doğru sayıda şoförü doğru zamanda konumlandırmak için verileri kullanır.

Kanada’nın Toronto şehrinde toplu taşıma işlerini yürüten Toronto Ulaşım Komisyonu, trafik akışlarını yeniden planlarken veri bilimi araçlarını ve analizini kullandı. Müşteri şikayet verileri analiz edildi. Ana güzergahlardaki trafik performansını daha iyi anlayabilmek için prob verileri kullanıldı. Hem operasyon, hem planlama, hem de değerlendirme için büyük verilerden daha iyi yararlanabilecekleri bir ekip oluşturdular. Yoğun saat aralıklarına odaklanarak ve en sıkışık rotaları belirlenerek, trafik sıkışıklığı nedeniyle kaybedilen aylık zaman ortalaması 2010’da 4.75 saat iken 2014 ortalarında 3 saate düşürüldü.

Çevre sorunları ile mücadelede de veri bilimi önemli katkılar sağlamaktadır.  Tatlı su kaynakları içme suyu ve tarımsal sulama gibi ekolojik ihtiyaçları karşılamada kullanılır. Ancak bu kaynaklar, siyanobakteriyel çiçeklenme(Cyanobacterial Bloom) adı verilen bir tehditle karşı karşıyadır. Amerika’da Maine’den Güney Carolina’ya uzanan araştırma merkezlerinden bir bilim adamı ekibi doğu kıyısındaki su kaynaklarında bulunan siyanobakteriyel çiçeklenme miktarını keşfetmek için yüksek teknoloji araçlar geliştiriyor ve kullanıyorlar. Bu kaynaklardaki fiziksel, kimyasal ve biyolojik verileri ölçmek için robotik tekneler, şamandıralar ve kameralı drone’lar kullanıyorlar. Bu sayede büyük miktarda veri topluyorlar. Ekip verileri değerlendirmek için yeni algoritmik modeller de geliştiriyor. Bu bilgiler, siyanobakteriyel çiçeklerin hangi zamanda ve konumda ortaya çıkabileceğine dair daha iyi tahminler yapılmasını sağlayarak halk sağlığını korumak için önlemler alınmasını sağlıyorlar.

Bunlar gibi çok farklı alanlarda yeni nesil bilim insanları toplumsal sorunları çözebilecek yeni modelleri veri bilimi araçlarıyla geliştiriyorlar.

Öyleyse daha verimli ve iyi bir çözümü nasıl elde ederiz?

  • Sorunu tanımlayıp ve net bir şekilde anlaşılmasını sağlayarak
  • Analiz için verileri toplayarak
  • Kullanılacak doğru araçları tanımlayarak
  • Bir veri stratejisi geliştirerek

Ayrıca vaka çalışmaları da potansiyel çözümleri özelleştirmede yararlıdır. Bu koşullar mevcut olduğunda ve veriler çıkartıldığında, bir makine öğrenmesi modeli geliştirebilirsiniz.

Bir işletmenin  veri bilimini kullanarak  veri stratejisi için en iyi uygulamayı geliştirmesi zaman alıcı bir işlemdir. Ancak elde edilen fayda buna değer olduğunun kanıtıdır.

Not: Karmaşık makine öğrenimi algoritmalarını kullanmak, her zaman daha iyi bir performans elde etmeyi garanti etmez. Bazen, “En Yakın Komşu” gibi basit bir algoritma, karmaşık bir algoritma kullanılarak elde edilene kıyasla daha iyi bir performans sağlayabilir. Hangi yöntemin daha iyi sonuç vereceği tamamen kullandığınız verilere bağlıdır.