Bu konuda Veri Bilimi Metodolojilerinin Dağıtım ve Geri Bildirim aşamalarından bahsederek seriyi tamamlayacağız.
Dağıtım(Deployment)
Bir veri bilimi modeli bir cevap sağlayacak olsa da, cevabın ilk soruyu ele aldığından emin olmalıyız. Bunun için çalışmamızı sorun ile alakalı ve kullanışlı hale getirmenin anahtarı, paydaşların ürettiğimiz uygulamayı anlamalarını, aşina olmalarını sağlamaktır.
Bir gerçek iş hayatı senaryosunda; çözüm sahibi, pazarlama, uygulama geliştiriciler ve BT yönetimi gibi farklı uzmanlıklara sahip paydaşlarımız olacaktır. Modelimizi değerlendirdikten ve çalışacağından emin olduktan sonra modelimizi devreye alırız ve nihai bir teste tabi tutarız. Modelin amacına bağlı olarak, sonucun her yerde genel kullanıma sunulmadan önce güven oluşturmak amacıyla sınırlı bir pilot kullanıcı gurubu ile test edebilir veya bir test ortamında kullanıma sunabiliriz.
Uygulama:
Dağıtım uygulamasıyla ilgili örnek olay incelemesi için daha önceki konularda kullandığımız Konjestif Kalp yetmezliği örneğine bakalım. Çözüm dağıtımına hazırlanırken, bir sonraki adım, yeniden kabul riskini azaltmak için müdahale programını tasarlayacak ve yönetecek olan iş grubu için bilgi sağlamaktı. Bu senaryoda, iş adamları, klinik personelinin yüksek riskli hastaları nasıl tanımlayacağını ve uygun müdahale eylemlerini nasıl tasarlayacağını anlayabilmeleri için model sonuçlarını yorumladılar.
Elbette amaç, bu hastaların taburcu olduktan sonraki 30 gün içinde yeniden başvuru olasılığını azaltmaktı. İş gereksinimleri aşamasında, Müdahale Programı Direktörü ve ekibi, Konjestif Kalp Yetmezliğinin otomatik, neredeyse gerçek zamanlı risk değerlendirmelerini sağlayacak, her personelin yanında taşıyabileceği bir tablet üzerinde çalışacak tarayıcı tabanlı uygulama istemişti.
Bu hasta verileri hastanede kalış süresi boyunca oluşturulmuştur. Veriler modelin ihtiyaç duyduğu formatta hazırlanacak ve her hasta taburcu edilme zamanına yakın puanlanacaktır. Hastane çalışanları her hasta için en güncel risk değerlendirmesine sahip olacak ve taburcu olduktan sonra müdahale için hangi hastaları hedefleyeceklerini seçmelerine yardımcı olacaktır. Çözüm dağıtımının bir parçası olarak, müdahale ekibi klinik personel için eğitim geliştirecek ve uygulayacaktır. Ayrıca, sonuçların geri bildirim aşamasından geçebilmesi ve modelin zaman içinde iyileştirilebilmesi için, müdahaleyi alan hastaları izleme süreçleri BT geliştiricileri ve veritabanı yöneticileriyle işbirliği içinde geliştirilmelidir.
Bu harita, IBM Cognos uygulaması aracılığıyla dağıtılan bir çözüm örneğidir. Bu vaka çalışmasında, Tip-1(juvenile) Diyabetli hastalar için hastaneye yatış riski üzerinde çalışılmıştır. Konjestif kalp yetmezliğinin çalışıldığı uyulamada olduğu gibi, bu uygulamada da temel teşkil edecek bir risk modeli oluşturmak için karar ağacı sınıflandırması kullanıldı. Harita, çeşitli hasta koşulları ve diğer karakteristikler tarafından öngörülen riskin etkileşimli bir analizi ile ülke çapında hastaneye yatış riskine genel bir bakış sunar.
Bu sayfa, klinik çalışanlarının seçilen hasta alt grubunda koşulların kombinasyonunu anlayabilmeleri için, modelin belirli bir düğümü içinde hasta popülasyonuna göre riskin etkileşimli bir özet raporunu gösteriyor.
Ve bu rapor, da hastanın tahmini riski ve klinik geçmişiyle ilgili ayrıntılar da dahil olmak üzere her bir hasta hakkında doktor için ayrıntılı bir özet veriyor.
Geri Bildirim(Feedback)
Yayına girdikten sonra, kullanıcılardan gelen geri bildirim; modeli iyileştirmeye, performans ve etki açısından değerlendirmeye yardımcı olacaktır. Modelin değeri, geri bildirimin başarıyla sürece dahil edilmesine bağlı olacaktır.
Veri Bilimi Metodolojisi boyunca, her adım bir sonraki aşamayı belirler. Metodolojiyi döngüsel hale getirmek, oyundaki her aşamada iyileştirme sağlar. Geri bildirim süreci, ne kadar çok bilirseniz o kadar çok bilmek isteyeceğiniz fikrine dayanır. Model; değerlendirildikten ve çalışacağından emin olduktan sonra devreye alınır ve nihai teste yani sahada aktif gerçek zamanlı kullanıma tabi tutulur.
Uygulama:
Şimdi, metodolojinin Geri Bildirim aşamasının nasıl uygulandığını görmek için vaka incelememize tekrar bakalım. Geri bildirim aşamasının planı şu adımları içeriyor:
İlk olarak, gözden geçirme süreci tanımlanacak ve Konjestif Kalp Yetmezliği risk modelinin uygulama sonuçları ölçülecektir. Sağlık kurumu yöneticileri, gözden geçirme sürecinde genel sorumluluğa sahip olacaktır.
İkinci olarak, müdahale alan Konjestif Kalp Yetmezliği hastaları izlenecek ve yeniden kabul sonuçları kaydedilecektir.
Üçüncü olarak, çalışmanın yeniden kabulleri azaltmada ne kadar etkili olduğunu belirlemek için ölçülecektir.
Etik nedenlerle, Konjestif Kalp Yetmezliği hastaları kontrollü tedavi gruplarına ayrılmamalıdır. Bunun yerine, etkisini ölçmek için modelin uygulanmasından önce ve sonra geri kabul oranları karşılaştırılacaktır. Dağıtım ve geri bildirim aşamalarından sonra, çalışmanın yeniden kabul oranları üzerindeki etkisi, uygulamanın ilk yılından sonra gözden geçirilecektir. Ardından, modelin uygulanmasından sonra derlenen tüm verilere ve bu aşamalar boyunca kazanılan bilgilere dayanarak model revize edilecektir
Diğer iyileştirmeler ise, çalışmaya katılımla ilgili bilgilerin dahil edilmesi ve ayrıntılı farmasötik verileri dahil etmek için modelin revize edilmesidir. Hatırlarsanız, farmasötik veriler o sırada hazır olmadığı için veri toplama başlangıçta ertelenmişti. Ancak modelle ilgili geri bildirim ve pratik deneyimden sonra, bu verileri eklemenin çaba ve zaman yatırımına değebileceği bir durum ortaya çıkıyor. Ayrıca, geri bildirim aşamasında diğer iyileştirmelerin kendilerini gösterme olasılığına da izin vermeliyiz. Müdahale eylemleri ve süreçleri de gözden geçirilecek ve büyük olasılıkla, ilk dağıtım ve geri bildirim yoluyla kazanılan deneyim ve bilgiye dayalı olarak iyileştirilecek ve yeniden dağıtım yapılacaktır. Son olarak, iyileştirilmiş model ve müdahale eylemleri, çalışmanın ömrü boyunca devam eden geribildirim süreci ile yeniden düzenlenecektir.
Sonuç;
Veri Bilimi metodolojisi aşağıdaki 10 sorunun cevabını aramaya yönelik bir yaklaşımdır;
Problem Aşaması;
- Çözüm aradığınız problem nedir?
- Sorunu çözebilmek için veriyi nasıl kullanabilirsiniz?
Veri ile Çalışma Aşaması;
- Problemi çözmek için ihtiyaç duyduğunuz veriler nelerdir?
- Sizi çözüme götürecek verileri nereden ve nasıl edinebilirsiniz? (Tüm kaynakları listeleyin)
- Topladığınız veri çözmek istediğiniz problemi temsil ediyor mu?
- Veri ile çalışabilmeniz ve onu kullanılabilir hale getirmeniz için gereken ek adımlar, düzenlemeler nelerdir?
Cevap Üretme Aşaması;
- Gerekli cevabı almak için veriyi görselleştirme yolları nelerdir?
- Oluştuırduğunuz model gerçekten de başlangıçtaki soruyu cevaplamanızı sağlıyor mu yoksa düzenlenmesi mi gerekiyor?
- Modeli uygulamaya koyabiliyor musunuz?
- Soruyu cevaplamak için yapıcı geri bildirimler alabiliyor musunuz?
BONUS
Bu noktaya kadar seriyi sabırla takip eden arkadaşlar için bir bonus bırakalım. Veri Bilimi Metodolojileri konusunda gerçekleştirdiğimiz kodlama uygulaması olan Ülkelere Göre Yemek Tarifleri Jupyter Notebook kodlarının tam uygulamasına şuradan erişebilirsiniz:
https://obenseven.com.tr/veri_bilimi_metodolojileri.ipynb
Terimler Sözlüğü
Term | Definition |
---|---|
Tarayıcı Tabanlı Uygulama(Browser-based application) | Modelin içgörülerine kolay erişim sağlamak için kullanıcıların bir web tarayıcısı aracılığıyla, genellikle bir tablet veya başka bir mobil cihazdan eriştiği bir uygulama. |
Döngüsel Metodoloji(Cyclical methodology) | Her aşamanın sonraki aşamalara bilgi sağladığı ve revize ettiği, veri bilimi sürecine yönelik yinelemeli bir yaklaşım. |
Veri Toplama Revizyonu(Data collection refinement) | Modelin performansını iyileştirmek için ek veri unsurları veya bilgiler elde etme süreci. |
Veri Bilimi Modeli(Data science model) | Belirli sorulara veya problemlere yanıt sağlayan veri analizi ve modellemenin sonucu. |
Geri Bildirim(Feedback) | Veri bilimi modelini revize etmek ve iyileştirmek için kullanıcılardan ve paydaşlardan girdi ve yorum alma süreci. |
Model Revizyonu(Model refinement) | Kullanıcı geri bildirimlerine ve gerçek dünya performansına dayalı olarak veri bilimi modelini ayarlama ve geliştirme süreci. |
Yeniden Dağıtım(Redeployment) | Geri bildirim ve iyileştirmelerin dahil edilmesinin ardından revize edilmiş bir modelin ve müdahale eylemlerinin uygulanması süreci. |
Gözden Geçirme Süreci(Review process) | Veri bilimi modelinin performansının ve etkisinin sistematik olarak ölçülmesi ve değerlendirilmesi. |
Çözüm Dağıtımı(Solution deployment) | Veri bilimi modelini iş veya kurumsal iş akışına uygulama ve entegre etme süreci. |
Çözüm Sahibi(Solution owner) | Veri bilimi çözümünün dağıtımını ve yönetimini denetlemekten sorumlu kişi veya ekip. |
Paydaşlar(Stakeholders) | Çözüm sahipleri, pazarlama, uygulama geliştiricileri ve BT yönetimi gibi veri bilimi modelinin sonucuna ve pratik uygulamasına ilgi duyan bireyler veya gruplar. |
Sunum – Hikaye Anlatımı(Storytelling) | Hikaye anlatımı ve sunum; mesajınızı veya fikirlerinizi izleyicinin ilgisini çeken, eğlendiren ve yankı uyandıran bir anlatı yapısı aracılığıyla aktarma sanatıdır. |
Test Ortamı(Test environment) | Veri bilimi modelinin tam ölçekli uygulamadan önce değerlendirildiği ve revize edildiği kontrollü bir ortam. |
Bağlantıda Kalalım