“Büyük Veri” bir şehir efsanesi mi?
İş dünyası ve özellikle teknoloji odaklı iş yapan şirket ve uzmanların iki lafından biri Büyük Veri (Big Data), saldırı tespiti ve dolandırıcılıkla mücadeleden tutun da kanser tedavisine, ürünler için doğru fiyat belirlemeye kadar her alanda Büyük Veri sihirli bir değnek olarak gösteriliyor. Peki, her şey bu kadar tozpembe mi ve söylenenlerin hepsi gerçeği yansıyor mu?
İşte size Büyük Veri ile ilgili doğru bilinen yanlışlar…
YANLIŞ 1 Büyük Veri sadece veri bilimcilerin işidir
Aslına bakacak olursanız veri bilimciler tek başına yeterli değiller. “Eğer tam olarak ne aradığınızı bilmiyorsanız büyük veriden istediğiniz bilgileri alabilecek veri bilimcilere sahip olmanız hiçbir işe yaramaz” diyor Penn Medicine şirketi Veri Analizi Sorumlusu Pat Farrell. Asıl ihtiyacınız olan Endüstriyi bilen, alan bilgisine sahip, hangi soruların cevabını aradığını bilen, endüstriniz için hangi bilgilerin değerli olabileceğini önceden tahmin edebilecek kişilerdir.
YANLIŞ 2 Veri ne kadar büyükse o kadar değerlidir
“Veri toplamak, depolamak ve kataloglamak zaman ve kaynak gerektiren bir süreç” diyor Farrell. Gelişigüzel veri toplamak, boşa kaynak tüketmek anlamına gelebilir. Farrell, veri toplamaya başlamadan önce şirketlerin hangi ölçütlere veya performans göstergelerine baktıkları konusunda emin olmaları gerektiğini söylüyor. Söz özü; Nereye gittiğinizi bilmiyorsanız hangi yoldan gittiğinizin hiçbir önemi yok.
YANLIŞ 3 Büyük veri büyük şirketler içindir
Büyük şirketlerin şirket içi veri kaynakları fazla olabilir ancak küçük şirketler de sosyal medya platformlarından, hükümet kanallarından ve veri sağlayıcılardan gelen verileri kullanarak büyük veriden yararlanabilirler. Dell’in Bilgi Yönetimi Çözümleri yöneticilerinden Darin Bartik buna katılmıyor. Bartik, “Organizasyonunuzun boyutu her ne olursa olsun, sezgilere ve duygulara dayanarak karar almaktansa verilere dayanarak karar almak her zaman daha iyidir” diyor. Üstelik Küçük şirketler verilere dayalı kararlar alarak ve aldıkları kararları boyutlarının verdiği avantajla daha hızlı uygulamaya koyarak büyük rakiplerine fark atabilirler.
YANLIŞ 4 Şimdi topla, sonra ayrıştır
“Depolama gün geçtikçe ucuzlasa da ücretsiz değil. Birçok şirketin verilerini depolamak için ihtiyaç duyduğu alanın artma hızı, veri depolamanın ucuzlama hızından da yüksek. Kısacası depolama hala önemli bir gider kalemi ve bu durum kısa sürede değişecek gibi durmuyor. San Francisco merkezli Birst adlı bulut tabanlı iş zekası sağlayıcı firmasının CEO’su Brad Peters, “Şirketler önce verileri toplamaları gerektiğini, topladıkları verilerle ne yapacaklarını daha sonra bulacaklarını düşünüyorlar” diyor Peters ve devam ediyor: “Tonlarca veri toplayan bir sürü büyük kurum görüyorum. Topladıkları veriler ile masrafları artıyor ve bundan hiçbir şey elde etmiyorlar” diyerek bu konudaki yanlışlığa dikkat çekiyor.
YANLIŞ 5 Tüm veriler eşit yaratılmıştır
Bunu unutun. Virginia Yüksek Öğretim Bakanlığı Veri Depolama Yöneticisi Tod Massa “Uğraştığım en büyük sorun, araştırmacıların bunun adil bir oyun olduğunu düşünmesi” diyor. Aslında herhangi bir veri noktası farklı kurumlar tarafından farklı şekilde ya da farklı zamanlarda ya da o kurumlardaki farklı kişilerce yayınlanabilir. Massa “Eğer sadece kendi topladığı verilerden sorumlu olan, izole bir mağaza ya da kurumdaysanız farklı bir durumla karşılaşabilirsiniz. Ancak o zaman bile verinin tanımının zaman içinde değiştiğinden şüphelenirim” diyerek endişelerini de belirtiyor. Bu yüzde analistlerin yalnızca istatistik yeteneklerine değil aynı zamanda uğraştıkları verilere ait alan bilgisine ve endüstrideki genel trendlere hakim olması gerekiyor.
YANLIŞ 6 Öngörü ne kadar spesifik olursa o kadar iyidir
Bu, her insanın doğasında var. “Pazar sabahı kesin yağış bekleniyor” diyen bir meteoroloji uzmanı, “bu hafta sonu yüzde elli ihtimalle yağmur yağması bekleniyor” diyen birinden daha inandırıcı gelir. Aslında doğru olan, tam tersi. Birçok durumda öngörünün spesifik oluşu, doğru olma şansını azaltıyor. Retention Science firmasının CEO’su Jerry Jao, bunu şu şekilde örneklendiriyor: “Bir müşterinin çok özel donanımlara sahip, özel bir dizüstü bilgisayar almak istediğini varsayalım. Aynı ürünü almış başka bir müşterinin bu alışverişi yaparken aynı zamanda pembe renkli sivri topuklu ayakkabı da aldığını varsayalım. Bu müşteriye pembe renkli sivri topuklu ayakkabı önermek çok spesifik olabilir. Hatta fazla spesifik olabilir ve hata payı oldukça yüksektir. Bu durum iş ve pazarlama yöneticileri arasında oldukça sık karşılaştığımız bir hata.”
YANLIŞ 7 Son kullanıcının büyük veriye erişmesi gerekmiyor
“Büyük veri” yüksek hızda hareket ediyor, bir sürü farklı kaynak var, hacim büyük… Sıradan çalışanlar için fazla karışıkmış gibi gözükebilir. Ancak durum hiç de böyle değil. Örneğin bir yoğun bakım ünitesindeki cihazların ürettiği tüm verileri düşünün. Kalp ritmi, nefes alma verme verileri, EKG verileri… Doktorlar ve hemşireler bu verileri yalnızca anlık olarak görebiliyorlar.
Philips Healthcare’in Hasta Bakım & Klinik Bilişim CMO’su Anthony Jones “10 dakika öncenin verilerini göremiyoruz ya da bir saat sonrası nasıl olacak kestiremiyoruz” diyor. Hastanın geçmiş verilerini görmek bir hekimin karar vermesi için çok değerli olabilir” diyerek bu durumun yanlılığına dikkat çekiyor.
YANLIŞ 8 Büyük veri büyük sorunlar içindir
Bu genel bir sorun ya da inanış. CIO’lar “Bizim büyük verideki hedefimiz sayıca az ancak yüksek değerli problemleri veri bilimcilerin de yardımıyla çözmek. Normal insanların da bu verilere erişebildiği bir kaos istemiyoruz çünkü ihtiyaçları olduğunu düşünmüyoruz” şeklinde bir ön yargıyla hareket ediyorlar. Oysa büyük veri herkesin işine yarayabilir.
Kaynak: CIO