Günümüz bilişim sektörünün temel ihtiyaçlarının başında ölçeklenemeyen veri büyümesi gelmektedir.Gartner’in yaptığı bir çalışmaya göre Önümüzdeki 5 yıl içinde sahip olunan veri miktarı günümüzün kırk dört katına çıkmış olacak bunun sonucu olarak şirketlerin sahip oldukları veri miktarı yüzlerce terabayt hatta petabayt ölçeğine ulaşacaktır. Bu olayın sonucunda aslında ortaya Big Data çıkmaktadır ve dolayisiyla boylesine hizli buyuyen bir verinin analizi icin mevcut serverlar yeterli olamaycaktir. Bunun icinde firmalar analiz icin yeni cozumler uretmeye basladilar. Örnegin IBM netezza’yi satin aldi Oracle exanalitics’i piyasaya cikardi ve Microsoft’ta rakiplerine göre düşük maliyeti, kurumsal düzey performansı, yapısal ve büyük veri bilgilerini harmanlaması ve ölçeklenerek büyüme sağlayan Massive Parallel Processing(MPP) teknolojisi ile firmalara veri ambarı alanında yeni bir soluk getirmek için HP ile ortak bir çalışma sonucu kullanıcılarına en iyi performansı sunmak için hazırlanmış üzerinde kurulu yazılım çözümü ile hazır bir donanım olarak sunmaya karar verdi. Microsoft SQL Server PDW, HP fabrikalarında yazılım ve donanım olarak kurulup, en yüksek performansı verecek şekilde optimize edilerek teslim edilmektedir.
Peki Microsoft SQL Server PDW neler yapabilmektedir ?
* Microsoft SQL Server PDW, MPP teknolojisi ile farklı veri ambarı üstünde yazma, silme, güncelleme ve okuma gibi farklı işlemleri SMP teknolojisine göre çok daha hızlı yapmaktadır.
* Microsoft SQL Server PDW, xVelocity bellek içi (in-memory) teknolojisi sayesinde 15 kat daha fazla veri sıkıştırma ve 50 kat daha yüksek sorgu performansı sağlamaktadır.
* Microsoft İş Zekası (BI), ayıklama, aktarım ve yükleme (ETL) araçları ile bütünleşme sayesinde eksiksiz bir veri ambarı çözümü sunmaktadır.
* Microsoft, “Polybase” adını verdiği teknolojisi ile SQL Server PDW üzerinden hem yapısal veriyi hem de yapısal olmayan veriyi SQL cümlecikleri ile sorgulamayı sağlamaktadır. Bu sayede kurumlar “Büyük Veri – Big Data” altyapısını yapısal verileri ile hızlı bir şekilde entegre edebilmektedir.
Peki,PDW’yi PolyBase yetenekleri ile kullandığında bir kullanıcı neler yapabilmektedir ?
* Hadoop verisi (yapısal olmayan ya da yarı-yapısal) verisi için bir tablo yapısı tanımlamak istediğinizde harici bir tablo kullanabilir
* SQL komutlarını çalıştırarak Hadoop verisi (yapısal olmayan ya da yarı-yapısal)verilerini sorgulayabilir
* Hadoop verisi (yapısal olmayan ya da yarı-yapısal) verisini ilişkisel PDW tablosu ile birleştiren bir PDW sorgusu yürüterek Hadoop verisini PDW verisi ile entegre edebilir
* Hadoop verisi (yapısal olmayan ya da yarı-yapısal) sorgulayarak ve sonuçları bir PDW tablosuna kaydederek Hadoop verisini sürdürebilir
* PDW verinizi Hadoop’a aktararak Hadoop’u online bir arşiv olarak kullanabilir. Veriler Hadoop verisi (yapısal olmayan ya da yarı-yapısal) üzerinde online olarak saklandığı için, kullanıcılar verilerine PDW üzerinden sorgulayarak ulaşabilmektedirler.
Microsoft SQL Server PDW sisteminin kurumlara faydasını özetlersek;
* Veri ambarı ve raporlama için tasarlanmış sistem In-memory teknolojisi sayesinde yüksek performans
* Karmaşık analitik sorguları hızla cevaplayabilme OLAP yerine ROLAP mimari ile gerçek zamanlı veriye erişim
* Küp güncelleme sürecinin ortadan kalkması ROLAP sayesinde orta katman küp sunucusunun küçültülebilmesi
* T-SQL ile “Büyük Veri” sorgulayabilme
* Kolay ve yüksek ölçeklenebilirlik
* Yüksek eşzamanlı sorgu sayısı
* Yüksek süreklilik, 7×24 hizmet verebilme yeteneği
* Kaynak sistemlerden değişen veriyi yükleyebilme ve yüksek veri yükleme performansı
* Self Servis BI yaklaşımı sayesinde Bilgi İşlem üzerindeki raporlama yükünün azaltılması