Yeni Nesil Veri Ambarı – Microsoft SQL Server 2012 Paralel Data Warehouse

Microsoft SQL Server 2012 Parallel Data Warehouse (PDW) veri analizlerinizi hızlı bir şekilde çalıştırmak ve tek bir cihaz içerisinde depolamayı birkaç terabayttan 6 petabayt üzerine ölçeklendirebilmenize imkân sunan yeni nesil bir platformdur.

PDW, sisteminize en yüksek performansı sunmak için, önceden yapılandırılmış ve kurulmuş donanım ve yazılımla gelir. PDW sade bir tasarıma sahiptir; bu sayede hem öğrenmesi hem de yönetmesi kolaydır.

Peki böyle bir platformu neden tercih etmeliyiz, hep birlikte 10 adımda inceleyelim;

1. Ölçeklenebilir

PDW, depolamayı tek bir cihazda birkaç terabayttan 6 petabaytın üzerine çıkarabilen bir ölçeklenebilirlik sağlamaktadır. SMP (SQL Server 2008 R2, SQL Server 2012, Oracle vs) sistemlerinde daha fazla veri saklayabilmek için daha fazla sunucu almak gerekirken, PDW farklı olarak, mevcut sisteme yapılan ilavelerle büyür. PDW sistemi mevcut yapıya ‘ölçeklendirme birimi’ ekleyerek genişler.

pdw1

2. Hızlı

PDW’nin büyük ölçekli paralel işlem (MPP) tasarımı sayesinde sorgular, simetrik çoklu işlem (SMP) veri tabanı yönetim sistemleri üzerinde kurulmuş geleneksel veri ambarları ile kıyaslandığında ortalama 50 kat daha hızlı bir şekilde tamamlanmaktadır.  50 kat hız sorguların saatler yerine dakikalar hatta saniyeler içerisinde tamamlanması anlamına gelmektedir.

pdw2

Sorgular paralel yürütülmektedir. Kullanıcı verileri Hesaplama düğümleri olarak adlandırılan işlem ve depolama birimleri arasında dağıtılmıştır. Her bir Hesaplama biriminin kendine ait depo, işlemci ve belleği vardır; bunlar birlikte bağımsız bir işlemci birimi olarak çalışır. Kontrol düğümü PDW’nin beynidir ve her bir kullanıcı sorgusunun tüm Hesaplama birimleri üzerinde nasıl çalıştırılacağını belirler. Bu sayede de sorgular hızlı bir şekilde tamamlanır. Ağ iletişimde ise Yüksek Hızlı InfiniBand Ağı kullanılır.

3. Güvenilir

PDW verilerinizi güvenli ve kullanılabilir halde tutma konusunda güvenebileceğiniz bir platformdur. Tüm donanım ve yazılım bileşenleri, yüksek yedeklilik ve yüksek süreklilik için tasarlanmıştır.

4. Yüksek Süreklilik

PDW’nin donanım ve yazılım mimarisi yüksek süreklilik elde edebilmek için birlikte oluşturulmuştur. Windows Server 2012 içerisinde yer alan özellikleri kullanarak PDW her bir düğümü sanal bir ortam içerisinde çalıştırabilir. Bu yetenek sayesinde düğümler teknik olarak herhangi bir sunucu üzerinde çalışabilir. PDW, bir sunucu arıza yaptığında, sanal bir makine üzerinde çalışan düğümü ayrı bir sunucuya devretmek için Windows Failover Clustering özelliğini kullanır.

5. Kullanımı ve Yönetimi Kolay

PDW basit bir tasarıma sahiptir. PDW, verilerin tamamının cihaz düğümlerine dağıtılması için gereken tüm detayları kendisi uygular, sorguların paralel bir şekilde işlenmesi için gerekli ekstra adımları atar ve basit donanım ve yazılım yapılandırma ayarlarınızı kendiliğinden yönetir. PDW veri merkezinize önceden yapılandırılmış ve test edilmiş olarak gelir; sizin tek yapmanız gereken PDW’yi veri merkezinize takmak ve ağ iletişimi ortamınıza göre yapılandırmaktır. PDW’u veri merkezinize geldiği gün kullanmaya başlayabilirsiniz.

pdw3

Configuration Manager sayesinde kurulum kolay bir şekilde yapılabilir.

pdw4

Cihazı izleyebilmek için bir admin konsolu bulunmaktadır.

6. Hadoop ile Entegrasyon

PDW’nin PolyBase teknolojisi, T-SQL kullanarak Hadoop verilerini sorgulamanıza ve ilişkisel verilerinizle birleştirmenize imkân verir. PolyBase’in T-SQL arabirimini kullanarak Hadoop içerisinde MapReduce sorgularını zorlanmadan veri madenciliği, raporlama ve analizler gerçekleştirebilirsiniz. Örneğin sorgular Hadoop ve PDW verilerini tek bir aşamada birleştirebilirsiniz.

pdw5

7. Yüksek Sıkıştırma Oranı

PDW, verileri disk üzerinde tutmak için bellek içi kümelenmiş columnstore dizinlerini kullanarak yüksek sıkıştırma oranları elde eder. Bu sayede depolama masraflarını azaltır ve sorgu performansını iyileştirir.

8. Hızlı Veri Yükleme Kolaylığı

PDW, verilerinizi SQL Server 2012’dan 7 kat hızlı yükler. Yükleme işi PDW’de çok daha hızlıdır çünkü veri paralel olarak SQL Server’ın birden çok belleğine yüklenir.

9. Daha Fazla Veri tutma Kolaylığı

PDW’nin ölçeklendirilebilir mimarisi, kapasite eklemeyi kolaylaştırır ve bu sayede analizler ve raporlamalar için daha fazla veriyi çevrimiçi olarak tutabilirsiniz. Ayrıca SMP sistemlerinde de olduğu gibi, verilerinizi bölümlere ayırabilir ve ihtiyacınıza göre belirli bölümleri veri ambarınızda arşivleyebilirsiniz.

10. İş Zekâsı Araçlarıyla Entegrasyon

PDW’nin İş Zekâsı (BI) araçlarıyla kolay entegrasyonu PDW’yi veri madenciliği ve analiz çözümleri için kapsamlı bir platforma dönüştürmektedir. PDW, Reporting Services, Analysis Services, PowerPivot ve PowerView gibi Microsoft İş Zekâsı çözümleriyle entegre olmaktadır. PDW aynı zamanda Business Objects, Cognos, SAP Data Integrator, Tableau, MicroStrategy, QlikView, Oracle Business Intelligence ve TIBCO Spotfire gibi sayısı gittikçe artan çözümle de entegre olabilmektedir.