C/DAWS : Big Data Analysis with Spark

Spark, temelde açık kaynak olan bir veri işleme platformudur. Hem standalone hem de cluster yapısında çalıştırabileceğiniz bu platformu doğrudan apache sitesinden indirerek veya dağıtımlarını edinerek kullanabilirsiniz. Üstelik bir çok bulut bilişim sağlayıcısı tarafından kendi bulut çözümleri arasında farklı şekillerde hizmet olarak sunulmaktadır. Spark ile Apache Hadoop platformuna göre 100 kat daha hızlı veri işleyebilirsiniz."Data Analysis with Spark" eğitiminden sonra Spark SQL ile veri ambarı ve veri gölleri oluşturabilir, Spark Streaming ile akış halindeki milyonlarca veriyi analiz edebilir, Spark ML ile Makine Öğrenimi çalışmaları yürütebilir, Spark GraphX ile en kısa yol, varlıklar arası ilişkiler gibi çeşitli graph problemlerine çözüm üretebilirsiniz. Bu eğitim Spark ile Veri Analizi konusunda büyük bir ilerleme kaydetmenizi sağlayacaktır.
Spark Mimarisi
Motor ve Ekosistem
Ortamınızı Kurmak
Spark Shell'lere Giriş
Spark'ın Temel Kavramlarına Giriş
Bağımsız Uygulamalar
RDD Temelleri
RDD İşlemleri
Dönüşümler ve Eylemler
Kalıcılık (Önbellekleme)
Key ile çalışmak
Dosya Biçimleri ve Dosya Sistemleri
Spark SQL ile Yapılandırılmış Veriler
Veritabanları
Harici Veri Kaynakları
Akümülatörler
Yayın Değişkenleri
Harici Programlara Bağlantı
Sayısal RDD İşlemleri
Spark Çalışma Zamanı Mimarisi
Spark-submit ile Uygulamaları Dağıtma
Küme Yöneticileri
Veri Yükleme ve Kaydetme
JDBC
Mimari ve Soyutlama
Dönüşümler ve Pencereleme
Çıktı İşlemleri
Giriş Kaynakları
Akış Arayüzü
Makine Öğreniminin Temelleri
Algoritmalar ve Makine Öğrenimi Problem Türleri
İşlem Hattı API'si
Spark ile grafik işleme
Grafik algoritmaları
SparkConf ile Spark'ı Yapılandırma
Yürütmenin Bileşenleri: İşler, Görevler ve Aşamalar
Spark Web Arayüzü ve Günlükleri
Temel Performans Değerlendirmeleri