Spark, temelde açık kaynak olan bir veri işleme platformudur. Hem standalone hem de cluster yapısında çalıştırabileceğiniz bu platformu doğrudan apache sitesinden indirerek veya dağıtımlarını edinerek kullanabilirsiniz. Üstelik bir çok bulut bilişim sağlayıcısı tarafından kendi bulut çözümleri arasında farklı şekillerde hizmet olarak sunulmaktadır. Spark ile Apache Hadoop platformuna göre 100 kat daha hızlı veri işleyebilirsiniz."Data Analysis with Spark" eğitiminden sonra Spark SQL ile veri ambarı ve veri gölleri oluşturabilir, Spark Streaming ile akış halindeki milyonlarca veriyi analiz edebilir, Spark ML ile Makine Öğrenimi çalışmaları yürütebilir, Spark GraphX ile en kısa yol, varlıklar arası ilişkiler gibi çeşitli graph problemlerine çözüm üretebilirsiniz. Bu eğitim Spark ile Veri Analizi konusunda büyük bir ilerleme kaydetmenizi sağlayacaktır.
•Spark Mimarisi
•Motor ve Ekosistem
•Ortamınızı Kurmak
•Spark Shell'lere Giriş
•Spark'ın Temel Kavramlarına Giriş
•Bağımsız Uygulamalar
•RDD Temelleri
•RDD İşlemleri
•Dönüşümler ve Eylemler
•Kalıcılık (Önbellekleme)
•Key ile çalışmak
•Dosya Biçimleri ve Dosya Sistemleri
•Spark SQL ile Yapılandırılmış Veriler
•Veritabanları
•Harici Veri Kaynakları
•Akümülatörler
•Yayın Değişkenleri
•Harici Programlara Bağlantı
•Sayısal RDD İşlemleri
•Spark Çalışma Zamanı Mimarisi
•Spark-submit ile Uygulamaları Dağıtma
•Küme Yöneticileri
•Veri Yükleme ve Kaydetme
•JDBC
•Mimari ve Soyutlama
•Dönüşümler ve Pencereleme
•Çıktı İşlemleri
•Giriş Kaynakları
•Akış Arayüzü
•Makine Öğreniminin Temelleri
•Algoritmalar ve Makine Öğrenimi Problem Türleri
•İşlem Hattı API'si
•Spark ile grafik işleme
•Grafik algoritmaları
•SparkConf ile Spark'ı Yapılandırma
•Yürütmenin Bileşenleri: İşler, Görevler ve Aşamalar
•Spark Web Arayüzü ve Günlükleri
•Temel Performans Değerlendirmeleri
