1. Ana Sayfa
  2. Bigdata Eğitimleri
  3. Apache Spark Eğitimi

Apache Spark Eğitimi


Büyük veri üzerinde veri analizi ve sorgulama yapabilmek, spark ML ile makine öğrenmesi uygulamaları geliştirebilmek, büyük veri ETL ihtiyaçlarını Spark ile karşılayabilmek, Python ve Scala ile programlama yeteneklerinizi geliştirebilmek, Spark Streaming ile gerçek zamanlı (realtime) veri işleme yapabilmek için En iyi yollardan biri Apache Spark.
Apache Spark Eğitimi Apache Spark Eğitimi

Eğitim Süresi: 5 Gün (30 Saat)

Eğitim İçeriği

  • Kurulumlar
  • Temel Scala
  • Scala Başlangıç Eğitimi

Scala giriş ve kod geliştirme ortamılarının ayarlanması
Scala DataTypes
Scala Maths
Scala PrintFormat, çıktıları şekillendirme
Scala conditionals ifelse
Scala döngüler (Loops)
Scala strings
Scala Arrays
Scala Functions
Scala RandomNumbers
Scala Maps
Scala Tuples
Scala Lists
Scala Sets
Scala Classes
Spark Vectors
Spark Matrices
Değerlendirme Testi

  • Temel Spark
  • Spark Low Level (RDD) API Basic Transformations ve Actions

Bölümhakkında açıklamalar

Low Level (RDD) API giriş

RDD Wordcount örneği

SparkContext, SparkConf ve RDD oluşturma

RDD Basic Transformations ve Actions Teori

RDD basic transformations: flatMap, filter, distinct vb.

İkili RDD Transformations union, intersect, subtract

RDD Basic Actions: take, collect, aggregate,reduce vb.

RDD Intellij IDEA ile map ve flatMap Örneği

RDD Jupyter ile map ve flatMap Örneği

Spark RDD Basic Transformation ve Action Değerlendirme Testi

  • Spark Low Level (RDD) API PairRDD Transformations

PairRDD Transformations Teorik

PairRDD Transformations

Filter ile Ürünleri Bulma

İptal Edilen Toplam Satış Miktarı

mapValues ve ReduceByKey ile Mesleğe Göre Ortalama Maaş

Hadoop Ekosistemini oluşturan bileşenlerin özet tanıtımı

  • Spark Low Level API: Broadcast Variables ve Accumulators

Broadcast Variables

Accumulators

Cache ve Persistence

  • Spark High Level (Dataframe-SQL-Dataset) API

Dataframe, Dataset, SQL, Şema ve Partitions Kavramları

Spark Çalışma Planı, Transformation & Action, Lazy Evaluation

Spark Kütüphaneleri İnceleme

Dataframe Giriş: SparkSession, csv okuma, explain

Dataframe ile Wordcount Örneği

CSV Dosyası Üzerinde SQL Sorgusu Çalıştırmak

Dataframe String Fonksiyonları

Temizlenen Veriyi Diske Yazmak

Elle Şema Oluşturmak

Tarih-Saat Operasyonları

  • Veriyi Anlamak, Keşfetmek Ve Veri Ön Hazirliği

Veriyi Anlamak, Veri Keşfi ve Ön İşleme

  • Veriyi Anlamak ve Keşfetmek (Data Understanding)

Veri Setini Tanımak ve Keşfetmek

  • Veri Temizliği ve Ön Hazırlığı (Data Preparation)

Veri Temizliği ve Ön Hazırlığı

  • Pipeline

Pipeline Teori

Pipeline Uygulama

  • Apache Spark İle Makine Öğrenmesi

Makine Öğrenmesi Giriş Teori

  • Regresyon

Regresyon Giriş Teori

Basit Lineer Regresyon İş Problemi ve Veryi Tanımak

Basit Lineer Regresyon Uygulama

  • Sınıflandırma

Hata Matrisi ve Accuracy

Lojistik Regresyon Teori

Lojistik Regresyon: İş Problemi ve Veriyi Anlamak

Lojistik Regresyon Uygulama

Karar Ağacı Teori

Karar Ağacı Uygulama

Random Forest Teori

Random Forest Uygulama

Gradient-Boosted Tree Teori

Gradient-Boosted Tree Uygulama

  • Kümeleme

Kümeleme Teori

Kümeleme Uygulama

  • Model Doğrulama ve Model Başarı Değerlendirme Yöntemleri

Sınama Seti Yaklaşımı (Train Validation Split)

K-Katlı Çapraz Doğrulama (Cross Validation)

Leave-one-out ve Bootstrap Yöntemi

Model Doğrulama ve Model Başarı Değerlendirme Yöntemleri

  • Apache Spark İle Akan Veri İşleme

Eski API: Spark Streaming

StreamingContext

Discretized Streams (DStreams)

Input DStreams ve Receivers

Transformations on DStreams

DataFrame and SQL Operations

  • Apache Spark Streaming Uygulamaları

Netcat ile Gönderilen Veriyi Dinlemek

Netcat ile okunup gönderilen Dosyaları Dinlemek

Streaming olarak Dosya Okuma

Streaming Wordcount

Apache Kafka Entegrasyonu ve Kafka’dan Veri Okumak

  • Yeni API: Spark Structured Streaming

Temel Kavramlar

Creating streaming DataFrames and streaming Datasets

Input Sources

Operations on streaming DataFrames/Datasets

DataFrame and SQL Operations

Continuous Processing

  • Spark Structured Streamig Uygulamaları

Netcat ile Gönderilen Veriyi Dinlemek

Netcat ile okunup gönderilen Dosyaları Dinlemek

Streaming olarak Dosya Okuma

Streaming Wordcount

Apache Kafka Entegrasyonu ve Kafka’dan Veri Okumak

Bu eğitimi dilediğiniz zaman şirketinize/ekibinize özel olarak planlamak için bizimle iletişime geçin.

BENİ ARA
Eğitim ve danışmanlıklarımız hakkında bilgilendirmek için sizi arayalım
Eğitim danışmanlarımız sizlere en kısa sürede dönüş sağlayacaktır

Apache Spark Eğitimi

Kurumsal olarak planlayabileceğiniz bu eğitimle şirketiniz/takımınız çalışanlarının gerçek potansiyelini ortaya çıkarın. Bu eğitimin içeriğini ihtiyacınıza özel olarak düzenlemek için bizimle iletişime geçin.

Sıkça Sorulan Sorular
Farklı kurumlarda çalışan katılımcılardan oluşan belirli tarih aralıklarında gerçekleşecek olan eğitimlerdir.

Kurumsal olarak şirketinize özel istenen tarihlerde şirket çalışanlarının katıldığı bir eğitim türüdür.

Sadece kapalı sınıf şirkete özel (kurumsal) eğitimlerde eğitim içeriği ihtiyacınıza göre özelleştirilebilmektedir.

İster açık sınıf, ister kapalı sınıf şirketinize özel olarak düzenlenen eğitimlerde katılımcı adına düzenlenen eğitim adı, eğitim tarihleri gün ve saatleri, eğitmen adından oluşan ömür boyu erişilebilir dijital sertifikalar verilecektir.