BDA5010 Büyük Veri ve Hadoop OrtamıBahçeşehir ÜniversitesiAkademik Programlar BÜYÜK VERİ ANALİTİĞİ VE YÖNETİMİ (İNGİLİZCE, TEZLİ)Öğrenciler için Genel BilgiDiploma EkiErasmus BeyanıUlusal YeterliliklerBologna Komisyonu
BÜYÜK VERİ ANALİTİĞİ VE YÖNETİMİ (İNGİLİZCE, TEZLİ)
Yüksek Lisans TYYÇ: 7. Düzey QF-EHEA: 2. Düzey EQF-LLL: 7. Düzey

Ders Tanıtım Bilgileri

Ders Kodu Ders Adı Yarıyıl Teorik Pratik Kredi AKTS
BDA5010 Büyük Veri ve Hadoop Ortamı Güz
Bahar
3 0 3 8
Bu katalog bilgi amaçlıdır, dersin açılma durumu, ilgili bölüm tarafından yarıyıl başında belirlenir.

Temel Bilgiler

Öğretim Dili: İngilizce
Dersin Türü: Departmental Elective
Dersin Seviyesi: LİSANSÜSTÜ
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Dr. Öğr. Üyesi SERKAN AYVAZ
Dersin Amacı: Bu ders, büyük veri analizi ve veri bilimi alanlarına genel bir bakış sağlar. Konu başlıkları, büyük veri problemleri, uygulamaları ve sistemlerinin ardındaki terminoloji ve temel kavramları içeren veri analizi bağlamında ele alınmaktadır. Bu derste öğrenciler, ölçeklenebilir büyük veri analizi için kullanılan ve daha kolay ve daha erişilebilir hale getiren Hadoop ve ilgili Büyük Veri İşleme araçlarının nasıl kullanılacağını öğreneceklerdir.

Öğrenme Kazanımları

Bu dersi başarıyla tamamlayabilen öğrenciler;

1-) Ölçeklenebilir büyük veri analizi için kullanılan mimari bileşenleri ve programlama modellerini anlar.
2-) Hadoop'u kurabilir ve Hadoop'u kullanarak MapReduce programlarını çalıştırabilir.
3-) HDFS dosya sistemi ve MapReduce programlama modeli dahil çekirdek Hadoop ortamının bileşenlerini ve kullanımlarını açıklayabilir.
4-) Çeşitli büyük veri uygulamaları için gerekli olan veri toplama, izleme, depolama, analiz dahil olmak üzere sık kullanılan veri işlemlerini gerçekleştirebilir.
5-) Geleneksel Veritabanı Yönetim Sistemi ile Büyük Veri Yönetim Sistemi arasındaki farkları açıklayabilir.

Dersin İçeriği

Bu ders Hadoop Ekosistemi Temelleri, Hadoop mimarisi ve HDFS, MapReduce Programlama, Hadoop yönetimi, Apache Spark Programlama ve RDD'ler, NoSQL Veritabanları ve dağıtılmış veri depolaması ile Spark ile Hızlı Veri ve Akış İşlemeyi kapsar.

Haftalık Ayrıntılı Ders İçeriği

Hafta Konu Ön Hazırlık
1) Big Data ve Hadoop Derse Giriş
2) Hadoop Ekosistemi Temelleri
3) Hadoop mimarisi ve HDFS
4) MapReduce'a Giriş
5) MapReduce Programlama
6) Hadoop Küme Yönetimi
7) Apache Spark'a Giriş
8) Spark Programlama ve RDD'ler
9) NoSQL Veritabanları ve dağıtılmış veri depolama
10) Dağıtık veri işlemleri ve entegrasyon
11) Apache Spark ile Makine Öğrenimi
12) Apache Spark ile Hızlı Veri ve Akış İşleme
13) Proje Sunumları
14) Proje Sunumları

Kaynaklar

Ders Notları / Kitaplar: • Hadoop: The Definitive Guide, Tom White.2012.ISBN-13: 978-1449311520
• Big Data SMACK: A Guide to Apache Spark, Mesos, Akka, Cassandra, and Kafka. Isaac Ruiz and Raul Estrada. 2016.
• Big Data Analytics with Spark A Practitioner’s Guide to Using Spark for Large Scale Data Analysis. Mohammed Guller
• Data-Intensive Text Processing with MapReduce, Jimmy Lin and Chris Dyer
Diğer Kaynaklar: MapReduce Design Patterns, by Donald Miner and Adam Shook
O'Reilly Media. ISBN: 978-1-4493-2717-0
Learning Spark, by Holden Karau, Andy Konwinsky, Patrick Wendell, Matei Zaharia. O'Reilly Media. ISBN: 978-1-4493-5862-4
Big Data Science & Analytics: A Hands-On Approach. Bahga, A. and Madisetti, V., 2016.

Değerlendirme Sistemi

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Ödev 1 % 10
Projeler 1 % 30
Ara Sınavlar 1 % 20
Final 1 % 40
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 30
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 70
Toplam % 100

Program ve Öğrenme Kazanımları İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı