BÜYÜK VERİ ANALİTİĞİ VE YÖNETİMİ (İNGİLİZCE, TEZSİZ) | |||||
Yüksek Lisans | TYYÇ: 7. Düzey | QF-EHEA: 2. Düzey | EQF-LLL: 7. Düzey |
Ders Kodu | Ders Adı | Yarıyıl | Teorik | Pratik | Kredi | AKTS |
BDA5010 | Büyük Veri ve Hadoop Ortamı | Güz | 3 | 0 | 3 | 8 |
Bu katalog bilgi amaçlıdır, dersin açılma durumu, ilgili bölüm tarafından yarıyıl başında belirlenir. |
Öğretim Dili: | İngilizce |
Dersin Türü: | Departmental Elective |
Dersin Seviyesi: | LİSANSÜSTÜ |
Dersin Veriliş Şekli: | Yüz yüze |
Dersin Koordinatörü: | Dr. Öğr. Üyesi SERKAN AYVAZ |
Dersin Amacı: | Bu ders, büyük veri analizi ve veri bilimi alanlarına genel bir bakış sağlar. Konu başlıkları, büyük veri problemleri, uygulamaları ve sistemlerinin ardındaki terminoloji ve temel kavramları içeren veri analizi bağlamında ele alınmaktadır. Bu derste öğrenciler, ölçeklenebilir büyük veri analizi için kullanılan ve daha kolay ve daha erişilebilir hale getiren Hadoop ve ilgili Büyük Veri İşleme araçlarının nasıl kullanılacağını öğreneceklerdir. |
Bu dersi başarıyla tamamlayabilen öğrenciler; 1-) Ölçeklenebilir büyük veri analizi için kullanılan mimari bileşenleri ve programlama modellerini anlar. 2-) Hadoop'u kurabilir ve Hadoop'u kullanarak MapReduce programlarını çalıştırabilir. 3-) HDFS dosya sistemi ve MapReduce programlama modeli dahil çekirdek Hadoop ortamının bileşenlerini ve kullanımlarını açıklayabilir. 4-) Çeşitli büyük veri uygulamaları için gerekli olan veri toplama, izleme, depolama, analiz dahil olmak üzere sık kullanılan veri işlemlerini gerçekleştirebilir. 5-) Geleneksel Veritabanı Yönetim Sistemi ile Büyük Veri Yönetim Sistemi arasındaki farkları açıklayabilir. |
Bu ders Hadoop Ekosistemi Temelleri, Hadoop mimarisi ve HDFS, MapReduce Programlama, Hadoop yönetimi, Apache Spark Programlama ve RDD'ler, NoSQL Veritabanları ve dağıtılmış veri depolaması ile Spark ile Hızlı Veri ve Akış İşlemeyi kapsar. |
Hafta | Konu | Ön Hazırlık |
1) | Big Data ve Hadoop Derse Giriş | |
2) | Hadoop Ekosistemi Temelleri | |
3) | Hadoop mimarisi ve HDFS | |
4) | MapReduce'a Giriş | |
5) | MapReduce Programlama | |
6) | Hadoop Küme Yönetimi | |
7) | Apache Spark'a Giriş | |
8) | Spark Programlama ve RDD'ler | |
9) | NoSQL Veritabanları ve dağıtılmış veri depolama | |
10) | Dağıtık veri işlemleri ve entegrasyon | |
11) | Apache Spark ile Makine Öğrenimi | |
12) | Apache Spark ile Hızlı Veri ve Akış İşleme | |
13) | Proje Sunumları | |
14) | Proje Sunumları |
Ders Notları / Kitaplar: | • Hadoop: The Definitive Guide, Tom White.2012.ISBN-13: 978-1449311520 • Big Data SMACK: A Guide to Apache Spark, Mesos, Akka, Cassandra, and Kafka. Isaac Ruiz and Raul Estrada. 2016. • Big Data Analytics with Spark A Practitioner’s Guide to Using Spark for Large Scale Data Analysis. Mohammed Guller • Data-Intensive Text Processing with MapReduce, Jimmy Lin and Chris Dyer |
Diğer Kaynaklar: | MapReduce Design Patterns, by Donald Miner and Adam Shook O'Reilly Media. ISBN: 978-1-4493-2717-0 Learning Spark, by Holden Karau, Andy Konwinsky, Patrick Wendell, Matei Zaharia. O'Reilly Media. ISBN: 978-1-4493-5862-4 Big Data Science & Analytics: A Hands-On Approach. Bahga, A. and Madisetti, V., 2016. |
Yarıyıl İçi Çalışmaları | Aktivite Sayısı | Katkı Payı |
Ödev | 1 | % 10 |
Projeler | 1 | % 30 |
Ara Sınavlar | 1 | % 20 |
Final | 1 | % 40 |
Toplam | % 100 | |
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI | % 30 | |
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI | % 70 | |
Toplam | % 100 |
Etkisi Yok | 1 En Düşük | 2 Düşük | 3 Orta | 4 Yüksek | 5 En Yüksek |
Dersin Program Kazanımlarına Etkisi | Katkı Payı |