BDA5011 Big Data & AnalyticsBahçeşehir ÜniversitesiAkademik Programlar BİLGİ TEKNOLOJİLERİ (TÜRKÇE, TEZSİZ)Öğrenciler için Genel BilgiDiploma EkiErasmus BeyanıUlusal Yeterlilikler
BİLGİ TEKNOLOJİLERİ (TÜRKÇE, TEZSİZ)
Yüksek Lisans TYYÇ: 7. Düzey QF-EHEA: 2. Düzey EQF-LLL: 7. Düzey

Ders Tanıtım Bilgileri

Ders Kodu Ders Adı Yarıyıl Teorik Pratik Kredi AKTS
BDA5011 Büyük Veri ve Analitik Güz
Bahar
3 0 3 12
Bu katalog bilgi amaçlıdır, dersin açılma durumu, ilgili bölüm tarafından yarıyıl başında belirlenir.

Temel Bilgiler

Öğretim Dili: İngilizce
Dersin Türü: Departmental Elective
Dersin Seviyesi: LİSANSÜSTÜ
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Dr. Öğr. Üyesi SERKAN AYVAZ
Dersin Amacı: Bu ders, büyük veri analizi ve veri bilimi alanlarına genel bir bakış sağlar. Konu başlıkları, büyük veri problemleri, uygulamaları ve sistemlerinin ardındaki terminoloji ve temel kavramları içeren veri analizi bağlamında ele alınmaktadır. Bu derste öğrenciler, ölçeklenebilir büyük veri analizi için kullanılan ve daha kolay ve daha erişilebilir hale getiren Hadoop ve ilgili Büyük Veri İşleme araçlarının nasıl kullanılacağını öğreneceklerdir.

Öğrenme Kazanımları

Bu dersi başarıyla tamamlayabilen öğrenciler;
• Temel Big Data ve NoSQL konseptleri hakkında geniş bir anlayış elde edinir
• Günümüzde piyasada büyük talep gören büyük veri analitiği temel becerileri öğrenir.
• MapReduce programlarını ve NoSQL veritabanlarını uygulayabilir ve kullanabilir.

Dersin İçeriği

Bu derste, NoSQL veritabanları, Hadoop'a veri taşıma, HBase ile gerçek zamanlı veri analizi, Apache Hive ve Pig gibi büyük veri analitiği araçları içeren büyük veri analizi ile ilgili teknolojileri ele alınacaktır.

Haftalık Ayrıntılı Ders İçeriği

Hafta Konu Ön Hazırlık
1) Ders içeriğinin tartışılması, Hadoop ekosistemine genel bakış
2) Hadoop Mimarisi, Temel Linux Komutları, Hadoop Kurulumu
3) Hadoop'a veri transferi (SQOOP ile pratik uygulamalar)
4) Apache Pig ve Pig Latin Temelleri
5) Pig Latin Operatörleri ve Örnekleri
6) Pig ile Programlama ve Örnekler
7) Hive ve Hive Mimarisine Genel Bakış
8) HIVE Yapılandırma, Veritabanı ve Tablo İşlemleri alıştırmaları
9) HIVE Partition yapma, Bucket kullanımı, Veri Yüklenme, Operatörler ve Yerleşik Fonksiyonlar üzerinde Alıştırmalar ve Impala'ya Genel Bakış
10) HIVE View, Index, HIVEQL(Where, Order By, JOINS) Üzerine Alıştırmalar
11) Spark ve Spark Mimarisine Genel Bakış
12) Spark & Uygulamalı Pratikler
13) Spark & Uygulamalı Pratikler
14) Grup ödevlerinin öğrenci sunumları

Kaynaklar

Ders Notları / Kitaplar: Lecture notes will be provided.
Diğer Kaynaklar: Big Data Science & Analytics: A Hands-On Approach. Bahga, A. and Madisetti, V., 2016.

Değerlendirme Sistemi

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Projeler 1 % 20
Ara Sınavlar 1 % 30
Final 1 % 50
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 30
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 70
Toplam % 100

AKTS / İş Yükü Tablosu

Aktiviteler Aktivite Sayısı Süre (Saat) İş Yükü
Ders Saati 14 3 42
Sınıf Dışı Ders Çalışması 14 10 140
Proje 1 12 12
Ara Sınavlar 1 3 3
Final 1 3 3
Toplam İş Yükü 200

Program ve Öğrenme Kazanımları İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı