ENDÜSTRİ 4.0 (İNGİLİZCE, TEZSİZ)
Yüksek Lisans TYYÇ: 7. Düzey QF-EHEA: 2. Düzey EQF-LLL: 7. Düzey

Ders Tanıtım Bilgileri

Ders Kodu Ders Adı Yarıyıl Teorik Pratik Kredi AKTS
EEE5571 Biyoinformatik için Makine Öğrenimi I Güz 3 0 3 12
Bu dersin açılması ilgili bölüm tarafından yarıyıl başında belirlenir

Temel Bilgiler

Öğretim Dili: En
Dersin Türü: Departmental Elective
Dersin Seviyesi: LİSANSÜSTÜ
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Dr. Öğr. Üyesi ZAFER İŞCAN
Dersin Amacı: Bu derste öğrenciler makine öğrenmesinin temel kavramları ve bu kavramların biyoinformatik problemlerine nasıl uygulandığını öğrenirler.

Öğrenme Çıktıları

Bu dersi başarıyla tamamlayabilen öğrenciler;
1. Temel biyoinformatik uygulama ve araçlarını anlatma
2. Makine öğrenmesinin temel kavramlarını anlama
3. Denetimsiz öğrenme yöntemlerini anlama
4. Denetimli öğrenme ve sınıflandırıcı yöntemlerini anlama
5. Boyut küçültme yöntemlerini anlama
6. Makine öğrenmesi yöntemlerinin biyoinformatik problemlerine nasıl uygulandığını anlama
7. Bir makine öğrenmesi programı öğrenmek


Dersin İçeriği

1. Biyoinformatiğe giriş
2. Denetimsiz öğrenme yöntemleri: olasılık yoğunluk kestirimi, kümeleme, kendiliğinden organize olan haritalar
3. Denetimli öğrenme yöntemleri: Bayes sınıflandırıcısı, diskriminant analizi, K-en yakın komşu yöntemi, ilişkilendirme, rastgele orman yöntemi
4. Boyut küçültme yöntemleri: ana bileşen analizi, çok boyutlu ölçekleme
5. Mikro dizin ve gen idafesi

Haftalık Ayrıntılı Ders İçeriği

Hafta Konu Ön Hazırlık
1) Biyoinformatiğe giriş, biyoinformatiğin kısa tarihçesi, biyoinformatikteki veritabanı uygulamaları, internet araç ve servisleri, örüntü analizi, enformasyon teorisinin biyoinformatiğe katkısı
2) Makine öğrenmesine giriş, denetimli ve denetimsiz öğrenme, bedava öğle yemeği olmaz teoremi, çirkin ördek yavrusu teoremi, Occam'ın usturası, fazla oturma, meyil değişkenlik değiş tokuşu, çapraz doğrulama, çizme atkısı
3) Denetimsiz öğrenmeye giriş, olasılık yoğunluk kestirimi, histogram yöntemi, parametrik yöntem, parametrik olmayan yöntem: K-en yakın komşu yöntemi, çekirdek yöntemi
4) Boyut küçültme, temel bileşen analizi, bağımsız bileşen analizi, çok boyutlu ölçekleme, Sammon algoritmasının gen verisine uygulanması
5) Kümeleme analizi, hiyerarşik kümeleme, K-means kümeleme, belirsiz C-means, Gauss karışım modelleri, kümeleme algoritmalarının gen ifadesi verisine uygulanması
6) Kendi kendine organize olan haritalar, vektör nicelemesi, SOM yapısı, SOM öğrenme algoritması, SOM yönteminin sınıflandırma amaçlı kullanılması, vektör nicelemesi ve SOM yöntemlerinin biyoinformatikteki uygulamaları
7) Denetimli öğrenmeye giriş, genel kavram ve tanımlar, model değerlendirme, veri organizasyonu
8) Sınıflandırma için Bayes kuralı, minimum hata oranı sınıflandırıcısı, ayrıştırıcı fonksiyonlar, Bayes inanç ağları
9) Doğrusal ve ikinci dereceden diskriminant analizi, genelleştirilmiş diskriminant analizi, K en yakın komşu yöntemi ve gen veri analizine uygulanması
10) Sınıflandırma ve ilişkilendirme ağaçları, bileşen yolak katılımının tahmini için CART metodu, rastgele orman yöntemi ve gen ifade profillerinin incelenmesi
11) Özellik seçimi, yerleşik yöntem, lasso ilişkilendirmesi, yükselti ilişkilendirmesi, kısmi en küçük kareler algoritması, kapsamlı yöntem
12) Özellik seçimi (devam), deneyimsel yaklaşım, dikey en küçük kareler yaklaşımı, özellik seçimi kriteri: ilişki ölçütü, Fisher oranı ölçütü, müşterek bilgi ölçütü
13) Özellik çıkarımı, biyolojik veri kodlaması: molekül dizileri, kimyasal bileşenler, dizi analizi
14) Proje sunumları

Kaynaklar

Ders Notları: 1. Machine Learning Approaches to Bioinformatics, Zheng Rong Yang, World Scientific Publishing Company, 2011.
Diğer Kaynaklar: 1. Data Mining for Bioinformatics, Sumeet Dua, CRC Press, 2013. 2. Bioinformatics: The Machine Learning Approach, Pierre Baldi and Soren Brunak, 2nd edition, MIT Press, 2001. 3. Pattern Recognition and Machine Learning, Christopher M. Bishop, 2nd printing edition, Springer, 2011. 4. Pattern Recognition, Sergios Theodoridis, Konstantinos Koutroumbas, Academic Press, 4th edition, 2008. 5. Introduction to Pattern Recognition: A Matlab Approach, Sergios Theodoridis, Aggelos Pikrakis, Konstantinos Koutroumbas, Dionisis Cavouras, Academic Press, 2010. 6. Pattern Classification, Richard O. Duda, Peter E. Hart, David G. Stork, 2nd edition, Wiley-Interscience, 2000.

Değerlendirme Sistemi

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Devam 14 % 15
Laboratuar % 0
Uygulama % 0
Arazi Çalışması % 0
Derse Özgü Staj % 0
Küçük Sınavlar % 0
Ödev % 0
Sunum % 0
Projeler 1 % 30
Seminer % 0
Ara Sınavlar 1 % 15
Ara Juri % 0
Final 1 % 40
Rapor Teslimi % 0
Juri % 0
Bütünleme % 0
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 30
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 70
Toplam % 100

AKTS / İş Yükü Tablosu

Aktiviteler Aktivite Sayısı Süre (Saat) İş Yükü
Ders Saati 14 3 42
Laboratuvar 0 0 0
Uygulama 0 0 0
Derse Özgü Staj 0 0 0
Arazi Çalışması 0 0 0
Sınıf Dışı Ders Çalışması 16 2 32
Sunum / Seminer 0 0 0
Proje 8 10 80
Ödevler 5 6 30
Küçük Sınavlar 0 0 0
Ara Juri 0 0 0
Ara Sınavlar 1 3 3
Rapor Teslimi 0 0 0
Juri 0 0 0
Final 1 3 3
Toplam İş Yükü 190

Program ve Öğrenme Kazanımları İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı