ENDÜSTRİ 4.0 (İNGİLİZCE, TEZSİZ)
Yüksek Lisans TYYÇ: 7. Düzey QF-EHEA: 2. Düzey EQF-LLL: 7. Düzey

Ders Tanıtım Bilgileri

Ders Kodu Ders Adı Yarıyıl Teorik Pratik Kredi AKTS
CMP4507 Metin Madenciliği Güz 3 0 3 6
Bu dersin açılması ilgili bölüm tarafından yarıyıl başında belirlenir

Temel Bilgiler

Öğretim Dili:
Dersin Türü: Departmental Elective
Dersin Seviyesi: LİSANSÜSTÜ
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Prof. Dr. ÇAĞATAY ÇATAL
Dersin Amacı: Metinsel veri; makale, blog, tweet, haber, yayın, kitap gibi birçok ortamda giderek artmaktadır. Bu tür verilerle çalışmak ve bilgi üretebilmek; dilbilim, makine öğrenmesi, derin öğrenme, doğal dil işleme gibi birçok alandan bilgi birikimi gerektirdiğinden oldukça zordur. Bu dersin amacı; metinsel verinin kantitatif analizini sağlamak üzere metinsel belgelerde makine öğrenmesinin uygulanmasını sunmaktır. Metinsel verinin temizlenmesi, bu verinin temsili ve farklı problemlerde verinin oluşturulması genel olarak metin verisiyle çalışırken bilinmesi gereken üç önemli konudur.

Öğrenme Çıktıları

Bu dersi başarıyla tamamlayabilen öğrenciler;
1) Metinsel verinin hazırlanması konusunda gerekli yöntemleri tarif edebilmek.
2) Verinin temsili konusundaki temel yöntemleri anlama beceresine sahip olmak.
3) Metin sınıflaması problemlerinde gerekli yöntemleri uygulayarak bilgi keşfini gerçekleştirebilmek.
4) Dil modelleme beceresine sahip olmak.
5) Resimden metinsel tanımlama oluşturma beceresine sahip olmak.
6) Bir dilden diğerine makine çevirisi yapabilmek için gerekli yöntemleri tarif edebilmek.

Dersin İçeriği

1) Metin Madenciliğine giriş ve ilişkili konular (doğal dil işleme, makine öğrenmesi, derin öğrenme, derin öğrenmenin sunduğu fırsatlar)
2) Veri hazırlama yöntemlerinin açıklanması (manuel metin temizleme, NLTK ile temizleme, scikit-learn ile veri hazırlama, Keras ile veri hazırlama)
3) Veri temsili modellerinin açıklanması (Kelime çantası modeli, duygu sınıflandırma problemi için film değerlendirme verisinin hazırlanması)
4) Veri temsili konusunda kullanılan "kelime yerleştirmeleri" (word embeddings) konusunda bilgi verilmesi
5) Metin sınıflandırma probleminde uygulanabilecek yöntemlerin açıklanması
6) Ara Sınav
7) Karakter ve kelime temelli dil modellerinin açıklanması
8) Resimden metinsel tanımlama oluşturabilen yöntemlerin açıklanması
9) Bir dilden diğerine makine çevirisi konusunda bilgi verilmesi
10) Pratik Uygulama: Yapay Sinir ağı temelli kelime çatısı modeli ile duygu analizi gerçekleştirimi
11) Pratik Uygulama: Kelime yerleştirmesi ve CNN modeli ile duygu analizi, N-gram temelli CNN modeli ile duygu analizi gerçekleştirimi
12) Pratik Uygulama: Metin Oluşturma için Sinir Ağı temelli dil modeli oluşturma
13) Pratik Uygulama: Yapay Sinir ağı temelli resim tanımı oluşturma modeli oluşturma
14) Pratik Uygulama: Yapay sinir ağı temelli çeviri modeli oluşturma

Haftalık Ayrıntılı Ders İçeriği

Hafta Konu Ön Hazırlık
1) Metin Madenciliğine giriş ve ilişkili konular (doğal dil işleme, makine öğrenmesi, derin öğrenme, derin öğrenmenin sunduğu fırsatlar) • Read the Syllabus and Project Details • Read Chapter 1, 2, 3, 4 of the book (Brownlee, 2017)
2) Veri hazırlama yöntemlerinin açıklanması (manuel metin temizleme, NLTK ile temizleme, scikit-learn ile veri hazırlama, Keras ile veri hazırlama) • Read Chapter 5, 6,7 of the book (Brownlee, 2017)
3) Veri temsili modellerinin açıklanması (Kelime çantası modeli, duygu sınıflandırma problemi için film değerlendirme verisinin hazırlanması) • Read Chapter 8, 9, 10 of the book (Brownlee, 2017)
4) Veri temsili konusunda kullanılan "kelime yerleştirmeleri" (word embeddings) konusunda bilgi verilmesi • Read Chapter 11, 12, 13 of the book (Brownlee, 2017)
5) Metin sınıflandırma probleminde uygulanabilecek yöntemlerin açıklanması • Read Chapter 14, 15, 16 of the book (Brownlee, 2017)
6) Karakter ve kelime temelli dil modellerinin açıklanması • Read Chapter 17, 18 of the book (Brownlee, 2017)
7) Karakter ve kelime temelli dil modellerinin açıklanması • Read Chapter 19, 20 of the book (Brownlee, 2017)
8) Vize sınavı gözden geçirmesi • Study the topics of first seven weeks
9) Resimden metinsel tanımlama oluşturabilen yöntemlerin açıklanması • Read Chapter 21, 22, 23 of the book (Brownlee, 2017)
10) Resimden metinsel tanımlama oluşturabilen yöntemlerin açıklanması • Read Chapter 24, 25, 26 of the book (Brownlee, 2017)
11) Bir dilden diğerine makine çevirisi konusunda bilgi verilmesi • Read Chapter 27, 28 of the book (Brownlee, 2017)
12) Bir dilden diğerine makine çevirisi konusunda bilgi verilmesi • Read Chapter 29, 30 of the book (Brownlee, 2017)
13) Pratik uygulamalar Student presentations
14) Pratik Uygulamalar Student Presentations

Kaynaklar

Ders Notları: Brownlee, J. (2017). Deep Learning for Natural Language Processing: Develop Deep Learning Models for your Natural Language Problems. Machine Learning Mastery.
Diğer Kaynaklar: Ignatow, G., & Mihalcea, R. (2017). An introduction to text mining: Research design, data collection, and analysis. Sage Publications.

Değerlendirme Sistemi

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Devam 42 % 0
Laboratuar % 0
Uygulama % 0
Arazi Çalışması % 0
Derse Özgü Staj % 0
Küçük Sınavlar % 0
Ödev % 0
Sunum % 0
Projeler 57 % 40
Seminer % 0
Ara Sınavlar 15 % 20
Ara Juri % 0
Final 20 % 40
Rapor Teslimi % 0
Juri % 0
Bütünleme % 0
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 20
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 80
Toplam % 100

Program ve Öğrenme Kazanımları İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı