ENDÜSTRİ 4.0 (İNGİLİZCE, TEZSİZ) | |||||
Yüksek Lisans | TYYÇ: 7. Düzey | QF-EHEA: 2. Düzey | EQF-LLL: 7. Düzey |
Ders Kodu | Ders Adı | Yarıyıl | Teorik | Pratik | Kredi | AKTS |
CMP4507 | Metin Madenciliği | Güz | 3 | 0 | 3 | 6 |
Bu dersin açılması ilgili bölüm tarafından yarıyıl başında belirlenir |
Öğretim Dili: | |
Dersin Türü: | Departmental Elective |
Dersin Seviyesi: | LİSANSÜSTÜ |
Dersin Veriliş Şekli: | Yüz yüze |
Dersin Koordinatörü: | Prof. Dr. ÇAĞATAY ÇATAL |
Dersin Amacı: | Metinsel veri; makale, blog, tweet, haber, yayın, kitap gibi birçok ortamda giderek artmaktadır. Bu tür verilerle çalışmak ve bilgi üretebilmek; dilbilim, makine öğrenmesi, derin öğrenme, doğal dil işleme gibi birçok alandan bilgi birikimi gerektirdiğinden oldukça zordur. Bu dersin amacı; metinsel verinin kantitatif analizini sağlamak üzere metinsel belgelerde makine öğrenmesinin uygulanmasını sunmaktır. Metinsel verinin temizlenmesi, bu verinin temsili ve farklı problemlerde verinin oluşturulması genel olarak metin verisiyle çalışırken bilinmesi gereken üç önemli konudur. |
Bu dersi başarıyla tamamlayabilen öğrenciler; 1) Metinsel verinin hazırlanması konusunda gerekli yöntemleri tarif edebilmek. 2) Verinin temsili konusundaki temel yöntemleri anlama beceresine sahip olmak. 3) Metin sınıflaması problemlerinde gerekli yöntemleri uygulayarak bilgi keşfini gerçekleştirebilmek. 4) Dil modelleme beceresine sahip olmak. 5) Resimden metinsel tanımlama oluşturma beceresine sahip olmak. 6) Bir dilden diğerine makine çevirisi yapabilmek için gerekli yöntemleri tarif edebilmek. |
1) Metin Madenciliğine giriş ve ilişkili konular (doğal dil işleme, makine öğrenmesi, derin öğrenme, derin öğrenmenin sunduğu fırsatlar) 2) Veri hazırlama yöntemlerinin açıklanması (manuel metin temizleme, NLTK ile temizleme, scikit-learn ile veri hazırlama, Keras ile veri hazırlama) 3) Veri temsili modellerinin açıklanması (Kelime çantası modeli, duygu sınıflandırma problemi için film değerlendirme verisinin hazırlanması) 4) Veri temsili konusunda kullanılan "kelime yerleştirmeleri" (word embeddings) konusunda bilgi verilmesi 5) Metin sınıflandırma probleminde uygulanabilecek yöntemlerin açıklanması 6) Ara Sınav 7) Karakter ve kelime temelli dil modellerinin açıklanması 8) Resimden metinsel tanımlama oluşturabilen yöntemlerin açıklanması 9) Bir dilden diğerine makine çevirisi konusunda bilgi verilmesi 10) Pratik Uygulama: Yapay Sinir ağı temelli kelime çatısı modeli ile duygu analizi gerçekleştirimi 11) Pratik Uygulama: Kelime yerleştirmesi ve CNN modeli ile duygu analizi, N-gram temelli CNN modeli ile duygu analizi gerçekleştirimi 12) Pratik Uygulama: Metin Oluşturma için Sinir Ağı temelli dil modeli oluşturma 13) Pratik Uygulama: Yapay Sinir ağı temelli resim tanımı oluşturma modeli oluşturma 14) Pratik Uygulama: Yapay sinir ağı temelli çeviri modeli oluşturma |
Hafta | Konu | Ön Hazırlık | |
1) | Metin Madenciliğine giriş ve ilişkili konular (doğal dil işleme, makine öğrenmesi, derin öğrenme, derin öğrenmenin sunduğu fırsatlar) | • Read the Syllabus and Project Details • Read Chapter 1, 2, 3, 4 of the book (Brownlee, 2017) | |
2) | Veri hazırlama yöntemlerinin açıklanması (manuel metin temizleme, NLTK ile temizleme, scikit-learn ile veri hazırlama, Keras ile veri hazırlama) | • Read Chapter 5, 6,7 of the book (Brownlee, 2017) | |
3) | Veri temsili modellerinin açıklanması (Kelime çantası modeli, duygu sınıflandırma problemi için film değerlendirme verisinin hazırlanması) | • Read Chapter 8, 9, 10 of the book (Brownlee, 2017) | |
4) | Veri temsili konusunda kullanılan "kelime yerleştirmeleri" (word embeddings) konusunda bilgi verilmesi | • Read Chapter 11, 12, 13 of the book (Brownlee, 2017) | |
5) | Metin sınıflandırma probleminde uygulanabilecek yöntemlerin açıklanması | • Read Chapter 14, 15, 16 of the book (Brownlee, 2017) | |
6) | Karakter ve kelime temelli dil modellerinin açıklanması | • Read Chapter 17, 18 of the book (Brownlee, 2017) | |
7) | Karakter ve kelime temelli dil modellerinin açıklanması | • Read Chapter 19, 20 of the book (Brownlee, 2017) | |
8) | Vize sınavı gözden geçirmesi | • Study the topics of first seven weeks | |
9) | Resimden metinsel tanımlama oluşturabilen yöntemlerin açıklanması | • Read Chapter 21, 22, 23 of the book (Brownlee, 2017) | |
10) | Resimden metinsel tanımlama oluşturabilen yöntemlerin açıklanması | • Read Chapter 24, 25, 26 of the book (Brownlee, 2017) | |
11) | Bir dilden diğerine makine çevirisi konusunda bilgi verilmesi | • Read Chapter 27, 28 of the book (Brownlee, 2017) | |
12) | Bir dilden diğerine makine çevirisi konusunda bilgi verilmesi | • Read Chapter 29, 30 of the book (Brownlee, 2017) | |
13) | Pratik uygulamalar | Student presentations | |
14) | Pratik Uygulamalar | Student Presentations |
Ders Notları: | Brownlee, J. (2017). Deep Learning for Natural Language Processing: Develop Deep Learning Models for your Natural Language Problems. Machine Learning Mastery. |
Diğer Kaynaklar: | Ignatow, G., & Mihalcea, R. (2017). An introduction to text mining: Research design, data collection, and analysis. Sage Publications. |
Yarıyıl İçi Çalışmaları | Aktivite Sayısı | Katkı Payı |
Devam | 42 | % 0 |
Laboratuar | % 0 | |
Uygulama | % 0 | |
Arazi Çalışması | % 0 | |
Derse Özgü Staj | % 0 | |
Küçük Sınavlar | % 0 | |
Ödev | % 0 | |
Sunum | % 0 | |
Projeler | 57 | % 40 |
Seminer | % 0 | |
Ara Sınavlar | 15 | % 20 |
Ara Juri | % 0 | |
Final | 20 | % 40 |
Rapor Teslimi | % 0 | |
Juri | % 0 | |
Bütünleme | % 0 | |
Toplam | % 100 | |
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI | % 20 | |
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI | % 80 | |
Toplam | % 100 |
Etkisi Yok | 1 En Düşük | 2 Düşük | 3 Orta | 4 Yüksek | 5 En Yüksek |
Dersin Program Kazanımlarına Etkisi | Katkı Payı |