Ders Bilgi Formu ( STEK 564 )
|
Temel bilgiler
|
|
Ders adı: |
Pekiştirmeli Öğrenme |
Ders kodu: |
STEK 564 |
Öğretim üyesi: |
Dr. Öğr. Üyesi Ahmet GÜNEŞ
|
AKTS kredisi: |
7.5 |
GTÜ kredisi: |
3 (3+0+0) |
Yılı, Dönemi: |
2021, Güz |
Dersin düzeyi: |
Yüksek lisans |
Dersin tipi: |
Alan seçmeli
|
Öğretim dili: |
İngilizce
|
Öğretim şekli: |
Yüz yüze
|
Ön koşullar: |
yok |
Staj durumu: |
Yok |
Dersin amacı: |
Pekiştirmeli öğrenme yaklaşımlarının öğrenilmesi ve mühendislik problemlerinde uygulanması. |
|
|
|
Öğrenme çıktıları
|
|
Bu dersi başarıyla tamamlayan öğrenciler, şu yetilere sahip olurlar:
|
|
İçerik
|
|
1. hafta: |
Makine öğrenmesi ve pekiştirmeli öğrenmedeki temel kavramlar. Derste kullanılacak programlama dili ve kütüphanelerin uygulamalarına giriş. |
2. hafta: |
Pekiştirmeli öğrenme kavramlarının tanıtılması. |
3. hafta: |
Tabular yöntemler. Markov karar süreçleri. Monte Carlo yöntemleri. Dinamik programlama. Bellman denklemleri. |
4. hafta: |
Zamansal fark öğrenmesi. TD(0). Sarsa. |
5. hafta: |
Q-öğrenmesi. |
6. hafta: |
Yaklaşık değer fonksiyonu hesaplama. Gradyan azaltma. |
7. hafta: |
Yapay sinir ağları. Pekiştirmeli öğrenmede yapay sinir ağlarının kullanılması. |
8. hafta: |
Poliçe gradyanı yaklaşımları. REINFORCE. Aktör-eleştirmen yöntemleri. |
9. hafta: |
DQN ve varyansları. |
10. hafta: |
A2C, A3C, DDPG algoritmaları. |
11. hafta: |
Pekiştirmeli öğrenmeyle örnek problemlerin çözümü. |
12. hafta: |
Pekiştirmeli öğrenmeyle örnek problemlerin çözümü. |
13. hafta: |
Pekiştirmeli öğrenmeyle örnek problemlerin çözümü. |
14. hafta: |
Pekiştirmeli öğrenmeyle örnek problemlerin çözümü. |
15. hafta*: |
Pekiştirmeli öğrenmeyle örnek problemlerin çözümü. |
16. hafta*: |
Proje Ödevlerinin Sunumu |
Ders kitapları ve materyaller: |
Reinforcement Learning: An Introduction, Suton, Barto, 2015. |
Önerilen kaynaklar: |
Applied Text Analysis with Python, Bengfort, Bilbro, Ojeda, 2018.
|
|
* 15. ve 16. haftalar arası final sınavına hazırlık haftası bulunmaktadır.
|
|
|
|
Değerlendirme
|
|
|
Değerlendirme tipi |
Hafta numarası |
Ağırlık (%) |
|
Ara sınavlar (Vizeler): |
7 |
30 |
Dönem içi diğer çalışmalar: |
|
0 |
Proje: |
1 |
20 |
Ödev: |
5 |
30 |
Kısa sınav (Quiz): |
|
0 |
Final sınavı: |
14 |
20 |
|
Toplam ağırlık: |
(%) |
|
|
|
İş yükü
|
|
|
Etkinlik |
Süre (Haftalık saat) |
Toplam hafta sayısı |
Dönem boyu toplam iş yükü |
|
Dersler (Yüz yüze öğretme): |
3 |
16 |
|
Ders dışı bireysel çalışma: |
4 |
16 |
|
Uygulama, Rehberli problem çözme: |
0 |
0 |
|
Ödev: |
2 |
5 |
|
Dönem projesi: |
2 |
2 |
|
Dönem projesi sunumu: |
2 |
2 |
|
Kısa sınav (Quiz): |
0 |
0 |
|
Ara sınav için bireysel çalışma: |
3 |
8 |
|
Ara sınav (Vize): |
2 |
2 |
|
Final sınavı için bireysel çalışma: |
3 |
8 |
|
Final sınavı: |
2 |
2 |
|
|
|
Toplam işyükü: |
|
|
|
Toplam AKTS kredisi: |
* |
|
* AKTS kredisi, toplam iş yükünün 25'e bölümüdür. (1 AKTS = 25 saatlik iş yükü)
|
|
|
-->