You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
ML-For-Beginners/translations/tr/8-Reinforcement
leestott c796f3dda8
🌐 Update translations via Co-op Translator
3 weeks ago
..
1-QLearning 🌐 Update translations via Co-op Translator 3 weeks ago
2-Gym 🌐 Update translations via Co-op Translator 3 weeks ago
README.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

Pekiştirmeli Öğrenmeye Giriş

Pekiştirmeli öğrenme, RL, denetimli öğrenme ve denetimsiz öğrenmenin yanında temel makine öğrenimi paradigmalarından biri olarak görülür. RL tamamen kararlarla ilgilidir: doğru kararlar vermek veya en azından onlardan öğrenmek.

Hayal edin ki borsa gibi simüle edilmiş bir ortamınız var. Belirli bir düzenleme uygularsanız ne olur? Bunun olumlu mu yoksa olumsuz bir etkisi mi olur? Eğer olumsuz bir şey olursa, bu olumsuz pekiştirmeyi almanız, bundan öğrenmeniz ve rotanızı değiştirmeniz gerekir. Eğer olumlu bir sonuç olursa, bu olumlu pekiştirme üzerine inşa etmeniz gerekir.

peter ve kurt

Peter ve arkadaşları aç kurtlardan kaçmak zorunda! Görsel: Jen Looper

Bölgesel Konu: Peter ve Kurt (Rusya)

Peter ve Kurt, Rus besteci Sergei Prokofiev tarafından yazılmış bir müzikal masaldır. Bu hikaye, genç öncü Peter'ın cesurca evinden çıkıp kurtu kovalamak için orman açıklığına gitmesini anlatır. Bu bölümde, Peter'a yardımcı olacak makine öğrenimi algoritmalarını eğiteceğiz:

  • Keşfetmek: Çevredeki alanı keşfetmek ve en uygun navigasyon haritasını oluşturmak.
  • Öğrenmek: Daha hızlı hareket edebilmek için kaykay kullanmayı ve dengede durmayı öğrenmek.

Peter ve Kurt

🎥 Prokofiev'in Peter ve Kurt eserini dinlemek için yukarıdaki görsele tıklayın.

Pekiştirmeli Öğrenme

Önceki bölümlerde, iki tür makine öğrenimi problemini gördünüz:

  • Denetimli, burada çözmek istediğimiz probleme örnek çözümler sunan veri setlerimiz var. Sınıflandırma ve regresyon denetimli öğrenme görevleridir.
  • Denetimsiz, burada etiketlenmiş eğitim verilerimiz yok. Denetimsiz öğrenmenin ana örneği Kümeleme'dir.

Bu bölümde, etiketlenmiş eğitim verisi gerektirmeyen yeni bir öğrenme problem türüyle tanışacaksınız. Bu tür problemlerin birkaç çeşidi vardır:

  • Yarı denetimli öğrenme, burada modeli önceden eğitmek için kullanılabilecek çok miktarda etiketlenmemiş veri bulunur.
  • Pekiştirmeli öğrenme, burada bir ajan, bazı simüle edilmiş ortamlarda deneyler yaparak nasıl davranması gerektiğini öğrenir.

Örnek - Bilgisayar Oyunu

Diyelim ki bir bilgisayara bir oyun oynamayı öğretmek istiyorsunuz, örneğin satranç veya Super Mario. Bilgisayarın bir oyun oynaması için, her oyun durumunda hangi hamleyi yapacağını tahmin etmesi gerekir. Bu bir sınıflandırma problemi gibi görünebilir, ancak öyle değildir - çünkü elimizde durumlar ve karşılık gelen eylemlerle ilgili bir veri seti yoktur. Satranç maçları veya oyuncuların Super Mario oynarkenki kayıtları gibi bazı verilerimiz olabilir, ancak bu veriler muhtemelen yeterince geniş bir durum yelpazesini kapsamayacaktır.

Mevcut oyun verilerini aramak yerine, Pekiştirmeli Öğrenme (RL), bilgisayarı birçok kez oyun oynatmak ve sonucu gözlemlemek fikrine dayanır. Bu nedenle, Pekiştirmeli Öğrenmeyi uygulamak için iki şeye ihtiyacımız var:

  • Bir ortam ve bir simülatör, bu simülatör bize oyunu birçok kez oynama imkanı sağlar. Bu simülatör, tüm oyun kurallarını, olası durumları ve eylemleri tanımlar.

  • Bir ödül fonksiyonu, bu fonksiyon her hamle veya oyun sırasında ne kadar iyi performans gösterdiğimizi bize söyler.

Diğer makine öğrenimi türleri ile RL arasındaki temel fark, RL'de genellikle oyunu bitirene kadar kazanıp kazanmadığımızı bilmememizdir. Bu nedenle, belirli bir hamlenin tek başına iyi olup olmadığını söyleyemeyiz - ödülü yalnızca oyunun sonunda alırız. Amacımız, belirsiz koşullar altında bir modeli eğitmemizi sağlayacak algoritmalar tasarlamaktır. Q-learning adlı bir RL algoritmasını öğreneceğiz.

Dersler

  1. Pekiştirmeli öğrenmeye ve Q-Learning'e giriş
  2. Bir gym simülasyon ortamı kullanma

Katkıda Bulunanlar

"Pekiştirmeli Öğrenmeye Giriş" Dmitry Soshnikov tarafından ♥️ ile yazılmıştır.


Feragatname:
Bu belge, AI çeviri hizmeti Co-op Translator kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hata veya yanlışlıklar içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan yanlış anlamalar veya yanlış yorumlamalar için sorumluluk kabul etmiyoruz.