History

Pikachú 9e189e28e2 updated translations for ko, es, it, ja, sw, hi, tr and zh using co-op translator		8 months ago
..
1-QLearning	updated translations for ko, es, it, ja, sw, hi, tr and zh using co-op translator	8 months ago
2-Gym	updated translations for ko, es, it, ja, sw, hi, tr and zh using co-op translator	8 months ago
README.md	updated translations for ko, es, it, ja, sw, hi, tr and zh using co-op translator	8 months ago

README.md

Unescape Escape

Pekiştirmeli Öğrenmeye Giriş

Pekiştirmeli öğrenme, RL, denetimli öğrenme ve denetimsiz öğrenmenin yanında temel makine öğrenme paradigmalarından biri olarak görülür. RL, kararlarla ilgilidir: doğru kararları vermek veya en azından onlardan öğrenmek.

Bir simüle edilmiş ortamınız olduğunu hayal edin, örneğin borsa. Belirli bir düzenleme getirirseniz ne olur? Olumlu veya olumsuz bir etkisi var mı? Olumsuz bir şey olursa, bu olumsuz pekiştirmeyi almalı, ondan öğrenmeli ve rotanızı değiştirmelisiniz. Eğer olumlu bir sonuç olursa, bu olumlu pekiştirmeyi geliştirmelisiniz.

Peter ve arkadaşlarının aç kurttan kaçması gerekiyor! Görsel Jen Looper tarafından

Bölgesel Konu: Peter ve Kurt (Rusya)

Peter ve Kurt, Rus besteci Sergei Prokofiev tarafından yazılmış bir müzikli peri masalıdır. Bu, genç öncü Peter'in cesurca evinden çıkıp ormanda kurtu kovalamaya gittiği bir hikayedir. Bu bölümde, Peter'e yardımcı olacak makine öğrenme algoritmalarını eğiteceğiz:

Çevreyi keşfetmek ve optimal bir navigasyon haritası oluşturmak
Daha hızlı hareket edebilmek için kaykay kullanmayı ve üzerinde denge kurmayı öğrenmek.

🎥 Peter ve Kurt'u dinlemek için yukarıdaki görsele tıklayın

Pekiştirmeli Öğrenme

Önceki bölümlerde, iki tür makine öğrenme problemi örneği gördünüz:

Denetimli, çözmek istediğimiz probleme örnek çözümler öneren veri kümelerimiz olduğunda. Sınıflandırma ve regresyon denetimli öğrenme görevleridir.
Denetimsiz, etiketlenmiş eğitim verilerimizin olmadığı durumlarda. Denetimsiz öğrenmenin ana örneği Kümeleme'dir.

Bu bölümde, etiketlenmiş eğitim verileri gerektirmeyen yeni bir öğrenme problem türüyle tanışacaksınız. Bu tür problemlerin birkaç türü vardır:

Yarı denetimli öğrenme, çok sayıda etiketlenmemiş verinin modeli önceden eğitmek için kullanılabileceği durumlar.
Pekiştirmeli öğrenme, bir ajanının simüle edilmiş bir ortamda deneyler yaparak nasıl davranacağını öğrendiği durumlar.

Örnek - Bilgisayar Oyunu

Bir bilgisayara bir oyun, örneğin satranç veya Super Mario oynamayı öğretmek istediğinizi varsayalım. Bilgisayarın oyun oynaması için, her oyun durumunda hangi hamleyi yapacağını tahmin etmesi gerekir. Bu bir sınıflandırma problemi gibi görünse de, değildir - çünkü durumlar ve karşılık gelen eylemlerle ilgili bir veri kümesine sahip değiliz. Mevcut satranç maçları veya Super Mario oynayan oyuncuların kayıtları gibi bazı verilere sahip olsak da, bu verilerin yeterince geniş bir durumu kapsamayacağı muhtemeldir.

Mevcut oyun verilerini aramak yerine, Pekiştirmeli Öğrenme (RL), bilgisayarı birçok kez oynamaya ve sonucu gözlemlemeye dayalıdır. Bu nedenle, Pekiştirmeli Öğrenmeyi uygulamak için iki şeye ihtiyacımız var:

Bir ortam ve bir simülatör, bu da oyunu birçok kez oynamamıza izin verir. Bu simülatör, tüm oyun kurallarını, olası durumları ve eylemleri tanımlar.
Bir ödül fonksiyonu, bu da her hamle veya oyun sırasında ne kadar iyi olduğumuzu bize söyler.

Diğer makine öğrenme türleri ile RL arasındaki temel fark, RL'de genellikle oyunu bitirene kadar kazanıp kazanmadığımızı bilmememizdir. Bu nedenle, belirli bir hamlenin tek başına iyi olup olmadığını söyleyemeyiz - sadece oyunun sonunda bir ödül alırız. Amacımız, belirsiz koşullar altında bir modeli eğitmemizi sağlayacak algoritmalar tasarlamaktır. Q-learning adı verilen bir RL algoritmasını öğreneceğiz.

Dersler

Katkıda Bulunanlar

"Pekiştirmeli Öğrenmeye Giriş" Dmitry Soshnikov tarafından ♥️ ile yazılmıştır.

Feragatname: Bu belge, makine tabanlı yapay zeka çeviri hizmetleri kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hata veya yanlışlıklar içerebileceğini lütfen unutmayın. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için, profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan herhangi bir yanlış anlama veya yanlış yorumlamadan sorumlu değiliz.

README.md Unescape Escape