Вопросы о Q-Learning с использованием нейронных сетей

Я внедрил Q-Learning, как описано в,http://web.cs.swarthmore.edu/~meeden/cs81/s12/papers/MarkStevePaper.pdfЧтобы прибл.Q (S, A) Я использую структуру нейронной сети, подобную следующей:Сигмовидная активацияВходы, количество входов + 1 для нейронов действия (все входы масштабируются от 0 до 1)Выходы, одиночный выход.Q-значениеN количество M скрытых слоев.Метод исследования random 0
7 голосов | спросил Hamza Yerlikaya 7 SunEurope/Moscow2014-12-07T11:27:27+03:00Europe/Moscow12bEurope/MoscowSun, 07 Dec 2014 11:27:27 +0300 2014, 11:27:27

0 ответов


Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132