Глубокое обучение с подкреплением: теория и практика на языке Python
Грессер Л., Кенг В.
Тема: Библиотека программиста
Страниц: 416
ISBN: 978-5-4461-1699-7
Скан PDF
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
www.piter.com
Грессер Л., Кенг В.
Тема: Библиотека программиста
Страниц: 416
ISBN: 978-5-4461-1699-7
Скан PDF
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.

ÐлÑбокое обÑÑение Ñ Ð¿Ð¾Ð´ÐºÑеплением: ÑеоÑÐ¸Ñ Ð¸ пÑакÑика на ÑзÑке Python
СбаланÑиÑÐ¾Ð²Ð°Ð½Ð½Ð°Ñ ÐºÐ½Ð¸Ð³Ð° о ÑеоÑии и ÑеализаÑии нейÑоÑеÑей меÑодом глÑбокого обÑÑÐµÐ½Ð¸Ñ Ñ Ð¿Ð¾Ð´ÐºÑеплением.