8 (812) 320-06-69

Каталог

Категории
Высшее образование (16+) (44671)
Высшее образование
Естественные науки (2770)
Естественные науки
Общественные науки (3854)
Общественные науки
Информатика и компьютерные технологии (4975)
Информатика и компьютерные технологии
Инженерное дело (1487)
Инженерное дело
Телекоммуникации, электроника, электротехника и радиотехника (1412)
Телекоммуникации, электроника, электротехника и радиотехника
Строительство. Архитектура (819)
Строительство. Архитектура
Строительство. Архитектура. Журналы (17)
Строительство. Архитектура. Журналы
Бетон и железобетон (3)
Бетон и железобетон
Жилищное строительство (7)
Жилищное строительство
Строительные материалы (7)
Строительные материалы
Юридические науки.Право (4557)
Юридические науки.Право
Отрасли права (2870)
Отрасли права
Гуманитарные науки (6444)
Гуманитарные науки
Иностранные языки (2420)
Иностранные языки
Экономика. Экономические науки (7774)
Экономика. Экономические науки
Образование. Педагогические науки (4112)
Образование. Педагогические науки
Медицина и здравоохранение (993)
Медицина и здравоохранение
Физическая культура и спорт (510)
Физическая культура и спорт
Среднее профессиональное образование (14+) (3312)
Среднее профессиональное образование
Коллекции (48316)
Коллекции
Издательские коллекции (47897)
Издательские коллекции
Журналы (1146)
Журналы
Остаться в выбранном разделе
Назад к каталогу

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Глубокое обучение с подкреплением. AlphaGo и другие технологии ISBN 978-5-4461-1079-7
ISBN 978-5-4461-1079-7
Авторы: 
Максим Лапань
Тип издания: 
Практическое издание
Издательство: 
Санкт-Петербург: Питер
Год: 
2021
Количество страниц: 
496
Аннотация

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Библиографическое описание Скопировать библиографическое описание

Максим Лапань. Глубокое обучение с подкреплением. AlphaGo и другие технологии. - Санкт-Петербург : Питер, 2021. - 496 с. - ISBN 978-5-4461-1079-7. - URL: http://new.ibooks.ru/bookshelf/371683/reading (дата обращения: 19.07.2025). - Текст: электронный.