Fr. 88.00

Aprendizaje por refuerzo - Libro Nueva Generación

Spanish · Paperback / Softback

Shipping usually within 2 to 3 weeks (title will be printed to order)

Description

Read more










Este libro está estructurado en cinco unidades, que ofrecen una experiencia de aprendizaje holística. El viaje comienza con una introducción a los algoritmos bandit, en la que se exploran conceptos básicos como los algoritmos Upper Confidence Bound (UCB) y Probably Approximately Correct (PAC). La siguiente unidad introduce el marco completo del aprendizaje por refuerzo (RL), que va más allá de los algoritmos bandit para considerar las interacciones agente-entorno en múltiples pasos temporales. Se introducen los Procesos de Decisión de Markov (MDP) como marco fundamental para modelar tareas secuenciales de toma de decisiones. La cuarta unidad aborda los métodos de programación dinámica, los métodos de diferencia temporal (TD) y la ecuación de optimalidad de Bellman en RL. Estos conceptos permiten a los agentes planificar, aprender y optimizar eficazmente sus acciones. La última unidad explora técnicas avanzadas de RL, como los Trazos de Elegibilidad, la Aproximación de Funciones, los Métodos de Mínimos Cuadrados, el Aprendizaje Q Ajustado, las Redes Q Profundas (DQN) y los algoritmos de Gradiente de Políticas.

About the author










Satyanarayana S. est un scientifique émérite, un professeur, un stratège en trading d'algos, un inventeur, un auteur et un chef d'entreprise né en Inde. Il est titulaire d'une maîtrise en sciences et ingénierie informatiques et d'un doctorat en algorithmes d'apprentissage automatique des graphes informatiques, obtenus respectivement à l'université Acharya Nagarjuna et à l'université Dravidian.

Product details

Authors N V Madhu Bindu, Thayyaba Khatoon Md, Satyanarayana S
Publisher Ediciones Nuestro Conocimiento
 
Languages Spanish
Product format Paperback / Softback
Released 29.08.2023
 
EAN 9786206403227
ISBN 978-620-6-40322-7
No. of pages 140
Dimensions 150 mm x 220 mm x 9 mm
Weight 227 g
Subject Natural sciences, medicine, IT, technology > IT, data processing > Data communication, networks

Customer reviews

No reviews have been written for this item yet. Write the first review and be helpful to other users when they decide on a purchase.

Write a review

Thumbs up or thumbs down? Write your own review.

For messages to CeDe.ch please use the contact form.

The input fields marked * are obligatory

By submitting this form you agree to our data privacy statement.