Fr. 88.00

N V Madhu Bindu, Thayyaba Khatoon Md, Satyanarayana S

Aprendizaje por refuerzo - Libro Nueva Generación

Spagnolo · Tascabile

Spedizione di solito entro 2 a 3 settimane (il titolo viene stampato sull'ordine)

Descrizione

Ulteriori informazioni

Este libro está estructurado en cinco unidades, que ofrecen una experiencia de aprendizaje holística. El viaje comienza con una introducción a los algoritmos bandit, en la que se exploran conceptos básicos como los algoritmos Upper Confidence Bound (UCB) y Probably Approximately Correct (PAC). La siguiente unidad introduce el marco completo del aprendizaje por refuerzo (RL), que va más allá de los algoritmos bandit para considerar las interacciones agente-entorno en múltiples pasos temporales. Se introducen los Procesos de Decisión de Markov (MDP) como marco fundamental para modelar tareas secuenciales de toma de decisiones. La cuarta unidad aborda los métodos de programación dinámica, los métodos de diferencia temporal (TD) y la ecuación de optimalidad de Bellman en RL. Estos conceptos permiten a los agentes planificar, aprender y optimizar eficazmente sus acciones. La última unidad explora técnicas avanzadas de RL, como los Trazos de Elegibilidad, la Aproximación de Funciones, los Métodos de Mínimos Cuadrados, el Aprendizaje Q Ajustado, las Redes Q Profundas (DQN) y los algoritmos de Gradiente de Políticas.

Info autore

Satyanarayana S. est un scientifique émérite, un professeur, un stratège en trading d'algos, un inventeur, un auteur et un chef d'entreprise né en Inde. Il est titulaire d'une maîtrise en sciences et ingénierie informatiques et d'un doctorat en algorithmes d'apprentissage automatique des graphes informatiques, obtenus respectivement à l'université Acharya Nagarjuna et à l'université Dravidian.

Dettagli sul prodotto

Autori	N V Madhu Bindu, Thayyaba Khatoon Md, Satyanarayana S
Editore	Ediciones Nuestro Conocimiento

Lingue	Spagnolo
Formato	Tascabile
Pubblicazione	29.08.2023

EAN	9786206403227
ISBN	978-620-6-40322-7
Pagine	140
Dimensioni	150 mm x 220 mm x 9 mm
Peso	227 g
Categoria	Scienze naturali, medicina, informatica, tecnica > Informatica, EDP > Comunicazione dati, reti

Recensioni dei clienti

Per questo articolo non c'è ancora nessuna recensione. Scrivi la prima recensione e aiuta gli altri utenti a scegliere.

Scrivi una recensione

Top o flop? Scrivi la tua recensione.

Il tuo contatto a CeDe

N V Madhu Bindu, Thayyaba Khatoon Md, Satyanarayana S

Aprendizaje por refuerzo - Libro Nueva Generación

Info autore

Recensioni dei clienti

Scrivi una recensione