A nova edição, significativamente ampliada e atualizada, de um texto amplamente utilizado sobre aprendizado por reforço, uma das áreas de pesquisa mais ativas da inteligência artificial.
O aprendizado por reforço é uma abordagem computacional de aprendizado em que um agente tenta maximizar a quantidade total de recompensa que recebe enquanto interage com um ambiente complexo e incerto. Em Reinforcement Learning, Richard Sutton e Andrew Barto oferecem uma explicação clara e simples das principais ideias e algoritmos do campo. Esta segunda edição foi amplamente expandida e atualizada, apresentando novos tópicos e revisando o tratamento de outros.
Assim como a primeira edição, esta segunda foca nos principais algoritmos de aprendizado online, com o material mais matemático destacado em caixas sombreadas. A Parte I cobre o máximo possível do aprendizado por reforço sem ultrapassar o caso tabular, para o qual é possível encontrar soluções exatas. Muitos algoritmos apresentados nesta parte são novos nesta edição, incluindo UCB, Expected Sarsa e Double Learning.
A Parte II estende essas ideias para a aproximação de funções, com novas seções sobre tópicos como redes neurais artificiais e base de Fourier, além de oferecer um tratamento expandido do aprendizado fora da política (off-policy) e dos métodos de gradiente de política.
A Parte III inclui novos capítulos sobre as relações do aprendizado por reforço com a psicologia e a neurociência, bem como um capítulo de estudos de caso atualizado que inclui o AlphaGo e o AlphaGo Zero, o jogo Atari e a estratégia de apostas do IBM Watson. O capítulo final discute os impactos sociais futuros do aprendizado por reforço.





Avaliações
Não há avaliações ainda.