IA368                    - Tópicos em Engenharia de Computação V                
                Turma: FF                - 
Período: 1/2026                - 
Tipo Período: 1o. período letivo                - 
Disciplina: 4 créditos.
            
            
                    
                Tema: Aprendizado por Reforço            
                        
                Ementa: Resolução de Problemas Usando Técnicas de Busca. Introdução ao Aprendizado por Reforço. Processos de decisão de Markov. Programação Dinâmica. Métodos de Monte Carlo. Aprendizado por Diferença Temporal. Métodos tabulares de planejamento e aprendizagem. Controle com política própria e aproximação. Traços de elegibilidade. Métodos do gradiente de política. Deep Reinforcement Learning: Deep Q-Learning e Gradiente de Política Avançado. Heurísticas e Metaheurísticas. Neuroevolução.            
            
                Bibliografia: 1. SUTTON, R. S.; BARTO, A. G. Reinforcement learning: an introduction. 2ª edição. Cambridge, USA: MIT Press, 2020.
2. RUSSELL, S.; NORVIG, P. Artificial intelligence: a modern approach. 3ª edição. New Jersey, USA: Prentice Hall : Pearson Education, 2010.       
3. GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A.; Deep Learning. MIT Press, 2016.
4. BISHOP, C. M. Pattern Recognition and Machine Learning. Springer, 2006.            
                    
                Forma Avaliação: Listas de exercícios, avaliação e elaboração de trabalhos em grupo em Python com apresentação final.            
                        
                Ofertar para Graduação: 
                    Sim                                    Número Limite de Alunos de Graduação: 
                    10                                    
                Aceita Estudante Especial: 
                    Sim                
                Número de Alunos Total: 
                    de 5                    até 50