área de pesquisa Ulisses Rodrigues Afonseca Um Estudo de Técnicas de Aprendizado por Reforço Livre de Modelo-Aplicação ao Pêndulo Invertido