Síntese de Comitê de Árvores de Padrões Fuzzy através da Programação Genética Cartesiana em Ambientes Não Estacionários Documento uri icon

  •  
  • Visão geral
  •  
  • Pesquisas
  •  
  • Identidade
  •  
  • Ver todos
  •  

tipo

  • master thesis

abstrato

  • A extração de dados em ambientes não estacionários requer técnicas diferentes das tradicionalmente utilizadas no aprendizado supervisionado. Aplicações como medição de temperatura por sensores, detecção de spam, previsão climática e preferência de compras de um consumidor são alguns dos exemplos de situações para as quais não é possível se supor que a distribuição dos dados não mudará no decorrer do tempo. Ambientes onde este cenário ocorre é caracterizado por mudanças denominadas concept drift. Neste trabalho é proposto um método baseado em um comitê de classificadores de árvores de padrões fuzzy, induzidos pela programação genética cartesiana, o qual deve ser capaz de se auto adaptar e manter o desempenho acurado, além de fornecer conhecimento de forma a auxiliar na tarefa de análise e interpretação dos dados. Para a execução dos experimentos foram analisadas bases de dados reais e artificiais com drifts distintos, alta dimensionalidade e diferentes balanceamentos entre as classes. Os resultados mostraram que o método é robusto e competitivo em comparação com outros da literatura.
  • Extraction of data in non-stationary environments requires techniques different from traditional approaches used in supervised learning. Applications such as temperature measurement by sensors, spam detection, climate forecast and customer buying preference are some examples of situations in which information on the data distribution may vary over time. In environments where this scenario occurs is called concept drift and it is a challenge for the classifier to learn from the data. In this work is presented a method based on an ensemble of Fuzzy Patterns Trees induced by Cartesian Genetic Program. This model must be able to self-adapt and maintain accurate performance as well as providing knowledge to help in analysis and interpretability of the data. For the execution of experiments, artificial and real database with different drifts, high dimensionality and different balance between classes were used. The results show that the method is robust and competitive with others in the literature.

data de publicação

  • 2018-01-01