Portal de Administração de Conferências - CEFET-MG, 14ª Semana de Ciência & Tecnologia 2018 - CEFET-MG

Tamanho da fonte: 
CLASSIFICAÇÃO ASSOCIATIVA PREGUIÇOSA COM MAPREDUCE
Alisson Marques Silva, Michel Pires Silva, Thiago Magela Rodrigues Dias, Matheus Delgado Azevedo, Álvaro Martins Espíndola

Última alteração: 2018-08-31

Resumo


A classificação associativa preguiçosa é uma abordagem de mineração de dados em que modelos locais, chamados classificadores, são produzidos sempre que uma entrada desconhecida é fornecida. Apesar de apresentar eficiência relevante, esse modelo de classificação não lida eficientemente com grandes volumes de dados devido restrições de memória. Para sobrepor esse problema, apresentamos neste trabalho uma solução paralela para a classificação preguiçosa sob um modelo de execução direcionado pela demanda. A solução proposta utiliza da não dependência dentre instâncias de entrada e MapReduce para compor um modelo de alto desempenho, em que a base se apoia em ferramentas amplamente abordadas em literatura, tais como, o Hadoop, o Zookeeper e o Spark. Resultados preliminares demonstram que ganhos relevantes no tempo de resposta e vazão dessa abordagem podem ser obtidos a partir de sua paralelização.

Palavras-chave


Mineração de dados. Processamento palelo. LAC. Classificação associativa. Ar