Portal de Administração de Conferências - CEFET-MG, 14ª Semana de Ciência & Tecnologia 2018 - CEFET-MG

Tamanho da fonte: 
WEBFEATURES: ANÁLISE DE UMA FERRAMENTA PARA EXTRAÇÃO DE CARACTERISTICAS DO CONTEÚDO TEXTUAL (PART II)
Daniel Hasan Dalip, Poliana Oliveira, Aline Cristina Pinto, Raphael Luiz Lima

Última alteração: 2018-09-18

Resumo


Recentemente, muitos pesquisadores e a indústria se interessaram em maneiras de analisar, prever e gerenciar documentos colaborativos online. Com este objetivo, é feito coleta de páginas da Web e, depois disso, extrair indicadores para representar os documentos e, assim, é possível realizar seus estudos ou entender melhor os dados coletados. No entanto, desenvolver uma ferramenta para gerar esses recursos pode ser demorado. Além disso, existem alguns indicadores para os quais precisamos de parâmetros, por exemplo, para contabilizarmos o número de frases grandes no texto, é necessário informar quantas palavras uma frase tem para ser considerada grande. Esses parâmetros precisam ser bem documentados para facilitar a reprodutibilidade do estudo. Por isso, aqui propomos o WebFeatures (http://www.webfeatures.com.br) um sistema com o objetivo de extrair indicadores textuais de conteúdo. Neste estudo, apresentamos a ferramenta proposta e suas principais funcionalidades. Uma demonstração desta ferramenta pode ser encontrada através deste link: https://youtu.be/M70rCScft_Q.Ao usar este sistema na web, esperamos que os pesquisadores e a indústria possam extrair recursos textuais de maneira mais fácil, também permitindo que eles compartilhem seu conjunto de recursos. Além disso, essa ferramenta permite que pessoas sem o conhecimento de programação extraiam indicadores de textos; portanto, esperamos que também seja útil para pessoas de outras áreas do conhecimento.

Palavras-chave


Processamento de Linguagem Natural. Caracteristicas do texto. Qualidade de Informação.