Tamanho da fonte:
ESTIMAÇÃO DE CADEIAS DE MARKOV COM ALCANCE VARIÁVEL E SUAS APLICAÇÕES
Última alteração: 2021-09-29
Resumo
https://youtu.be/Zca5MoW55dk
A finalidade deste projeto foi estimar uma cadeia de Markov de alcance variável utilizando um conjunto de dados com alfabeto A e contextos E. Estas cadeias são muito úteis pois nos permitem determinar a probabilidade de ocorrência de determinado elemento considerando uma parte variável do passado, denominada de contextos. Esta cadeia de Markov é apresentada em uma forma especial denominada árvore de contexto, uma árvore onde apresentamos os contextos. Temos também a matriz de transição P. Para a execução deste projeto, fizemos um levantamento bibliográfico sobre cadeias de alcance fixo e posteriormente abordamos as cadeias de alcance variável. Elaboramos um algoritmo na linguagem C o qual permitia, a partir de uma árvore de contexto completa, fazer as podas. Para efetuar as podas utilizamos uma metodologia denominada Algoritmo de Contexto. Este algoritmo de contexto testa a hipótese de determinado contexto ter a mesma probabilidade de ocorrência de seus descendentes. Para a aplicação do algoritmo elaborado utilizamos o Corpus Eletrônico Tycho Brahe Parsed Corpus of Historical Portuguese que é formado por textos escritos em Português por autores nascidos entre 1380 e 1845 e pode ser encontrado em (http://www.tycho.iel.unicamp.br/tycho). Para cada texto foi feita uma classificação do ritmo. Então aplicamos a metodologia proposta para estimar a árvore de contextos dos ritmos do texto do autor Marquês da Fronteira e d´Alorna intitulado “Memórias do Marquês da Fronteira e d´Alorna” de 1802. Os resultados encontrados, utilizando o algoritmo elaborado, nos permitiram fazer as podas da árvore de contexto. O algoritmo elaborado foi capaz de fazer a poda na árvore de contexto. No entanto, a árvore estimada foi diferente da árvore que desejávamos encontrar. Acreditamos que uma proposta de trabalho futuro seria melhorar este algoritmo.
A finalidade deste projeto foi estimar uma cadeia de Markov de alcance variável utilizando um conjunto de dados com alfabeto A e contextos E. Estas cadeias são muito úteis pois nos permitem determinar a probabilidade de ocorrência de determinado elemento considerando uma parte variável do passado, denominada de contextos. Esta cadeia de Markov é apresentada em uma forma especial denominada árvore de contexto, uma árvore onde apresentamos os contextos. Temos também a matriz de transição P. Para a execução deste projeto, fizemos um levantamento bibliográfico sobre cadeias de alcance fixo e posteriormente abordamos as cadeias de alcance variável. Elaboramos um algoritmo na linguagem C o qual permitia, a partir de uma árvore de contexto completa, fazer as podas. Para efetuar as podas utilizamos uma metodologia denominada Algoritmo de Contexto. Este algoritmo de contexto testa a hipótese de determinado contexto ter a mesma probabilidade de ocorrência de seus descendentes. Para a aplicação do algoritmo elaborado utilizamos o Corpus Eletrônico Tycho Brahe Parsed Corpus of Historical Portuguese que é formado por textos escritos em Português por autores nascidos entre 1380 e 1845 e pode ser encontrado em (http://www.tycho.iel.unicamp.br/tycho). Para cada texto foi feita uma classificação do ritmo. Então aplicamos a metodologia proposta para estimar a árvore de contextos dos ritmos do texto do autor Marquês da Fronteira e d´Alorna intitulado “Memórias do Marquês da Fronteira e d´Alorna” de 1802. Os resultados encontrados, utilizando o algoritmo elaborado, nos permitiram fazer as podas da árvore de contexto. O algoritmo elaborado foi capaz de fazer a poda na árvore de contexto. No entanto, a árvore estimada foi diferente da árvore que desejávamos encontrar. Acreditamos que uma proposta de trabalho futuro seria melhorar este algoritmo.
Palavras-chave
Cadeia de Markov. Contexto. Estados