Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/32860
Tipo: | Dissertação |
Título: | Modelos INGARCH log-lineares com inovações Poisson mistas |
Autor(es): | Costa, Valdemi Nunes |
Primeiro Orientador: | Silva, Rodrigo Bernardo da |
Primeiro Coorientador: | Marinho, Pedro Rafael Diniz |
Resumo: | Neste trabalho, será proposta uma estrutura geral para inferência em modelagem de conjuntos de dados discretos, através de um modelo INGARCH de séries temporais de contagem com estrutura log linear com inovações Poisson mistas. Para tanto, será utilizada classe de distribuições de probabilidade, cujo objetivo principal é de modelar dados de contagem no tempo que apresentem condição de sobredispersão. De forma mais específica, o trabalho apresenta dois casos particulares que são as distribuições log linear Poisson Inversa Gaussiana e a distribuição log linear Binomial Negativa, que são obtidas ao considerar os casos de dados latentes que seguem as distribuições Inversa Gaussiana e Gama, respectivamente. As distribuições, inseridas através da média, têm como ponto comum o fato de serem membros da família exponencial de distribuições. Para estimar os parâmetros do modelo será utilizado o método iterativo de máxima verossimilhança por meio do algoritmo EM. A performance dos estimadores é avaliada através de estudos de simulação pelo método de Monte Carlo, considerando diferentes tamanhos amostrais para avaliar o comportamento assintótico destes estimadores. Na parte de aplicações do modelo proposto a conjuntos de dados reais, foram considerados para análise três bancos de dados: o primeiro deles lista o número de internações por abuso de álcool no estado da Paraíba, o segundo avalia a mesma problemática, porém com os dados apresentados para o estado do Piauí e, por fim, foi avaliado o banco de dados composto pelo número de casos de infecções por Campilobactéria na província de Quebec no Canadá, fechando assim a parte de aplicações a dados reais. Os dados de simulação foram testados nas duas extensões propostas e no modelo de comparação denominado log linear Poisson proposto por [9], levando em conta de início, uma análise gráfica para o comportamento da amostra, a autocorrelação e autocorrelação parcial, o estudo de simulação por meio de convergência levando em conta os valores obtidos e a observação de gráficos que representam uma visão generalizada da disposição dos dados de simulação. Posteriormente foi feita uma reflexão sobre sua eficácia através de critérios de informação e do erro quadrático médio usados no processo de avaliação e escolha do melhor modelo de regressão para o ajuste dos dados. |
Abstract: | This work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data. |
Palavras-chave: | Modelagem matemática Séries temporais de contagem Modelos INGARCH Algoritmo EM Count time series INGARCH models EM algorithm |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal da Paraíba |
Sigla da Instituição: | UFPB |
Departamento: | Informática |
Programa: | Programa de Pós-Graduação em Modelagem Matemática e computacional |
Tipo de Acesso: | Acesso aberto Attribution-NoDerivs 3.0 Brazil |
URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
URI: | https://repositorio.ufpb.br/jspui/handle/123456789/32860 |
Data do documento: | 12-Jul-2024 |
Aparece nas coleções: | Centro de Informática (CI) - Programa de Pós-Graduação em Modelagem Matemática Computacional |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ValdemiNunesCosta_Dissert.pdf | 3,61 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons