Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32860
Registro completo de metadados
Campo DCValorIdioma
dc.creatorCosta, Valdemi Nunes-
dc.date.accessioned2024-12-16T10:59:16Z-
dc.date.available2024-08-21-
dc.date.available2024-12-16T10:59:16Z-
dc.date.issued2024-07-12-
dc.identifier.urihttps://repositorio.ufpb.br/jspui/handle/123456789/32860-
dc.description.abstractThis work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data.pt_BR
dc.description.provenanceSubmitted by Jackson R. L. A. Nunes (jackson@biblioteca.ufpb.br) on 2024-12-16T10:59:16Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) ValdemiNunesCosta_Dissert.pdf: 3698561 bytes, checksum: 8cadf9aaed1957c385ec993511ff2ac6 (MD5)en
dc.description.provenanceMade available in DSpace on 2024-12-16T10:59:16Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) ValdemiNunesCosta_Dissert.pdf: 3698561 bytes, checksum: 8cadf9aaed1957c385ec993511ff2ac6 (MD5) Previous issue date: 2024-07-12en
dc.description.sponsorshipNenhumapt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Paraíbapt_BR
dc.rightsAcesso abertopt_BR
dc.rightsAttribution-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/br/*
dc.subjectModelagem matemáticapt_BR
dc.subjectSéries temporais de contagempt_BR
dc.subjectModelos INGARCHpt_BR
dc.subjectAlgoritmo EMpt_BR
dc.subjectCount time seriespt_BR
dc.subjectINGARCH modelspt_BR
dc.subjectEM algorithmpt_BR
dc.titleModelos INGARCH log-lineares com inovações Poisson mistaspt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Silva, Rodrigo Bernardo da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0338626517476710pt_BR
dc.contributor.advisor-co1Marinho, Pedro Rafael Diniz-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/7185368598935272pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/7947414674615865pt_BR
dc.description.resumoNeste trabalho, será proposta uma estrutura geral para inferência em modelagem de conjuntos de dados discretos, através de um modelo INGARCH de séries temporais de contagem com estrutura log linear com inovações Poisson mistas. Para tanto, será utilizada classe de distribuições de probabilidade, cujo objetivo principal é de modelar dados de contagem no tempo que apresentem condição de sobredispersão. De forma mais específica, o trabalho apresenta dois casos particulares que são as distribuições log linear Poisson Inversa Gaussiana e a distribuição log linear Binomial Negativa, que são obtidas ao considerar os casos de dados latentes que seguem as distribuições Inversa Gaussiana e Gama, respectivamente. As distribuições, inseridas através da média, têm como ponto comum o fato de serem membros da família exponencial de distribuições. Para estimar os parâmetros do modelo será utilizado o método iterativo de máxima verossimilhança por meio do algoritmo EM. A performance dos estimadores é avaliada através de estudos de simulação pelo método de Monte Carlo, considerando diferentes tamanhos amostrais para avaliar o comportamento assintótico destes estimadores. Na parte de aplicações do modelo proposto a conjuntos de dados reais, foram considerados para análise três bancos de dados: o primeiro deles lista o número de internações por abuso de álcool no estado da Paraíba, o segundo avalia a mesma problemática, porém com os dados apresentados para o estado do Piauí e, por fim, foi avaliado o banco de dados composto pelo número de casos de infecções por Campilobactéria na província de Quebec no Canadá, fechando assim a parte de aplicações a dados reais. Os dados de simulação foram testados nas duas extensões propostas e no modelo de comparação denominado log linear Poisson proposto por [9], levando em conta de início, uma análise gráfica para o comportamento da amostra, a autocorrelação e autocorrelação parcial, o estudo de simulação por meio de convergência levando em conta os valores obtidos e a observação de gráficos que representam uma visão generalizada da disposição dos dados de simulação. Posteriormente foi feita uma reflexão sobre sua eficácia através de critérios de informação e do erro quadrático médio usados no processo de avaliação e escolha do melhor modelo de regressão para o ajuste dos dados.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInformáticapt_BR
dc.publisher.programPrograma de Pós-Graduação em Modelagem Matemática e computacionalpt_BR
dc.publisher.initialsUFPBpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:Centro de Informática (CI) - Programa de Pós-Graduação em Modelagem Matemática Computacional

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ValdemiNunesCosta_Dissert.pdf3,61 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons