Análise de Similaridade de Sequências Genômicas

Fonseca, ítallo Costa

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/tede/5738

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Fonseca, ítallo Costa	-
dc.date.accessioned	2015-05-14T12:14:09Z	-
dc.date.accessioned	2018-07-21T00:08:30Z	-
dc.date.available	2014-08-06	-
dc.date.available	2018-07-21T00:08:30Z	-
dc.date.issued	2013-08-28	-
dc.identifier.citation	FONSECA, Ítallo Costa. Análise de Similaridade de Sequências Genômicas. 2013. 61 f. Dissertação (Mestrado em Física) - Universidade Federal da Paraíba, João Pessoa, 2013.	por
dc.identifier.uri	https://repositorio.ufpb.br/jspui/handle/tede/5738	-
dc.description.abstract	In this thesis, we investigate aspects of similarity between sequences of complete mitochondrial DNA. This line of study falls within the framework from the analysis of statistical properties of DNA sequences based on methods that seek to understand the information contained in these sequences a topic of renewed interest in the context of the so called Complex Systems. Previous approaches were used to obtain the frequencies of certain segments of nucleotides, regarded as the words of a given size, contained in sequences. These methods, inspired by studies devoted to the statistical properties of words distribution in linguistic and symbolical sequences, can be considered an alternative to techniques and algorithms for aligning sequences, and have been successful in the description of characteristics that allow to infer similarity and possible species grouping criteria, it means, biological afnity between DNA sequences. Previously, this methodology has been applied to evaluate the diferences between coding and nocoding DNA sequences and to extract linguistic aspects of these sequences by detecting keywords that describe relevant information embedded in the threads. In this dissertation, these studies are expanded in order to directly compare the contents of pairs of complete sequences of mitochondrial DNA, setting parameters that depend on the frequency distribution of sequences of words which highlight both the relevance of certain words as well as the possibility of grouping species estimating the distance between these words. Our results show that the best clusters between diferent species are obtained when we calculate the rate of agglomeration considering only frequencies of words. We have also observed that the larger the word size is, its greater clustering between sequences. The prospect of applying our results to analyze DNA sequences also belong to a single biological species, may be relevant in the construction of phylogenetic trees that are appropriate structures for understanding the evolutionary history of organisms.	eng
dc.description.provenance	Made available in DSpace on 2015-05-14T12:14:09Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 3134384 bytes, checksum: 253c3fb1aaec508b89c44bcd7766a50c (MD5) Previous issue date: 2013-08-28	eng
dc.description.provenance	Made available in DSpace on 2018-07-21T00:08:30Z (GMT). No. of bitstreams: 2 arquivototal.pdf: 3134384 bytes, checksum: 253c3fb1aaec508b89c44bcd7766a50c (MD5) arquivototal.pdf.jpg: 3929 bytes, checksum: 493872bf9263a4c9b2cd18b70ac8f8c0 (MD5) Previous issue date: 2013-08-28	en
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES	-
dc.format	application/pdf	por
dc.language	por	por
dc.publisher	Universidade Federal da Paraíba	por
dc.rights	Acesso aberto	por
dc.subject	DNA mitocondrial	por
dc.subject	Frequências de palavras de DNA	por
dc.subject	Similaridade	por
dc.subject	Árvores Filogenéticas	por
dc.subject	Sistemas Complexos	por
dc.subject	Mitochondrial DNA	eng
dc.subject	DNA frequencies of words	eng
dc.subject	Similarity	eng
dc.subject	Phylogenetic trees	eng
dc.subject	Complex systems	eng
dc.title	Análise de Similaridade de Sequências Genômicas	por
dc.type	Dissertação	por
dc.contributor.advisor1	Nogueira Júnior, Edvaldo	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/9218559724616986	por
dc.contributor.advisor-co1	Figueirêdo, Pedro Hugo de	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/0923605715471781	por
dc.creator.Lattes	http://lattes.cnpq.br/4628515463835635	por
dc.description.resumo	Nesta dissertação, investigamos aspectos da similaridade entre sequências completas de DNA mitocondriais. Esta linha de estudo se insere no âmbito da análise de propriedades estatísticas de sequências de DNA baseadas em métodos que buscam entender a informação contida nessas sequências, tema de renovado interesse no contexto dos chamados Sistemas Complexos. Abordagens anteriores foram utilizadas para obtenção das frequências de determinados segmentos de nucleotídeos, considerados como palavras de um dado tamanho, contidos nas sequências. Tais métodos, inspirados em estudos dedicados às propriedades estatísticas de distribuição de palavras em textos linguísticos e sequências simbólicas, podem ser considerados uma alternativa às técnicas e algoritmos de alinhamento de sequências, e têm sido bem sucedidos na descrição de características que permitem inferir similaridade e possíveis critérios de agrupamentos de espécies, ou seja, afinidade biológica entre sequências de DNA. Anteriormente, esta metodologia foi aplicada para avaliar as diferenças entre sequências de DNA codificadas e não codificadas e para extrair aspectos linguísticos dessas sequências através da detecção de palavras-chaves que descrevem informações relevantes embutidas nas sequências. Nesta dissertação, ampliamos tais estudos, no sentido de comparar diretamente o conteúdo de pares de sequências completas de DNA mitocondriais, definindo parâmetros que dependem da distribuição de frequências de palavras das sequências que ressaltam tanto a relevância de determinadas palavras, bem como a possibilidade de agrupamentos de espécies estimando a distância entre essas sequências. Nossos resultados mostram que os melhores agrupamentos entre espécies distintas são obtidos quando calculamos a taxa de aglomeração levando em conta apenas as frequências das palavras. Notamos, também, que quanto maior o tamanho da palavra mais consistente é o agrupamento entre as sequências. A perspectiva de aplicação de nossos resultados, para analisar também sequências de DNA pertencentes a uma única espécie biológica, pode ser relevante na construção de árvores filogenéticas que são estruturas adequadas para se compreender a história evolucionária dos organismos.	por
dc.publisher.country	BR	por
dc.publisher.department	Física	por
dc.publisher.program	Programa de Pós-Graduação em Física	por
dc.publisher.initials	UFPB	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::FISICA	por
dc.thumbnail.url	http://tede.biblioteca.ufpb.br:8080/retrieve/14444/arquivototal.pdf.jpg	*
Aparece nas coleções:	Centro de Ciências Exatas e da Natureza (CCEN) - Programa de Pós-Graduação em Física

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
arquivototal.pdf		3,06 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas

Repositório Institucional da UFPB