Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32522
Tipo: TCC
Título: Modelos de Difusão Latente na Super-Resolução de Imagens Mamográficas
Autor(es): Oliveira, Dayvison Gomes de
Primeiro Orientador: Barbosa, Yuri de Almeida Malheiros
Resumo: Nos anos recentes os modelos generativos ganharam popularidade para diversos tipos de tarefas, tanto como geração de texto e como também para geração de imagens. Este estudo tem como objetivo principal desenvolver um modelo generativo para realizar a tarefa de super-resolução em imagens, mais especificamente, em regiões de interesse de mamografias, utilizando AutoencodersKL e modelos de difusão latente. A tarefa de super resolução consiste em aumentar a resolução de uma imagem, isso é feito a partir de uma imagem de baixa resolução, muitas vezes com perda de qualidade, e o objetivo é gerar uma versão de alta resolução que melhore a qualidade visual. É especialmente útil em áreas como processamento de imagens médicas, onde a precisão é crucial para diagnósticos precisos. No contexto de mamografias, a super-resolução pode ajudar a revelar detalhes sutis que podem passar despercebidos em imagens de baixa resolução, contribuindo assim para uma detecção mais precisa de anomalias e para o desenvolvimento de tratamentos mais eficazes. Os dados consistem em duas bases de imagens não rotuladas, uma de alta e outra de baixa resolução, ambas com 625 imagens em escala de cinzas. Os resulta dos foram avaliados com FID, SSIM e PSNR, alcançando valores de 0,00006, 0,80 e 26, respectivamente na tarefa de super-resolução que são satisfatórios e comparáveis à litera tura. No entanto, devido à heterogeneidade e à natureza simulada dos dados, o modelo AutoencoderKL apresentou imagens com degradação de qualidade. Sugere-se aprofundar o estudo para melhorar a acurácia do modelo, explorando diferentes estratégias de treina mento, diferentes normalizações e outros Autoencoders para a geração da representação latente. Além disso, o trabalho contribui para a comunidade ao propor uma nova pipeline de treinamento e avaliação para a tarefa de super-resolução, com o código containerizado para reprodução escalável em diferentes sistemas operacionais e conjuntos de dados.
Abstract: In recent years, generative models have gained popularity for various tasks, including text and image generation. In this thesis, I will develop a generative model to improve image resolution of mammography simulations using super-resolution techniques based on latent diffusion with AutoencoderKL methods. Super-resolution task involves increa sing the resolution of an image, typically from a low-resolution image, often with loss of quality, aiming to generate a high-resolution version that enhances visual quality. It is particularly useful in fields like medical image processing, where precision is crucial for accurate diagnoses. In the context of mammography, super-resolution can help reveal subtle details that may go unnoticed in low-resolution images, thereby contributing to more precise anomaly detection and the development of more effective treatments. The data consists of two sets of unlabeled images, one in high resolution and the other in low resolution, both containing 625 grayscale images. The results were evaluated using FID, SSIM, and PSNR, achieving values of 0.00006, 0.80, and 26, respectively in the super-resolution task, which are satisfactory and comparable to the literature. However, due to the heterogeneity and simulated nature of the data, the AutoencoderKL model produced images with slightly degraded images. Further study is suggested to enhance the model’s effectiveness by exploring different training strategies, normalization tech niques, and alternative Autoencoders for latent representation generation. Additionally, this work contributes to the community by proposing a new pipeline for training and eva luation in the super-resolution task, with containerized code for scalable reproducibility across different operating systems and datasets.
Palavras-chave: Modelos generativos
Inteligência artificial
Modelos de difusão latente
AutoencoderKL
CNPq: CNPQ::OUTROS
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Computação Científica
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/32522
Data do documento: 26-Abr-2024
Aparece nas coleções:TCC - Ciência da Computação - CI

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dayvison Gomes de Oliveira_TCC.pdfTCC3,36 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons