Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/18669| Tipo: | Dissertação |
| Título: | Sistema automático de contagem de audiência com uso de aprendizagem profunda |
| Autor(es): | Florentino, Caio Souza |
| Primeiro Orientador: | Costa, Rostand Edson Oliveira |
| Resumo: | Contar objetos ou seres vivos é uma necessidade comum em muitas áreas da indústria, comércioeserviços. Automatizaressaatividadepodepromoverumaotimizaçãodoprocesso envolvido e, consequentemente, a redução de tempo e custos. Com isso em mente, a visão computacional é uma abordagem que oferece novas possibilidades para o processamento digital de imagens, dando ao computador uma capacidade de interpretação cada vez mais semelhante aos humanos. Este trabalho compara a eficiência das técnicas de contagem volumétrica, tanto na visão computacional tradicional quanto na aprendizagem profunda, na contagem de audiências em eventos presenciais. Como estudo de caso, a investigação concentrou-se na contagem de audiência de sessões de cinema e / ou teatro a partir das fotos da audiência. Medir o público real de forma automática, precisa e transparente é uma necessidade recorrente da indústria do entretenimento. Para a realização dos experimentos, foi necessário o desenvolvimento de uma base de imagens com exemplos de audiências e a quantidade de pessoas presente. A partir dos resultados foi possível observar a eficiência da aplicação da aprendizagem profunda nesse contexto. Quando comparada a várias técnicas automáticas de contagem volumétrica disponíveis, a aprendizagem profunda foi a estratégia que apresentou os melhores resultados, atingindo sensibilidade e precisão acima de 96%. É proposto um Sistema Automático de Contagem de Audiência que contém os módulos de classificação/contagem (uso de aprendizagem profunda para contagem de audiência), captura (monitoramento contínuo das imagens para melhor captura) e controle (integração, administração e operação do sistema). O trabalho realiza contribuições com o compartilhamento de conhecimento na seleção de redes neurais que melhor realizam a tarefa de contagem de um grande número de objetos em uma imagem, no desenvolvimento de duas bases de teste de detecção de pessoas em audiência, na especificação de critérios para realizar a tarefa de contagem com êxito e na viabilização e desenvolvimento de um sistema de contagem automática de audiências. |
| Abstract: | Counting objects or living things is a common necessity in many areas of industry, commerce and services. Automating this activity can promote an optimization of the process involved and, consequently, the reduction of time and costs. With this in mind, computer vision is an approach that offers new possibilities for digital image processing, giving the computer an increasingly similar interpretive capability to humans. This work compares the efficiency of volumetric counting techniques, both in traditional computational view and in deeplearning, in the counting of audiences in face-to-face events. As a case study, the investigation focused on the audience count of movie and / or theater sessions from the audience photos. Measuring billing automatically, accurately and transparently is a recurring need in the entertainment industry. For the accomplishment of the experiments, it was necessary to develop an image base with examples of audiences and the amount of people present. From the results it was possible to observe the great potential of the application of deep learning in this context. When compared to several automatic volumetric counting techniques available, deep learning was the strategy that presented the best results, reaching sensitivity and precision above 96%. It is proposed an Automatic Audience Counting System that contains the classification / counting modules (it uses deep learning for audience count), capture (continuous monitoring of images for better capture) and control (integrates, manages and operates the system). This work contributes with knowledge sharing in the following aspects: selection of neural networks that best perform the task of counting a large number of objects in images, development of two test image bases of detection of people in audience, specification of requirements to perform the counting task successfully and in enabling and developing an automatic audience counting system. |
| Palavras-chave: | Contagem de audiência Aferição de bilheteria Visão computacional Aprendizagem de máquina Audience couting Computer vision Machine learning Box office records |
| CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal da Paraíba |
| Sigla da Instituição: | UFPB |
| Departamento: | Informática |
| Programa: | Programa de Pós-Graduação em Informática |
| Tipo de Acesso: | Acesso aberto |
| URI: | http://creativecommons.org/licenses/by-nd/3.0/br/ |
| URI: | https://repositorio.ufpb.br/jspui/handle/123456789/18669 |
| Data do documento: | 27-Jul-2020 |
| Aparece nas coleções: | Centro de Informática (CI) - Programa de Pós-Graduação em Informática |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| CaioSouzaFlorentino_Dissert.pdf | 3,21 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma
Licença Creative Commons
