Desarrollo de una herramienta para la evaluación objetiva de la calidad de video empleando redes neuronales

dc.contributor.advisorGonzález Martínez, Santiago Renán
dc.contributor.authorFlores Maza, Carlos Bladimir
dc.date.accessioned2024-09-23T15:06:05Z
dc.date.available2024-09-23T15:06:05Z
dc.date.issued2024-09-23
dc.descriptionLa evaluación de calidad de video es esencial para determinar la compresión adecuada de un archivo de video o su transmisión en tiempo real. La herramienta desarrollada permite seleccionar parámetros de escalabilidad de calidad (Quantization Parameter (QP)), temporal (Frame Per Second (FPS)) y espacial (Bit-rate), y comparar métricas tradicionales como Peak Signalto-Noise Ratio (PSNR) y Structural Similarity Index (SSIM) con la métrica Perceptual Image Patch Similarity (LPIPS), que utiliza redes neuronales (VGG, AlexNet y SqueezeNet). Para los experimentos, se realizó una evaluación subjetiva en dos fases. En la primera fase, los participantes evaluaron videos codificados con el mismo parámetro de escalabilidad, estableciendo una relación entre la percepción visual y las métricas. Los resultados mostraron que una evaluación subjetiva de excelente correspondía a un PSNR de 44.2 dB, un SSIM de 0.99 y un LPIPS de 0.0 con AlexNet, 0.01 con SqueezeNet y 0.02 con VGG para la escalabilidad de calidad. En la segunda fase, diferentes grupos de participantes evaluaron los mismos videos con diversos parámetros de escalabilidad, indicando una preferencia por la escalabilidad de calidad con parámetros altos y por la escalabilidad espacial con parámetros intermedios. Tres experimentos adicionales validaron las métricas frente a la percepción humana, aplicando distorsiones como difuminado, ruido de Poisson y ruido sal y pimienta. Los resultados mostraron que LPIPS es más sensible a la percepción humana, con valores porcentuales desde 73.64 %, comparado con SSIM (-24.9 %) y PSNR (-14.17 %). La principal contribución de este trabajo es el desarrollo de una herramienta que facilita la investigación y el aprendizaje en la evaluación de la calidad de video mediante un enfoque tanto objetivo como subjetivo.en_US
dc.description.abstractVideo quality assessment is essential for determining the appropriate compression of a video file or its real-time transmission. The developed tool allows for the selection of quality (Quantization Parameter (QP)), temporal (Frame Per Second (FPS)), and spatial (Bit-rate) scalability parameters, comparing traditional metrics like Peak Signal-to-Noise Ratio (PSNR) and Structural Similarity Index (SSIM) with the Perceptual Image Patch Similarity (LPIPS) metric, which uses neural networks (VGG, AlexNet, and SqueezeNet). The experiments included a two-phase subjective evaluation. In the first phase, participants evaluated videos encoded with the same scalability parameter, establishing a relationship between visual perception and the metrics. Results showed that an .excellent”subjective evaluation corresponded to a PSNR of 44.2 dB, an SSIM of 0.99, and an LPIPS of 0.0 with AlexNet, 0.01 with SqueezeNet, and 0.02 with VGG for quality scalability. In the second phase, different participant groups evaluated the same videos with various scalability parameters, preferring quality scalability at high parameters and spatial scalability at intermediate parameters. Additional experiments validated the metrics against human perception, applying distortions such as blurring, Poisson noise, and salt-and-pepper noise. Results indicated that LPIPS is more sensitive to human perception, with percentage values starting from 73.64 %, compared to SSIM (-24.9 %) and PSNR (-14.17 %). The main contribution of this work is the development of a tool that facilitates research and learning in video quality assessment through both objective and subjective approaches.en_US
dc.description.uri0000-0001-6604-889Xen_US
dc.formatapplication/pdfen_US
dc.format.extent97 páginasen_US
dc.identifier.urihttps://dspace.ucuenca.edu.ec/handle/123456789/45446
dc.language.isospaen_US
dc.publisherUniversidad de Cuencaen_US
dc.relation.ispartofTET;164
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.accessRightsopenAccessen_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectElectrónicaen_US
dc.subjectRedes neuronalesen_US
dc.subjectInteligencia artificialen_US
dc.subjectPercepción visualen_US
dc.subject.otherClasificación de la Investigación::Ingeniería Electrónica::Dispositivos de grabaciónen_US
dc.titleDesarrollo de una herramienta para la evaluación objetiva de la calidad de video empleando redes neuronalesen_US
dc.title.alternativeDESARROLLO DE UNA HERRAMIENTA PARA LA EVALUACIÓN OBJETIVA DE LA CALIDAD DE VIDEO EMPLEANDO REDES NEURONALESen_US
dc.typesubmittedVersionen_US
dcterms.descriptionIngeniero en Telecomunicacionesen_US
dcterms.spatialCuenca, Ecuadoren_US

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Trabajo-de-Titulación.pdf
Size:
6.17 MB
Format:
Adobe Portable Document Format
Description:
Versión publicada (texto completo)

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: