Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/33221
Title: EDA and a tailored data imputation algorithm for daily ozone concentrations
Authors: Gualan Saavedra, Ronald Marcelo
Saquicela Galarza, Victor Hugo
Tran Thanh, Long
metadata.dc.ucuenca.correspondencia: Gualan Saavedra, Ronald Marcelo, ronald.gualan@ucuenca.edu.ec
Keywords: Air Pollution
Data Imputation
Gaussian Process
Sensor Data
metadata.dc.ucuenca.areaconocimientofrascatiamplio: 2. Ingeniería y Tecnología
metadata.dc.ucuenca.areaconocimientofrascatidetallado: 2.2.3 Sistemas de Automatización y Control
metadata.dc.ucuenca.areaconocimientofrascatiespecifico: 2.2 Ingenierias Eléctrica, Electrónica e Información
metadata.dc.ucuenca.areaconocimientounescoamplio: 06 - Información y Comunicación (TIC)
metadata.dc.ucuenca.areaconocimientounescodetallado: 0613 - Software y Desarrollo y Análisis de Aplicativos
metadata.dc.ucuenca.areaconocimientounescoespecifico: 061 - Información y Comunicación (TIC)
Issue Date: 2018
metadata.dc.ucuenca.volumen: volumen 884
metadata.dc.source: Advances in Intelligent Systems and Computing
metadata.dc.identifier.doi: 10.1007/978-3-030-02828-2_27
Publisher: TICEC 2018
metadata.dc.description.city: 
Riobamba
metadata.dc.type: ARTÍCULO DE CONFERENCIA
Abstract: 
Air pollution is a critical environmental problem with detrimental effects on human health that is affecting all regions in the world, especially to low-income cities, where critical levels have been reached. Air pollution has a direct role in public health, climate change, and worldwide economy. Effective actions to mitigate air pollution, e.g. research and decision making, require of the availability of high resolution observations. This has motivated the emergence of new low-cost sensor technologies, which have the potential to provide high resolution data thanks to their accessible prices. However, since low-cost sensors are built with relatively low-cost materials, they tend to be unreliable. That is, measurements from low-cost sensors are prone to errors, gaps, bias and noise. All these problems need to be solved before the data can be used to support research or decision making. In this paper, we address the problem of data imputation on a daily air pollution data set with relatively small gaps. Our main contributions are: (1) an air pollution data set composed by several air pollution concentrations including criteria gases and thirteen meteorological covariates; and (2) a custom algorithm for data imputation of daily ozone concentrations based on a trend surface and a Gaussian Process. Data Visualization techniques were extensively used along this work, as they are useful tools for understanding the multi-dimensionality of point-referenced sensor data.
Description: 
La contaminación atmosférica es un problema ambiental crítico con efectos perjudiciales para la salud humana que está afectando a todas las regiones del mundo, especialmente a las ciudades de bajos ingresos, donde se han alcanzado niveles críticos. La contaminación atmosférica tiene un papel directo en la salud pública, el cambio climático y la economía mundial. Las acciones eficaces para mitigar la contaminación atmosférica, por ejemplo, la investigación y la toma de decisiones, requieren la disponibilidad de observaciones de alta resolución. Esto ha motivado la aparición de nuevas tecnologías de sensores de bajo costo, que tienen el potencial de proporcionar datos de alta resolución gracias a sus precios accesibles. Sin embargo, dado que los sensores de bajo costo se construyen con materiales relativamente de bajo costo, tienden a ser poco confiables. Es decir, las mediciones de sensores de bajo costo son propensas a errores, huecos, sesgos y ruidos. Todos estos problemas deben resolverse antes de que los datos puedan utilizarse para apoyar la investigación o la toma de decisiones. En este documento, abordamos el problema de la imputación de datos en un conjunto diario de datos de contaminación atmosférica con brechas relativamente pequeñas. Nuestras principales contribuciones son: 1) un conjunto de datos de contaminación atmosférica compuesto por varias concentraciones de contaminación atmosférica, incluidos los gases criterios y trece covariables meteorológicas; y (2) un algoritmo personalizado para la imputación de datos de las concentraciones diarias de ozono basadas en una superficie de tendencia y un proceso gaussiano. Las técnicas de visualización de datos se utilizaron ampliamente a lo largo de este trabajo, ya que son herramientas útiles para comprender la multidimensionalidad de los datos de sensores referenciados a puntos.
URI: http://dspace.ucuenca.edu.ec/handle/123456789/33221
https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85055644030&origin=inward
metadata.dc.ucuenca.urifuente: https://www.scopus.com/source/sourceInfo.url?sourceId=5100152904
ISBN: 978-303002827-5
ISSN: 2194-5357
Appears in Collections:Artículos

Files in This Item:
File Description SizeFormat 
documento.pdfdocument641.26 kBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00