Publication: Predicting ozone pollution in urban areas using machine learning and quantile regression models
Loading...
Date
2021
Journal Title
Journal ISSN
Volume Title
Publisher
Springer International Publishing
Abstract
Ozone is the most harmful secondary pollutant in terms of negative effects on climate change and human health. Predicting ozone emission levels has therefore gained importance within the field of environmental management. This study, performed in the Andean city of Cuenca, Ecuador, compares the performance of two methodologies currently used for this task and based on machine learning and quantile regression techniques. These techniques were applied using cross-sectional data to predict the ozone concentration per city block during the year 2018. Our results reveal that ozone concentration is significantly influenced by nitrogen dioxide, sedimentary particles, sulfur dioxide, traffic, and spatial features. We use the mean square error, the coefficient of determination, and the quantile loss as evaluation metrics for the performance of the ozone prediction models, employing a cross-validation scheme with a fold. Our work shows that the random forest technique outperforms gradient boosting prediction, neural network, and quantile regression methods.
Description
El ozono es el contaminante secundario más dañino en términos de efectos negativos sobre el cambio climático y la salud humana. Por lo tanto, la predicción de los niveles de emisión de ozono ha ganado importancia dentro del campo de la gestión ambiental. Este estudio, realizado en la ciudad andina de Cuenca, Ecuador, compara el desempeño de dos metodologías utilizadas actualmente para esta tarea y basadas en técnicas de aprendizaje automático y regresión cuantílica. Estas técnicas se aplicaron utilizando datos transversales para predecir la concentración de ozono por cuadra de la ciudad durante el año 2018. Nuestros resultados revelan que la concentración de ozono está significativamente influenciada por el dióxido de nitrógeno, las partículas sedimentarias, el dióxido de azufre, el tráfico y las características espaciales. Usamos el error cuadrático medio, el coeficiente de determinación, y la pérdida cuantil como métrica de evaluación del desempeño de los modelos de predicción de ozono, empleando un esquema de validación cruzada con un pliegue. Nuestro trabajo muestra que la técnica de bosque aleatorio supera los métodos de predicción de aumento de gradiente, redes neuronales y regresión de cuantiles.
Keywords
Ensemble models, Neural networks, Ozone, Pollutants, Quantile regression
