Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/34278
Title: Optimisation in machine learning: an application to topsoil organic stocks prediction in a dry forest ecosystem
Authors: Gebauer, Anika
Brito Gomez, Victor Manuel
Lieb, Mareike
metadata.dc.ucuenca.correspondencia: Gebauer, Anika , anika.gebauer@ufz.de
Keywords: Cross validation
Differential evolution
Dry forest
Machine learning
Model fitting
Soil organic carbon
metadata.dc.ucuenca.areaconocimientofrascatiamplio: 2. Ingeniería y Tecnología
metadata.dc.ucuenca.areaconocimientofrascatidetallado: 2.8.1 BioTecnología Ambiental
metadata.dc.ucuenca.areaconocimientofrascatiespecifico: 2.8 BioTecnología Medioambiental
metadata.dc.ucuenca.areaconocimientounescoamplio: 07 - Ingeniería, Industria y Construcción
metadata.dc.ucuenca.areaconocimientounescodetallado: 0712 - Tecnología de Protección del Medio Ambiente
metadata.dc.ucuenca.areaconocimientounescoespecifico: 071 - Ingeniería y Profesiones Afines
Issue Date: 2019
metadata.dc.ucuenca.embargoend: 12-May-2050
metadata.dc.ucuenca.volumen: Volumen 354, número 113846
metadata.dc.source: Geoderma
metadata.dc.identifier.doi: 10.1016/j.geoderma.2019.07.004
metadata.dc.type: ARTÍCULO
Abstract: 
Soil organic carbon (SOC) sequestration plays a key role in reducing the atmospheric greenhouse gas concentration. However, dry forest ecosystems in Ecuador are endangered to become a source of carbon emissions because of deforestation. Often spatial information, necessary to quantify potential carbon loss to the atmosphere, is missing. This particularly applies to remote areas of limited accessibility. This study aims to regionalise the SOC stocks of a small and poorly accessible dry forest ecosystem in southwestern Ecuador by using boosted regression tree (BRT) models. Resampling in a nested repeated k-fold cross validation approach was applied to develop robust models for a dataset of 118 samples with limited predictor information. To select an optimal set of model parameters, optimisation by differential evolution (DE) was applied for parameter tuning. Predictor selection was implemented using the same optimisation algorithm. This study demonstrates how the predictive performance of BRT models can be improved by applying an optimisation approach for parameter tuning and predictor selection. Model performance was improved by approximately 40% concerning the R2. Still, the results also demonstrated the difficulties of machine learning applications in small and highly heterogeneous natural areas. Very variable or even random factors were assumed to distort the relationship between predictor and response variables. We assume that the presented approach is particularly successful in the case of a real-valued multivariate space of tuning parameters. However, this requires testing in further machine learning applications and algorithms.
Description: 
El secuestro de carbono orgánico en el suelo (SOC) juega un papel clave en la reducción de la concentración atmosférica de gases de efecto invernadero. Sin embargo, los ecosistemas de bosques secos en Ecuador están en peligro de convertirse en una fuente de emisiones de carbono debido a la deforestación. A menudo falta información espacial, necesaria para cuantificar la pérdida potencial de carbono a la atmósfera. Esto se aplica particularmente a áreas remotas de accesibilidad limitada. Este estudio tiene como objetivo regionalizar las reservas de COS de un ecosistema de bosque seco pequeño y poco accesible en el suroeste de Ecuador mediante el uso de modelos de árbol de regresión reforzado (BRT). El nuevo muestreo en un enfoque de validación cruzada repetida anidada se aplicó para desarrollar modelos robustos para un conjunto de datos de 118 muestras con información predictiva limitada. Para seleccionar un conjunto óptimo de parámetros del modelo, se aplicó la optimización por evolución diferencial (DE) para el ajuste de parámetros. La selección de predictores se implementó utilizando el mismo algoritmo de optimización. Este estudio demuestra cómo se puede mejorar el rendimiento predictivo de los modelos BRT mediante la aplicación de un enfoque de optimización para el ajuste de parámetros y la selección de predictores. El rendimiento del modelo se mejoró en aproximadamente un 40% con respecto al R2. Aún así, los resultados también demostraron las dificultades de las aplicaciones de aprendizaje automático en áreas naturales pequeñas y altamente heterogéneas. Se asumió que factores muy variables o incluso aleatorios distorsionan la relación entre las variables predictoras y de respuesta. Suponemos que el enfoque presentado es particularmente exitoso en el caso de un espacio de parámetros de sintonización multivariado de valor real. Sin embargo, esto requiere pruebas en otras aplicaciones y algoritmos de aprendizaje automático.
URI: https://www.sciencedirect.com/science/article/abs/pii/S0016706118308504
metadata.dc.ucuenca.urifuente: https://www.journals.elsevier.com/geoderma
ISSN: 0016-7061
Appears in Collections:Artículos

Files in This Item:
File SizeFormat 
documento.pdf
  Until 2050-05-12
161.67 kBAdobe PDFView/Open Request a copy


This item is protected by original copyright



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00