Estimación de la temperatura del suelo mediante técnicas ...

32
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL DIRECCION DE INVESTIGACION Y POSGRADO MAGISTER EN RECURSOS NATURALES Estimación de la temperatura del suelo mediante técnicas de aprendizaje profundo. Tesis presentada como requisito para optar al grado de Magíster en Recursos Naturales por: Diego Moraga Méndez Comité de Tesis Profesor Guía: Francisco Meza Profesores Informantes: Eduardo Arellano Francisco Suárez Marzo 2021 Santiago-Chile

Transcript of Estimación de la temperatura del suelo mediante técnicas ...

Page 1: Estimación de la temperatura del suelo mediante técnicas ...

PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE

FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL

DIRECCION DE INVESTIGACION Y POSGRADO

MAGISTER EN RECURSOS NATURALES

Estimación de la temperatura del suelo mediante técnicas de

aprendizaje profundo.

Tesis presentada como requisito para optar al grado de

Magíster en Recursos Naturales

por:

Diego Moraga Méndez

Comité de Tesis

Profesor Guía: Francisco Meza

Profesores Informantes:

Eduardo Arellano

Francisco Suárez

Marzo 2021

Santiago-Chile

Page 2: Estimación de la temperatura del suelo mediante técnicas ...

Agradecimientos

Deseo expresar mi agradecimiento a las personas que hicieron posible que este trabajo

terminara con éxito y, en especial a:

A la Facultad de Agronomía e Ingeniería Forestal y a los proyectos FONDECYT N°1170429

y FONDEQUIP EQM170024 por financiar este trabajo.

Además, al profesor Francisco Javier Meza Dabancens, por su contribución en la revisión

del manuscrito y sugerencias de avances. Además, de disponer de las condiciones físicas

y materiales para el desarrollo de la investigación, entre ellas, un puesto de trabajo en el

laboratorio de biometeorología, instrumental de monitoreo y disposición de datos.

También a los profesores Francisco Suárez y Eduardo Arellano, por sus comentarios y

recomendaciones de avances.

Page 3: Estimación de la temperatura del suelo mediante técnicas ...

Le dedico este trabajo a mi familia, Alicia y mis amigos, que

me entregaron apoyo y motivación para concluir

mi tesis en contexto de Pandemia.

Page 4: Estimación de la temperatura del suelo mediante técnicas ...

ÍNDICE

Abstract ............................................................................................................................ 1

Introducción ..................................................................................................................... 2

Materiales y métodos ...................................................................................................... 5

Área de estudio e instrumentación ................................................................................. 5

Modelo analítico ............................................................................................................. 8

Modelos de redes neuronales profundas. ....................................................................... 9

Modelo estocástico ARIMA. ......................................................................................... 12

Evaluación de precisión de los modelos ....................................................................... 13

Resultados ..................................................................................................................... 14

Discusión ....................................................................................................................... 19

Conclusión ..................................................................................................................... 20

Resumen ........................................................................................................................ 22

Referencias .................................................................................................................... 22

Page 5: Estimación de la temperatura del suelo mediante técnicas ...

ÍNDICE DE FIGURAS

Figura 1. Área de estudio .............................................................................................. 6

Figura 2. Diagrama de referencia del diseño estructural del modelo MLP. .................. 10

Figura 3. Diagrama de referencia del diseño de la estructura del modelo RNN. .......... 11

Figura 4. Diagramas de dispersión para los modelos analítico, MLP y MLP que incluye el

potencial mátrico (ψ) respectivamente, para estimar cada temperatura del suelo a los 10,

30, 50, 75 y 140 cm de profundidad. La línea de color rojo representa la línea de la

regresión. ..................................................................................................................... 15

Figura 5. Comparación entre la Ts del suelo medida y pronosticada para las series de

tiempo de los modelos de RNN y ARIMA a 10, 30, 50, 75 y 140 cm de profundidad. ... 18

ÍNDICE DE CUADROS

Cuadro 1. Principales estadígrafos para la temperatura de suelo (Ts) y variables

micrometeorológicas utilizadas para entrenar y validar los modelos desarrollados en este

trabajo. ........................................................................................................................... 7

Cuadro 2. Textura del suelo en la unidad experimental para cada profundidad

monitoreada por el lisímetro. .......................................................................................... 8

Cuadro 3. Principales estadígrafos de las variables calculadas para la ecuación de van

Wijk, obtenidos a traves de la extrapolación de la temperatura del suelo (Tm, A(0) y D).

..................................................................................................................................... 14

Cuadro 4. Rendimiento estadístico de los modelos analitico, MLP y MLP que incluye el

potencial matrico (ψ) para la estimación de la temperatura horaria del suelo a diferentes

profundidades. ............................................................................................................. 16

Cuadro 5. Rendimiento estadístico de los modelos ARIMA y RNN para la estimación

futura de la temperatura horaria del suelo a diferentes profundidades. ........................ 16

Cuadro 6. Rendimiento estadístico estacional del modelo ARIMA para la estimación

futura de la temperatura horaria del suelo a diferentes profundidades. ........................ 17

Page 6: Estimación de la temperatura del suelo mediante técnicas ...

1

Estimación de la temperatura del suelo mediante técnicas de aprendizaje profundo.

Diego Moraga1, Eduardo Arellano1, Francisco Suárez2, Francisco Meza1.

1. Departamento de Ecosistemas y Medio Ambiente, Facultad de Agronomía e

Ingeniería Forestal, Pontificia Universidad Católica, Santiago, Chile.

2. Departamento de Ingeniería Hidráulica y Ambiental, Pontificia Universidad Católica

de Chile, Avda, Vicuña Mackenna, 4860, Macul, Santiago, Chile.

*Correspondencia: Francisco Meza, [email protected]. (+56 2) 2354 7911.

Abstract

Diego Moraga Mendez. Estimation of soil temperature through Deep Learning

Techniques. Tesis, Magister en Recursos Naturales, Facultad de Agronomía e Ingeniería

Forestal, Pontificia Universidad Católica de Chile. Santiago, Chile. 26pp. Soil temperature

plays a fundamental role for several microbiological processes and influences soil

hydrology. However, the absence of widespread monitoring systems and low availability of

online data make difficult to incorporate this variable as a routine observation for decision

making. Some studies have developed models to estimate soil temperature (Ts) at different

depths, where neural network models have shown interesting results. Using the latest

advances in deep learning techniques, this study estimates hourly soil temperature at five

depths (10, 30, 50, 75 and 140 cm) of a bare soil under a Mediterranean climate in Chile,

through a multilayer perceptron (MLP) model. This model was compared with an analytical

model by van Wijk in 1959. Results show that the MLP model provides a better fit than the

analytical method. Furthermore, considering the soil matric potential as an explanatory

variable, the average RMSE and MAE of the five depths was reduced by 56%. In addition,

we evaluated a recurrent neural network (RNN) model to predict temperature for 48 hours

and compare it with and an autoregressive integrated moving average (ARIMA) model.

Results show that, for the majority of the soil depths studied, the ARIMA model performs

better than RNN for temperature prediction, but it must be considered that it is not a unique

model like the RNN model, and the parameters must be reprogrammed for each time series,

becoming a limitation for its application.

Key words: Soil temperature, Deep learning, Feed-forward network, recurrent neural

network, ARIMA model.

Page 7: Estimación de la temperatura del suelo mediante técnicas ...

2

Introducción

La temperatura del suelo (Ts) es producto del balance de energía superficial. La radiación

neta es absorbida por la superficie del suelo para luego ser transmitida por conducción a

los estratos inferiores, viéndose atenuada a mayores profundidades. La interacción

generada en la superficie del suelo con el aire permite la regulación térmica y el intercambio

de temperatura entre la tierra y la atmósfera (Pregitzer y King, 2005; Hanks, 2012).

La Ts depende de una serie de propiedades fisicoquímicas y características

espaciotemporales de los suelos. Dentro de las variables que la determinan se encuentra

el ángulo de incidencia solar, propiedades térmicas del suelo, porosidad, contenido de

agua, el nivel de actividad microbiana, tasas de mineralización, tipo de cubierta vegetal y

profundidad del suelo. Al mismo tiempo, la Ts es influenciada por variables meteorológicas

como el déficit de presión de vapor, presión atmosférica, temperatura del aire, precipitación,

velocidad del viento, entre otras (Paul, et al., 2004; Snyder, et al., 2010; Ozturk, et al., 2011;

Stolpe y Undurraga, 2016; Zeynoddin, et al., 2019). Además, la textura y estructura del

suelo está vinculada directamente con los procesos de transferencia de calor o flujos de

energía, a pesar de su importancia suele medirse por la complejidad que implica determinar

la conductividad térmica o el flujo de energía en los diferentes estratos del suelo (Kang, et

al., 2000).

En los ecosistemas terrestres, la Ts controla procesos claves como la actividad de

microorganismos del suelo, tasas de reacciones bioquímicas, procesos metabólicos y

reproductivos (Hay y Wilson, 1982; Campbell y Norman, 1998; Pregitzer y King, 2005;

Samadianfard, et al., 2018). En las plantas, en los primeros 10 cm de profundidad, la Ts

controla la tasa de germinación de semillas y otras actividades vitales para el desarrollo de

plantas como por ejemplo la expresión génica para el crecimiento y desarrollo en plantas,

respiración, tasa de extensión de las hojas, entre otras (Hay y Wilson, 1982; Chinnusamy,

et al., 2007; Curiel, et al., 2007; Miles y Brown, 2017). Dentro de los siguientes estratos se

encuentra la mayor producción de biomasa o enraizamiento de las plantas, donde la Ts se

relaciona con los mecanismos de absorción de nutrientes y flujos de agua a través de las

raíces (Jackson, et al., 1996). Sin embargo, la profundidad de enraizamiento puede variar

dependiendo de los mecanismos y propiedades hidrológicas del suelo como, por ejemplo,

la profundidad de infiltración, textura, agregación y porosidad. Por esta razón, los suelos

Page 8: Estimación de la temperatura del suelo mediante técnicas ...

3

con buen drenaje pueden alcanzar mayores profundidades de enraizamiento, mientras que

en suelos anegados las raíces permanecen poco profundas (Mooney, et al., 1980; Crombie,

et al., 1988; Canadell, et al., 1996; Fan, et al., 2017). Por ende, la Ts se destaca por ser un

factor ambiental fundamental en los componentes bióticos del ecosistema terrestre, pero

también, se encuentra relacionada con el componente abiótico del suelo, es decir, forma

parte de procesos como la ventilación del suelo, evaporación y transpiración de las plantas

(Campbell y Norman, 1998; Zeynoddin, et al., 2019). Estas características han ubicado a Ts

como una variable cuya comprensión facultarían mejorar la gestión sobre el recurso suelo

(Toy, et al., 1978; Pregitzer, et al., 2000; Stolpe y Undurraga, 2016; Sanikhani, et al., 2018).

En Chile, el sector agrícola requiere lograr grandes desafíos durante esta década en la zona

central, dado a que se proyecta un aumento de las temperaturas, déficit de precipitaciones

y aumento en las demandas de riego para la agricultura, generando déficit en los regímenes

hidrológicos (Meza, et al., 2012). Por otra parte, la Ts rara vez es monitoreada a mayores

profundidades en Chile por el alto costo de inversión que significaría abarcar la extensión

completa del país, y tanto su estimación como predicción se dificulta por la baja

disponibilidad de datos en línea (Stolpe y Undurraga, 2016).

A nivel internacional, se han desarrollado modelos analíticos, numéricos y estadísticos, con

el fin de estimar y predecir la Ts a nivel anual, mensual, diario y horario en función de la

profundidad, variables meteorológicas y propiedades del suelo (West, 1952; Wierenga et

al., 1969; Toy, et al., 1978; Langholz, 1989; Zheng et al., 1993; Yang et al., 1997;

Mihalakakou, 2002; Paul et al., 2004; Tabari, et al., 2010; Bilgili, 2011; Ozturk, et al., 2011;

Kisi, et al., 2014; Kim y Singh, 2014; Tabari, et al., 2015; Nahvi, et al., 2016; Sanikhani, et

al., 2018; Samadianfard, et al., 2018; Zeynoddin, et al., 2019; Feng, et al., 2019;

Mehdizadeh, et al., 2020; Alizamir, et al., 2020). Dentro de ellos, se destacan los modelos

de redes neuronales (NN, sigla en inglés), dado a que ofrecen una alternativa factible para

comprender el comportamiento de la temperatura del suelo utilizando variables

meteorológicas (Tabari, et al., 2010; Bilgili, 2011; Ozturk, et al., 2011). En países como

Turquía, Irán, China, Estados Unidos y Canadá se han desarrollados modelos NN para

estimar la Ts a nivel diario y mensual. Para su validación se han utilizado y comparado

diferentes técnicas de programación como, por ejemplo, sistemas de inferencia neuro-

difuso adaptativo, regresiones lineales múltiples, programación de expresión génica,

bosques aleatorios, regresión del proceso gaussiano e híbridos. Entre ellos, Feng, et al.,

2019 realizo estimaciones cada 30 minutos a 2, 5, 10 y 20 cm, donde concuerda en conjunto

Page 9: Estimación de la temperatura del suelo mediante técnicas ...

4

con otros autores la factibilidad del uso de modelos de NN a través de la técnica de máquina

de aprendizaje extremo (ELM, sigla en inglés), donde obtuvieron mejores rendimientos y

velocidades de cálculos (Tabari, et al., 2010; Bilgili, 2011; Ozturk, et al., 2011; Kisi, et al.,

2014; Kim y Singh, 2014; Nahvi, et al., 2016; Sanikhani, et al., 2018; Mehdizadeh, et al.,

2020). Por otro lado, los modelos de series de tiempo han recibido menos atención en

relación con los modelos de aprendizaje automático o de redes neuronales para la

predicción de la Ts (Tabari, et al., 2015; Samadianfard, et al., 2018; Zeynoddin, et al., 2019;

Alizamir, et al., 2020). Las principales desventajas de algunos modelos de NN están

relacionadas con la optimización del modelo, para que permitan minimizar o maximizar

ciertas funciones objetivas, con el fin de mejorar los tiempos de programación, rendimiento

y eficiencia del modelo. Además, los modelos de NN se necesitan entrenar con los valores

reales para que la programación matemática sea óptima (Villarrubia, et al., 2019), por ende,

los modelos solo pueden ser aplicados en suelos que presenten las mismas características

que el suelo estudiado, esto genera que el entrenamiento sea característico para el suelo

programado y no para todos. Por otro parte, sus ventajas permiten que el modelo predictivo

pueda tratarse como una “caja negra”, donde no se hacen suposiciones de

diferenciabilidad, no linealidad o discontinuidad de dominio y puedan ser un medio eficiente

y preciso para determinar las relaciones entre las entradas y las salidas, destacándose su

buena capacidad predictora a través de una gran cantidad de datos (Benke, et al., 2018).

Actualmente, nuevas técnicas como los modelos de aprendizaje profundo (“Deep learning”)

han experimentado un resurgimiento de popularidad durante los últimos años, dado al

mejoramiento de su entrenamiento que limitaba la profundidad o cantidad de neuronas del

modelo, permitiendo generar predicciones más complejas (Eldan y Shamir, 2016;

Goodfellow, et al., 2016).

En este estudio se propone estimar y predecir la temperatura del suelo a nivel horario a

diferentes profundidades en un suelo desnudo representativo de una zona de clima

Mediterráneo en la Región Metropolitana. En primer lugar, se utilizó un modelo determinista

analítico basado en la temperatura superficial y propiedades físicas del suelo (Campbell y

Norman, 1998), el cual fue comparado con un modelo de red neuronal prealimentada de

aprendizaje profundo (Deep feed-forward network) que utiliza información meteorológica

como entrada al modelo. En segundo lugar, se realizaron modelos de series de tiempo, por

un lado, un modelo autorregresivo integrado de media móvil (ARIMA) a nivel estacional,

que utiliza la Ts histórica para realizar la predicción y, por otro lado, un modelo de redes

neuronales recurrentes (RNN) que además de utilizar la información histórica de Ts como

Page 10: Estimación de la temperatura del suelo mediante técnicas ...

5

variable de entrada, incorpora las variables meteorológicas del pasado. Finalmente, se

examinó la influencia del potencial mátrico (ψ) como variable de entrada a los modelos de

redes neuronales profundas (RNN y Deep feed-forward network), dado a que puede

proporcionar información cuantitativa sobre la dependencia de las condiciones de humedad

del suelo sobre la Ts.

Materiales y métodos

Área de estudio e instrumentación

El área de estudio se localiza en la comuna de Pirque, Provincia Cordillera en la Región

Metropolitana de Santiago (33° 40.428'S, 70° 35.154'E; Figura 1). Esta zona se emplaza en

la depresión geológica entre la Cordillera de los Andes y de la Costa. Sus suelos se

caracterizan por ser de origen aluvial, mineralizados y de acuerdo con el sistema de

clasificación taxonómica, corresponde a un orden Molisol (Bonilla y Johnson, 2012).

Presenta un clima templado cálido con lluvias invernales (clima Csb según la clasificación

de Köppen), a una altitud de 665 msnm con regímenes de precipitaciones anuales de 440

mm y temperaturas medias anuales del aire de 14°C según lo registrado por la estación

meteorológica de “Pirque” perteneciente a la Dirección General de Aguas (DGA) sobre la

base de 40 años (Centro de Ciencia del Clima y la Resiliencia [(CR)2], s.f.; Shuttle Radar

Topography Mission [SRTM], s.f).

Page 11: Estimación de la temperatura del suelo mediante técnicas ...

6

Figura 1. Área de estudio. Ubicación y disposición de los lisímetros en la unidad de

monitoreo en el campus experimental de Pirque - Fundación AGRO UC.

La unidad experimental se representa en la figura 1. Esta consta con dos lisímetros de

pesada “Science-Lysimeter” de diseño dúplex (Wagna) de la empresa “Meter Environment”

que permiten la medición de múltiples variables y parámetros para fines científicos o

investigación de suelos. Estos lisímetros comprenden una superficie de 2 m2 con una

profundidad de 2 m de la columna de suelo, un diámetro externo de 1.6 m y una resolución

del flujo de agua de 0.01 mm (10 g) medida a cada minuto. Cada lisímetro está equipado

con un sistema de pesaje de precisión, dos tensiómetros para la regulación y supervisión,

ocho sondas de humedad de suelo, 6 unidades de potencial matricial (MPS-6), 1 pc

controlador de vacío (VS-pro), entre otros. Adicionalmente, se instalaron instrumentos

aledaños al lisímetro para monitorear las variables meteorológicas como: La temperatura

del aire (Ta), Déficit de Presión de Vapor (VDP), Presión de vapor (Pv) y radiación solar

incidente (Rs). Cabe mencionar que tanto el lisímetro como los sensores instalados

Page 12: Estimación de la temperatura del suelo mediante técnicas ...

7

adyacentes a la unidad de muestreo fueron operadas por el laboratorio biometeorología y

climatología aplicada de la Facultad de Agronomía e Ingeniería Forestal de la Pontificia

Universidad Católica de Chile.

Cuadro 1. Principales estadígrafos para la temperatura de suelo (Ts) y variables

micrometeorológicas utilizadas para entrenar y validar los modelos desarrollados en este

trabajo.

Variables Media Desviación

estándar Mínimo Máximo

Ts (10 cm) [°C] 17.6 7.5 6.5 34.1

Ts (30 cm) [°C] 18.0 7.1 8.4 30.9

Ts (50 cm) [°C] 18.2 6.8 9.3 29.5

Ts (75 cm) [°C] 18.2 6.6 9.8 28.4

Ts (140 cm) [°C] 17.8 5.9 10.2 25.9

Potencial mátrico (10 cm) [hPa]

-468 271 -853 4

Presión de vapor [kPa]

0.9 0.3 0.3 1.7

Déficit de presión de vapor [kPa]

0.8 0.9 0.0 4.6

Radiación solar [W/m2]

171 260 0 1003

Temperatura del aire (2.5 m) [°C]

13.1 8.3 -3.7 33.8

El suelo en los lisímetros de la unidad experimental, corresponden al suelo aledaño descrito

para la zona. El suelo se encontraba en condición seca de forma natural, el cual se sometió

a dos riegos por goteo programados, uno el 28 de enero y otro el 14 de febrero del año

2020. Estos registraron dos horas de riego, con un volumen de 52 litros de agua

aproximadamente para cada riego. Se identifico la textura del suelo a las 5 profundidades

monitoreadas por el lisímetro y sus distribuciones del contenido de arcilla, limo y arena se

presentan en la Cuadro 1. El contenido de arcilla en general se encontró entre un 28% y un

18% entre los primeros 75 cm, en cambio a los 140 cm presentó un 2%. Además,

presentaron contenidos entre un 44% y un 40% de limo y entre un 38% y un 24% de arena

para los primeros 75 cm de profundidad. Sin embargo, a los 140 cm presentó mayores

diferencias en relación con las otras profundidades, con un 14% de limo y un 84% de arena.

Page 13: Estimación de la temperatura del suelo mediante técnicas ...

8

Cuadro 2. Textura del suelo en la unidad experimental para cada profundidad

monitoreada por el lisímetro.

Propiedades físicas

Unidad de

medida

Profundidad del suelo

10 cm 30 cm 50 cm 75 cm 140 cm

Arcilla % 26 28 18 22 2

Limo % 42 44 44 40 14

Arena % 32 28 38 38 84

Textura - Franca Franco arcillosa

Franca Franca Areno

francosa

Modelo analítico

Se utilizó la ecuación teórica propuesta por van Wijk (1959) basada en la teoría del flujo de

calor para estimar la Ts a las cinco profundidades estudiadas (Ecuación 1.1):

𝑇(𝑧, 𝑡) = 𝑇𝑚 + 𝐴(0) ∗ exp (−𝑧

𝐷) 𝑠𝑒𝑛 (𝜔(𝑡 − 𝑡0) −

𝑧

𝐷) (1.1)

donde T(z,t) (°C) corresponde a la Ts a la profundidad “z” (m) en el tiempo “t” (hora); Tm

(°C) es la temperatura media diaria de la superficie del suelo durante un tiempo de interés;

A(0) (°C) es la amplitud de onda en la superficie;. t0 (hora) es el ajuste de la fase tiempo; y

D (m) es el “Damping Depth”, que es un parámetro que describe la atenuación de la

fluctuación de la temperatura en relación con la profundidad desde la superficie del suelo.

En este estudio, D se calculó utilizando la relación propuesta por Wierenga, et al., (1969)

(Ecuación 1.2):

𝐷 = 𝑧1 − 𝑧2

ln(𝐴2) − ln (𝐴1) (1.2)

donde z1 y z2 (m) son las profundidades a las que se registran mediciones. A1 y A2 son las

diferencias del valor máximo y mínimo de la temperatura del suelo diaria a una determinada

profundidad “𝑖” obteniéndose de la siguiente forma (Ecuación 1.3):

𝐴𝑖 =𝑇𝑆 (max) − 𝑇𝑆 (min)

2 (1.3)

Finalmente, para estimar la A(0) y Tm construyeron perfiles de temperatura de suelo para

cada día donde ocurren los valores máximos y mínimos de temperatura de suelo. Los

perfiles de temperatura se ajustaron a funciones polinómicas de grado 3, dado que

presentaron mejores ajustes en comparación a funciones logarítmicas, exponenciales,

Page 14: Estimación de la temperatura del suelo mediante técnicas ...

9

potenciales, lineales y de medias móviles. Una vez obtenida la función para cada perfil se

extrapolaron los valores máximos y mínimos de la temperatura superficial. Luego, utilizando

las ecuaciones (1.1), (1.2) y (1.3) se estimó la temperatura del suelo a las cinco

profundidades propuestas. Luego, se calculó la raíz del error cuadrático medio (RMSE, sigla

en inglés), error medio absoluto (MAE, sigla en inglés) y el coeficiente de determinación sin

considerar los valores máximos y mínimos de temperatura del suelo diario utilizados para

calcular las variables faltantes.

Modelos de redes neuronales profundas.

Se diseñaron dos modelos de redes neuronales profundas, “deep feed-forward network o

multilayer perceptrón (MLP)” y “deep recurrent neural network (RNN)” para estimar y

predecir la temperatura del suelo a cinco profundidades (10, 30, 50, 75 y 140 cm)

(Goodfellow, et al., 2016; Mou, et al., 2017). Para ambos modelos se normalizaron las

variables y se dividió la base de datos dejando un 70% de ella para el entrenamiento y un

30% para la validación, además, se utilizó el gradiente por descenso estocástico (SGD, por

su sigla en inglés) para la estimación de parámetros del modelo (Goodfellow, et al., 2016).

El modelo Deep Feed-forward Network corresponde a una red neuronal de prealimentación

profunda, también conocido como perceptrones de multicapa (MLP, por su sigla en inglés),

destacándose por ser un método rápido y eficiente para el procesamiento de “Big data”

debido a las mejoras de las técnicas de computación (Goodfellow, et al., 2016). Su objetivo

consiste en estimar una o más variables de interés 𝑦 (en este caso, la Ts a las cinco

profundidades), a través de la aproximación de una función, f, dadas las entradas x. Esta

optimiza los valores de los parámetros 𝜃 traduciéndose en la mejor aproximación de la

función (Goodfellow, et al., 2016) (ecuación 2.1):

𝑦 = 𝑓(𝑥, 𝜃) (2.1)

El modelo permite que la información fluya a través de la función evaluada desde x, por

medio de cálculos intermedios para definir 𝑓 y obtener las salidas 𝑦, sin incluir conexiones

de retroalimentación al modelo, dado a que su aprendizaje rige en un solo sentido. Por lo

general, se representan componiendo muchas funciones juntas, es decir, se pueden formar

estructuras de cadenas (por ejemplo: 𝑓(1), 𝑓(2), 𝑓(3). . . 𝑓(𝑛)), donde las funciones se

Page 15: Estimación de la temperatura del suelo mediante técnicas ...

10

encuentran conectadas en una cadena representada en la ecuación 2.2 (Goodfellow, et al.,

2016):

𝑓(𝑥) = 𝑓(𝑛) (𝑓(𝑛−1) … (𝑓(2)(𝑓(1)(𝑥))) … ) (2.2)

donde 𝑓(1) es la capa de entrada, 𝑓(2) hasta 𝑓(𝑛−1) son las capas ocultas y la capa final 𝑓(𝑛)

se le denota a la capa de salida.

En este contexto, la información avanza desde la capa de entrada, a través de las capas

ocultas y hasta la capa de salida (Gulcehre, et al., 2014; Figura 2), utilizando un algoritmo

de aprendizaje basado en gradientes (SGD), que minimiza el error cuadrático medio (MSE)

en relación con los datos reales de la temperatura del suelo a las diferentes profundidades.

La dimensionalidad de las capas ocultas determina el ancho del modelo, es decir, la

cantidad de capas ocultas utilizadas para realizar la estimación. Para este estudio se

experimentó con diferentes estructuras y dimensiones para determinar el mejor modelo en

base a tiempo de programación y menor RMSE. Finamente, se diseñaron dos modelos, uno

que incluye la retención del contenido de agua o potencial mátrico (ψ) y otro que no la

incluye como variable de entrada al modelo. De esta forma, se puede evaluar el aporte del

potencial mátrico (ψ) en la estimación de la temperatura del suelo.

Figura 2. Diagrama de referencia del diseño estructural del modelo MLP. El potencial

mátrico se denoto de color rojo para representan la inclusión o no de la variable en el

modelo. Fuente: Imagen de Woodie, A. (2017), adaptada para este trabajo.

Los modelos Deep recurrent neural network o redes neuronales recurrentes (RNN)

corresponden a una familia de redes neuronales de alimentación directa, con bucles en las

Page 16: Estimación de la temperatura del suelo mediante técnicas ...

11

conexiones para procesar datos secuenciales. Por ejemplo, una secuencia de valores, tal

como se presenta en la Figura 3. A diferencia del modelo Deep feed-forward network, RNN

es capaz de procesar entradas de manera secuencial mucho más largas, al tener un estado

recurrente cuya activación depende de las observaciones del paso anterior (secuencia de

datos histórica) (Gulcehre, et al., 2014; Mou, et al., 2017). Este tipo de neuronas permite

que la red comparta parámetros a lo largo del tiempo, por ende, cada salida de la red

neuronal es en función de los miembros anteriores a través de una secuencia de vectores

𝑥(𝑡), cuyo valor t es el tiempo y se define mediante la siguiente ecuación (Gulcehre, et al.,

2014; Ecuación 3.1):

ℎ(𝑡) = 𝑓(ℎ(𝑡−1), 𝑥(𝑡); 𝜃) (3.1)

donde ℎ representa un estado típico de las RNN, la cual agrega características

arquitectónicas adicionales a la capa de salida para hacer las predicciones futuras (Figura

3). Por ende, la red aprende a utilizar ℎ(𝑡)para la secuencia pasada de entradas hasta t,

definiendo la longitud de la secuencia. Este paso activa de unidades ocultas recurrentes del

paso anterior, lo que es utilizado para modelar una distribución de probabilidad sobre el

siguiente elemento de la secuencia dado a su estado actual 𝑥(𝑡), que toma la secuencia

pasada completa (𝑥(𝑡), 𝑥(𝑡−1), … , 𝑥(2), 𝑥(1)) como entrada al modelo.

Figura 3. Diagrama de referencia del diseño de la estructura del modelo RNN. La

secuencia de observaciones corresponde a 120 valores horarios continuos de la

temperatura del suelo y la secuencia de salida corresponde a las 48 horas siguientes.

Fuente: Imagen de Venkatachalam (2019), adaptada para la figura 3.

Page 17: Estimación de la temperatura del suelo mediante técnicas ...

12

Las neuronas que permiten este análisis son memorias a largo plazo (LSTM), que son un

tipo de unidades ocultas especiales capaces de aprender dependencias a largo plazo. Se

utilizó el algoritmo SGD para el entrenamiento, que permite estimar los parámetros (𝜃) a

través de la función de perdida MSE. La dimensionalidad de las capas LSTM se determinó

en base a diferentes estructuras con el objetivo de encontrar el mejor modelo en base a

tiempo de programación y menor RMSE. Su estructura y diseño consideró 3 capas LSTM

de 16, 32 y 16 neuronas. Su entrada considera 120 valores horarios de temperatura del

suelo continuos a la profundidad que se desea estimar, para pronosticar las 48 horas futuras

siguientes.

Modelo estocástico ARIMA.

Es un método estadísticamente popular y ampliamente utilizado para analizar series de

tiempo para predecir valores futuros basados en datos históricos. Estos modelos capturan

un conjunto de diferentes estructuras temporales estándar mediante una secuencia

ordenada de los valores en el tiempo y, dependiendo de la estructura de los datos, pueden

realizarse para un proceso estacionario o no estacionario (SARIMA o ARIMA), que permite

describir y explicar la estructura inherente de la serie a través de tres componentes: un

autorregresivo (AR), un proceso integrado mixto (I) y un promedio móvil (MA), cuya

denotación sería ARIMA (p,d,q) donde los valores enteros de los parámetros indican el tipo

de modelo ARIMA utilizado (Zeynoddin, et al., 2019; Karim, et al., 2020).

Primero, se realizó un procesamiento previo convirtiendo Ts en la función logarítmica para

cada una de las profundidades, reducir la heterocedasticidad (Rodríguez, 2017). Luego se

modelaron las series de tiempo utilizando ARIMA o SARIMA dependiendo del

comportamiento estacionario o no estacionario de la Ts en las diferentes profundidades. La

denotación del modelo ARIMA para el comportamiento no estacionario se representa

mediante la siguiente ecuación (4.1):

𝑇𝑠 (𝑡) = 𝛼1𝑇𝑠 (𝑡−1) + 𝛼2𝑇𝑠 (𝑡−2) + ⋯ + 𝛼𝑝𝑇𝑠 (𝑡−𝑝) + 𝜀𝑡 + 𝛽1𝜀 (𝑡−1) + ⋯ + 𝛽𝑞𝜀 (𝑡−𝑞) (4.1)

donde, Ts (t) es la serie de tiempo deseada, 𝜀𝑡 es la serie de tiempo residual, 𝛼 es el

parámetro AR no estacional y p es el orden de la AR, 𝛽 es la media móvil (MA) y q es el

orden del parámetro MA para datos no estacionarios.

Para el modelo SARIMA, se denota mediante la siguiente ecuación (4.2) (Karim, et al.,

2020):

Page 18: Estimación de la temperatura del suelo mediante técnicas ...

13

𝛷𝑃(𝐵𝑠) 𝜑(𝐵)𝛻𝑠𝐷𝛻𝑑 𝑇𝑠 (𝑡) = 𝛼 + 𝛩𝑄(𝐵𝑠)𝜃(𝐵)𝜀𝑡 (4.2)

donde 𝜀𝑡 es la serie de tiempo residual, 𝜑(𝐵) y 𝜃(𝐵) son los vectores autorregresivos (AR)

y promedio móvil (MA) de orden p y q, respectivamente. 𝛷𝑃(𝐵𝑠) y 𝛩𝑄(𝐵𝑠) corresponden a

los operadores estacionales autorregresivos (AR) y promedio móvil (MA) de orden P y Q

respectivamente, con un periodo estacional s.

Para este estudio se utilizó el paquete ‘pmdarima’ de Python, que genera los valores

óptimos de p, d y q más convenientes para el conjunto de datos que proporciona la mejor

predicción. Las series de tiempo utilizadas son de 120 datos horarios continuos,

considerados como la “secuencia histórica” para predecir las 48 horas futuras. Se tomaron

46 series de tiempo para cada profundidad y se evaluó la estacionariedad de las series a

través de la prueba de ‘Dickey-Fuller’ para cada una de ellas (Fuller, 1976). Luego, se utilizó

un modelo ARIMA o SARIMA según corresponda y se programó para obtener los

parámetros y realizar el pronóstico para cada serie de tiempo. Finalmente, se evaluó el

RMSE, MAE y R2 para cada serie y fue promediado para cada profundidad.

Evaluación de precisión de los modelos

Para todos los modelos (Analítico, MLP, RNN y ARIMA estacional) se evaluó y comparó la

precisión de predicción a través del RMSE (5.1), MAE (5.2) y R2 (5.3):

𝑅𝑀𝑆𝐸 = √(∑ (𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑖𝑒)2)𝑁

𝑖=1

𝑁 (5.1)

𝑀𝐴𝐸 =∑ |𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑖𝑒|𝑁

𝑖=1

𝑁 (5.2)

𝑅2 =∑(𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑖𝑒)2

∑(𝑆𝑇𝑖𝑚 − 𝑆𝑇𝑀)2 (5.3)

donde, N es la cantidad de datos, 𝑆𝑇𝑖𝑚 es la temperatura del suelo real, 𝑆𝑇𝑖𝑒 es la

temperatura estimada o predicha por el modelo y 𝑆𝑇𝑀 es la media de los valores de

temperatura observados para cada profundidad.

Page 19: Estimación de la temperatura del suelo mediante técnicas ...

14

Resultados

En este estudio se comparó la precisión de las técnicas de Deep learning y metodologías

convencionales para estimar y pronosticar la Ts. Primero, se presentan los resultados entre

los modelos analítico, MLP y MLP que incluye el potencial mátrico como variable de entrada

para estimar la temperatura horaria del suelo a cinco profundidades. En segundo lugar, se

presentan los resultados de los modelos de series de tiempo (RNN y ARIMA), para el

pronóstico de 48 horas de la temperatura del suelo en cinco profundidades.

Las variables calculadas para el modelo analítico Tm, A(0) y D presentaron valores

promedios de 17,35 ± 7.6 °C, 3,00 ± 1,14 °C y 0,17 ± 0,09 m, respectivamente, resumidos

en la Cuadro 3. Las temperaturas del suelo obtenidas a través de la ecuación de van Wijk

(1959) muestran que el mejor ajuste de precisión fue a los 10 cm, donde el RMSE, MAE y

R2 presentan valores de 1,09 °C, 0,90 °C y 0,98, respectivamente. En general, el ajuste del

modelo disminuyó su precisión a mayores profundidades (Figura 4), de tal forma que el

menor ajuste del modelo correspondía a la profundidad de 140 cm (RMSE = 2,93 °C, MAE

= 2,49 °C y r2 =0,88). En la Cuadro 4 se presentan las métricas de evaluación de precisión

del modelo analítico, que en promedio presentó un RMSE = 1,95 ± 0,72 °C y MAE = 1,63 ±

0,63 °C ponderado en el perfil de suelo estudiado.

Cuadro 3. Principales estadígrafos de las variables calculadas para la ecuación de van

Wijk, obtenidos a traves de la extrapolación de la temperatura del suelo (Tm, A(0) y D).

Parámetros Tm (°C) Ta (°C) D (m) Media 17,35 3,00 0,17

Desviación estándar

7,60 1,14 0,09

Máximo 32,07 4,80 1,05 Mínimo 6,45 0,47 0,11

Se examinó la exactitud del modelo MLP y se evaluó aporte del potencial mátrico (ψ) como

variable de entrada. Se seleccionó para los modelos MLPs una función sigmoidea de tres

capas ocultas con 128, 256 y 128 neuronas respectivamente, elegida en base a su tiempo

de programación y reducción del RMSE. Sus resultados señalan que los modelos MLPs

redujeron los errores y mejoraron el ajuste del R2 a mayores profundidades (Cuadro 4). Los

peores ajustes se obtuvieron a la profundidad de 10 cm (MLP: RMSE = 1,1°C y MAE =

0,8°C; [MLP + ψ]: RMSE = 0,6°C y MAE = 0,4°C) y en cambio, el mejor ajuste fue a los 140

cm de profundidad, tanto para el modelo que incluyo el potencial mátrico como el que no

(MLP, RMSE = 0,7°C y MAE = 0,5°C; [MLP + ψ], RMSE = 0,2°C y MAE = 0,2°C; Figuras

Page 20: Estimación de la temperatura del suelo mediante técnicas ...

15

4). El aporte del potencial mátrico mejora el desempeño del modelo. Se observó una

disminución de 56,3% para el RMSE y un 56,7% para el MAE en promedio de todas las

profundidades. A pesar de que la inclusión del potencial mátrico (ψ) es a los 10 cm, la mayor

reducción del error fue a la profundidad de 140 cm, con un 65,2% para el RMSE y 64,1%

en el MAE en comparación al modelo analítico. Por ende, se observa que el modelo MLP

demostró un desempeño superior en comparación con el método analítico y obtuvo mejores

resultados al incluir el potencial mátrico en las variables de entrada al modelo.

Page 21: Estimación de la temperatura del suelo mediante técnicas ...

15

RMSE = 1,09 MAE = 0,90R² = 0,98

0

10

20

30

40

0 10 20 30 40

Ts

(10 c

m)

estim

ada [°C

]

RMSE = 1,46MAE = 1,19R² = 0,97

0

10

20

30

40

0 10 20 30 40

Ts

(30 c

m)

estim

ada [°C

]

RMSE = 1,93MAE = 1,61 R² = 0,95

0

10

20

30

40

0 10 20 30 40

Ts

(50 c

m)

estim

ada [°C

]

RMSE = 2,32MAE = 1,95R² = 0,93

0

10

20

30

40

0 10 20 30

Ts

(75 c

m)

estim

ada [°C

]

RMSE = 2,93MAE = 2,49 R² = 0,88

0

10

20

30

40

0 10 20 30

Ts

(140 c

m)

estim

ada [°C

]

Ts real [°C]

RMSE = 1,05MSE = 0,81R² = 0,98

0

10

20

30

40

0 10 20 30 40

RMSE = 0,98MAE = 0,75R² = 0,98

0

10

20

30

40

0 10 20 30 40

RMSE = 0,89MAE = 0,67R² = 0,99

0

10

20

30

40

0 10 20 30 40

RMSE = 0,82MAE = 0,60R² = 0,99

0

10

20

30

0 10 20 30

RMSE = 0,70MAE = 0,50R² = 0,99

0

10

20

30

0 10 20 30

Ts real [°C]

RMSE = 0,58 MAE = 0,43R² = 0,99

0

10

20

30

40

0 10 20 30 40

RMSE = 0,48MAE = 0,35R² = 1,00

0

10

20

30

40

0 10 20 30 40

RMSE = 0,37MAE = 0,27R² = 1,00

0

10

20

30

40

0 10 20 30 40

RMSE = 0,31MAE = 0,23R² = 1,00

0

10

20

30

40

0 10 20 30 40

RMSE = 0,24MAE = 0,18R² = 1,00

0

10

20

30

0 10 20 30

Ts real [°C]

Modelo Analítico Modelo MLP Modelo MLP + ψ

Figura 4. Diagramas de dispersión para los modelos analítico, MLP y MLP que incluye el potencial mátrico (ψ) respectivamente,

para estimar cada temperatura del suelo a los 10, 30, 50, 75 y 140 cm de profundidad. La línea de color rojo representa la línea

de la regresión.

Page 22: Estimación de la temperatura del suelo mediante técnicas ...

16

Cuadro 4. Rendimiento estadístico de los modelos analitico, MLP y MLP que incluye el potencial matrico (ψ) para la estimación de la

temperatura horaria del suelo a diferentes profundidades.

Cuadro 5. Rendimiento estadístico de los modelos ARIMA y RNN para la estimación futura de la temperatura horaria del suelo a

diferentes profundidades.

MODELO

10 cm 30 cm 50 cm 75 cm 140 cm Promedio

RMSE (°C)

Promedio MAE (°C)

RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2

ARIMA o SARIMA

1,543 1,046 0,947 0,898 0,470 0,981 0,487 0,155 0,996 0,188 0,104 0,999 0,072 0,049 1,000 0,638 0,365

RNN 1,251 1,031 0,861 0,945 0,784 0,909 0,560 0,473 0,954 0,543 0,463 0,956 0,511 0,429 0,921 0,762 0,636

MODELO

10 cm 30 cm 50 cm 75 cm 140 cm Promedio RMSE (°C)

Promedio MAE (°C) RMSE

(°C) MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2 RMSE (°C)

MAE (°C)

R2

Analítico 1,093 0,904 0,981 1,464 1,186 0,971 1,934 1,612 0,952 2,317 1,954 0,929 2,933 2,488 0,879 1,948 1,629

MLP 1,052 0,806 0,983 0,983 0,753 0,984 0,886 0,667 0,986 0,818 0,604 0,988 0,696 0,500 0,989 0,887 0,666

MLP + ψ 0,581 0,434 0,994 0,478 0,353 0,996 0,369 0,273 0,997 0,310 0,232 0,998 0,242 0,179 0,999 0,396 0,294

Page 23: Estimación de la temperatura del suelo mediante técnicas ...

17

Los modelos de series de tiempo utilizaron secuencias de entrada de 120 valores horarios

(5 días) como registro “históricos" para predecir los siguientes 48 valores (2 días). Sin

embargo, se diferencian en que los modelos RNN generan un único modelo a diferencia de

los modelos ARIMA que se deben ajustar nuevamente para cada serie de tiempo. La

exactitud de los modelos RNN y ARIMA mostraron un mejor desempeño a mayores

profundidades, dadas las características de la variable temperatura del suelo. La

comparación entre el modelo RNN y ARIMA, mostró que a los 10 cm RNN tiene una

exactitud mayor que el modelo ARIMA en relación con los errores evaluados (RNN: RMSE

= 1,25°C y MAE= 1,03°C; ARIMA: RMSE = 1,54°C y MAE = 1,05°C; (Figura 5). Sin embargo,

a mayores profundidades la exactitud de los modelos ARIMA fueron superiores a los

modelos de RNN con un error promedio RMSE = 0,76°C - MAE = 0,64°C y RMSE = 0,64°C

– MAE = 0,37°C, respectivamente (Cuadro 5). La principal ventaja de ARIMA es que puede

incluir parámetros estacionales y no estacionales. Además, para el modelo ARIMA se

incluyó el error dada estacionalidad del año y sus valores promedios muestran que el mejor

desempeño de los modelos se obtuvo durante la estación de verano (RMSE = 0,40°C y

MAE = 0,26°C) y el peor ajuste del modelo fue durante la época de invierno (RMSE = 0,85°C

y MAE =0,55°C; Cuadro 6).

Cuadro 6. Rendimiento estadístico estacional del modelo ARIMA para la estimación

futura de la temperatura horaria del suelo a diferentes profundidades.

Estación del año

10 cm 30 cm 50 cm 75 cm 140 Promedio

RMSE (°C)

Promedio MAE (°C)

RMSE (°C)

MAE (°C)

RMSE (°C)

MAE (°C)

RMSE (°C)

MAE (°C)

RMSE (°C)

MAE (°C)

RMSE (°C)

MAE (°C)

Verano 0,996 0,634 0,444 0,295 0,354 0,241 0,129 0,084 0,054 0,040 0,395 0,259

Otoño 1,477 0,916 0,749 0,412 0,288 0,175 0,141 0,088 0,078 0,051 0,547 0,329

Invierno 2,156 1,588 1,288 0,702 0,494 0,297 0,247 0,131 0,075 0,051 0,852 0,554

Page 24: Estimación de la temperatura del suelo mediante técnicas ...

18

0

10

20

30

40

1 501 1001 1501

Ts

a 1

0 c

m

[°C

]Ts estimada [°C] Ts real [°C]

0

10

20

30

40

1 501 1001 1501

Ts

a 3

0 c

m

[°C

]

0

10

20

30

1 501 1001 1501

Ts

a 5

0 c

m

[°C

]

0

10

20

30

1 501 1001 1501

Ts

a 7

5 c

m

C]

0

10

20

30

40

1 501 1001 1501 2001

Ts estimada [°C] Ts real [°C]

0

10

20

30

40

1 501 1001 1501 2001

0

10

20

30

1 501 1001 1501 2001

RMSE = 0,60

MAE = 0,52

RMSE = 0,42

MAE = 0,33

RMSE = 0,95

MAE = 0,78

RMSE = 1,25

MAE = 1,03

0

10

20

30

1 501 1001 1501Ts

a 1

40 c

m

[°C

]

Tiempo [horas]

RMSE = 0,51

MAE = 0,43

0

10

20

30

1 501 1001 1501 2001

0

10

20

30

1 501 1001 1501 2001

Tiempo [horas]

Figura 5. Comparación entre la Ts del suelo medida y pronosticada para las series de tiempo de los modelos de RNN y ARIMA a

10, 30, 50, 75 y 140 cm de profundidad.

Modelo RNN Modelo ARIMA

RMSE = 1,54

MAE = 1,05

RMSE = 0,90

MAE = 0,47

RMSE = 0,49

MAE = 0,16

RMSE = 0,19

MAE = 0,10

RMSE = 0,07

MAE = 0,05

Page 25: Estimación de la temperatura del suelo mediante técnicas ...

19

Discusión

En este estudio se compararon las estimaciones y simulaciones de la temperatura horaria

de un suelo desnudo de clima mediterráneo a las profundidades de 10, 30, 50, 75 y 140

cm, entre los modelos Analítico – MLP y ARIMA – RNN.

Las estimaciones de la Ts horaria de los modelos MLP tuvieron un mayor ajuste en

comparación al modelo analítico que utiliza la ecuación de van Wijk (1959). Además, en

comparación con otros trabajos de redes neuronales, por ejemplo, el propuesto por Feng,

et al., 2019, el modelo MLP mostró ajustes superiores en relación con la máquina de

aprendizaje extremo (ELM), cuya comparación a los 10 cm señala que tiene mejores

ajustes, como también un mejor desempeño a mayores profundidades. Esta reducción del

error a mayores profundidades puede estar dado a los umbrales de variabilidad entre los

diferentes estratos medidos y además, a una menor influencia de factores externos (Tabari,

et al., 2010; Bilgili, 2011; Ozturk, et al., 2011; Kisi, et al., 2014; Kim y Singh, 2014; Nahvi, et

al., 2016; Sanikhani, et al., 2018; Feng, et al., 2019; Alzamir, et al., 2020; Mehdizadeh, et

al., 2020). El desempeño mostrado por el modelo MLP se debe a la drástica mejoría de los

modelos de aprendizaje profundo de los últimos años. Los cuales han permitido

composiciones estructurales complejas aumentando la cantidad de nodos ocultos para

mejorar el aprendizaje, precisión y reduciendo sesgos en el procesamiento de datos

(LeCun, et al., 2015 Eldan y Shamir, 2016; Goodfellow, et al., 2016, Khosravi, et al., 2018).

Por otra parte, en los modelos MLP se obtuvo que el aporte de la retención de agua en

suelo o potencial matrico (ψ) como variable de entrada al modelo, permitió la reducción de

los errores en las cinco profundidades, promediando en total una disminución desde

0,887°C a 0,396°C para el RMSE (-55,4%) y desde 0,666°C a 0,294°C (-55.9%). Esta

disminución está relacionada a la influencia del contenido de agua sobre la temperatura del

suelo y su relación con la conductividad térmica entre los diferentes estratos. Sin embargo,

de la incertidumbre en la relación entre las variables puede estar limitada por no

linealidades, pero dada la complejidad de los modelos MLP permite mejorar su aprendizaje

(Davidson, et al., 2002; Riveros, et al., 2007; Goodfellow, et al., 2016)

En general, los modelos de series de tiempo para predecir valores futuros de la temperatura

del suelo suelen ser más escasos (Zeynoddin, et al., 2019, Li, et al., 2020). Nuestros

resultados sugieren que el modelo ARIMA tiene mejores predicciones futuras que el modelo

RNN, pero, ARIMA tiene la capacidad de incluir o no parámetros estacionales. Además, se

debe programar para cada serie de tiempo un nuevo modelo, a diferencia del modelo RNN

Page 26: Estimación de la temperatura del suelo mediante técnicas ...

20

que genera un modelo único para predecir la temperatura del suelo. RNN no incluye

parámetros estacionales dado a que sus conexiones recurrentes, pero se encontraron

problemas de rendimiento a los 30 cm de profundidad, dado a que no tiene un

comportamiento estacional (Figura 5). Esto se puede deber a que no se utilizaron

suficientes datos históricos para comprender el comportamiento de las “subsecuencias” en

el tiempo y se puede mejorar incluyendo un mayor número de datos para el entrenamiento

de la temperatura (Goodfellow, et al., 2016)

Finalmente, la estimación de la temperatura tiene un rol fundamental en la gestión

sostenible de los ecosistemas en Chile, dado a que en el país no se registra en línea de

manera continua la Ts en diferentes profundidades, volviendo los modelos MLP, RNN y

ARIMA una alternativa factible para su estimación (Stolpe y Undurraga, 2016). Además, los

modelos MLP, RNN y ARIMA podrían alimentar bases de datos inexistentes o incompletas

y realizar tendencias futuras, mejorar modelos o entender procesos como: flujo de calor del

suelo, evaporación del suelo, evapotranspiración, respiración del suelo, comportamientos

microbianos, flujos de CO2, entre otros (Davidson, et al., 2002; Sanikhani, et al., 2018).

Conclusión

La temperatura del suelo forma parte de diferentes procesos y reacciones fisicoquímicas

del suelo, por ende, forma parte esencial en los sistemas de apoyo para la toma de

decisiones relacionados con la caracterización del suelo, utilizados para mejorar sus

rendimientos. En este trabajo se propuso estimar y predecir la temperatura horaria del suelo

a cinco profundidades a través de técnicas de redes neuronales, un modelo analítico y de

series de tiempo.

Se obtuvo que los modelos que presentaron un mejor desempeño fueron los MLPs para la

estimación de la Ts horaria del suelo, tanto por los tiempos de programación como por su

capacidad de predicción. En comparación con otros trabajos de redes neuronales, se

observa que el mejoramiento del entrenamiento en los modelos de aprendizaje profundo

(MLP) es una alternativa factible para generar predicciones complejas. Además, el aporte

de incluir la variable de retención de agua en el suelo (ψ), mejoró las estimaciones de la Ts

a todas las profundidades estudiadas. Esta variable (ψ) no se había probado en los modelos

de redes neuronales, a pesar de que sea una variable directamente proporcional a la

conductividad térmica, la cual influye directamente con el comportamiento de la temperatura

Page 27: Estimación de la temperatura del suelo mediante técnicas ...

21

del suelo. Por lo tanto, MLP es altamente recomendado para estimar Ts a diferentes

profundidades.

Por otro lado, hay pocos estudios que predigan la Ts futura. El modelo RNN demostró ser

una alternativa factible a los 10 cm de profundidad en comparación al modelo ARIMA

estacional. Pero a los siguientes estratos, ARIMA mostro tener un mejor desempeño. Sin

embargo, su desventaja recae en que debe ser reprogramado para cada serie de tiempo y

no es un modelo único como RNN. Eventualmente el modelo RNN puede mejorar su

capacidad de predicción, si aumentamos la cantidad de series de datos.

Finalmente, mejorar la comprensión de la variable (Ts) permitiría elaborar estrategias de

gestión agronómica, como por ejemplo para el riego, absorción de nutrientes y agua,

captación o liberación de CO2, regulación de pesticidas, prevención de heladas, entre otras.

Facilitando sistemas de apoyo para la toma de decisiones en diferentes directrices.

Page 28: Estimación de la temperatura del suelo mediante técnicas ...

22

Resumen

La temperatura del suelo cumple un rol fundamental en el funcionamiento de

microorganismos, tasas de descomposición de residuos y en el ciclo hidrológico. Sin

embargo, la ausencia de monitoreo y la baja disponibilidad de datos en línea dificultan sus

estimaciones. Ante esta situación algunos estudios han desarrollado modelos para estimar

la temperatura del suelo (Ts) a distintas profundidades, donde los modelos de redes

neuronales han mostrado los mejores resultados. Utilizando los últimos avances del

aprendizaje profundo, en este estudio se estima la temperatura horaria del suelo a cinco

profundidades (10, 30, 50, 75 y 140 cm) para un suelo desnudo de clima mediterráneo en

Chile, a través de un modelo de perceptrones de multicapas (MLP). Este modelo se

comparó con un modelo analítico propuesto por van Wijk en 1959. Sus resultados indican

que el modelo MLP proporciona mejores ajustes que el método analítico. Además, al incluir

el potencial mátrico como variable explicativa, se redujo el RMSE y MAE promedio de las

cinco profundidades en alrededor de un 56%. Por otra parte, se predice la temperatura para

48 horas mediante un modelo de redes neuronales recurrentes (RNN) y un modelo

autorregresivo integrado de media móvil (ARIMA). Los resultados muestran que, para la

mayoría de las profundidades estudiadas, el modelo ARIMA tiene mejor desempeño que

RNN para la predicción, pero se debe considerar que no es un modelo único como el

modelo RNN y hay que reprogramar los parámetros para cada serie de tiempo.

Palabras clave: Temperatura del suelo, Aprendizaje profundo, Perceptrones de

multicapas, redes neuronales recurrentes, modelos ARIMA.

Referencias

Benke, K. K., Norng, S., Robinson, N. J., Benke, L. R., & Peterson, T. J. (2018). Error

propagation in computer models: analytic approaches, advantages, disadvantages

and constraints. Stochastic Environmental Research and Risk Assessment, 32(10),

2971-2985.

Bilgili, M. (2011). The use of artificial neural networks for forecasting the monthly mean soil

Temperatura in Adana, Turkey. Turkish Journal of Agriculture and Forestry, 35(1),

83-93.

Page 29: Estimación de la temperatura del suelo mediante técnicas ...

23

Bonilla, CA y Johnson, OI (2012). Mapeo de erosionabilidad del suelo y su correlación con

las propiedades del suelo en Chile Central. Geoderma, 189, 116-123.

Campbell, G. S., y Norman, J. M. (1998). Radiation fluxes in natural environments. An

Introduction to Environmental Biophysics (pp. 167-184). Springer, New York, NY.

Canadell, J., Jackson, R. B., Ehleringer, J. B., Mooney, H. A., Sala, O. E., y Schulze, E. D.

(1996). Maximum rooting depth of vegetation types at the global scale. Oecologia,

108(4), 583-595.

Centro de Ciencia del Clima y la Resiliencia (CR)2. Explorador climático. (s.f).

http://explorador.cr2.cl/

Chinnusamy, V., Zhu, J., & Zhu, J. K. (2007). Cold stress regulation of gene expression in

plants. Trends in plant science, 12(10), 444-451.

Crombie, D. S., Tippett, J. T., y Hill, T. C. (1988). Dawn water potential and root depth of

trees and understorey species in southwestern Australia. Australian Journal of

Botany, 36(6), 621-631.

Curiel Yuste, J., Baldocchi, D. D., Gershenson, A., Goldstein, A., Misson, L., & Wong, S.

(2007). Microbial soil respiration and its dependency on carbon inputs, soil

temperature and moisture. Global Change Biology, 13(9), 2018-2035.

Davidson, E. A., Belk, E., y Boone, R. D. (1998). Soil water content and temperature as

independent or confounded factors controlling soil respiration in a temperate mixed

hardwood forest. Global change biology, 4(2), 217-227.

Eldan, R., y Shamir, O. (2016). The power of depth for feedforward neural networks. In

Conference on learning theory (pp. 907-940).

Fan, Y., Miguez-Macho, G., Jobbágy, E. G., Jackson, R. B., y Otero-Casal, C. (2017).

Hydrologic regulation of plant rooting depth. Proceedings of the National Academy

of Sciences, 114(40), 10572-10577.

Fuller, W. A. (1976). Introduction to Statistical Time Series, New York: JohnWiley.

FullerIntroduction to Statistical Time Series1976.

Goodfellow, I., Bengio, Y., y Courville, A. (2016). Deep learning book. MIT Press, 521(7553),

800.

Page 30: Estimación de la temperatura del suelo mediante técnicas ...

24

Hanks, R. J. (2012). Applied soil physics: soil water and temperature applications (Vol. 8).

Springer Science y Business Media.

Hay, R. K. M., y Wilson, G. T. (1982). Leaf appearance and extension in field-grown winter

wheat plants: the importance of soil temperature during vegetative growth. The

Journal of Agricultural Science, 99(2), 403-410.

Jackson, R. B., Canadell, J., Ehleringer, J. R., Mooney, H. A., Sala, O. E., y Schulze, E. D.

(1996). A global analysis of root distributions for terrestrial biomes. Oecologia,

108(3), 389-411.

Karim, A., Kube, A. O., y Saeed, B. I. I. (2020). Modeling of Monthly Meteorological Time

Series. Journal of Statistical and Econometric Methods, 9(4), 117-136.

Langholz, H. (1989). A simple model for predicting daily mean soil temperatures. Journal of

Agronomy and Crop Science, 163(5), 312-318.

LeCun, Y., Bengio, Y., y Hinton, G. (2015). Deep learning. nature, 521(7553), 436-444.

Li, C., Zhang, Y., y Ren, X. (2020). Modeling Hourly Soil Temperature Using Deep BiLSTM

Neural Network. Algorithms, 13(7), 173.

Meza, F. J., Wilks, D. S., Gurovich, L., y Bambach, N. (2012). Impacts of climate change on

irrigated agriculture in the Maipo Basin, Chile: reliability of water rights and changes

in the demand for irrigation. Journal of water resources planning and management,

138(5), 421-430.

Mihalakakou, G. (2002). On estimating soil surface temperature profiles. Energy and

Buildings, 34(3), 251-259.

Mooney, H. A., Gulmon, S. L., Rundel, P. W., y Ehleringer, J. (1980). Further observations

on the water relations of Prosopis tamarugo of the northern Atacama desert.

Oecologia, 44(2), 177-180.

Ozturk, M., Salman, O., y Koc, M. (2011). Artificial neural network model for estimating the

soil temperature. Canadian journal of soil science, 91(4), 551-562.

Pregitzer, K. S., King, J. S., Burton, A. J., y Brown, S. E. (2000). Responses of tree fine roots

to temperature. New Phytologist, 147(1), 105-115.

Page 31: Estimación de la temperatura del suelo mediante técnicas ...

25

Pregitzer, K. S., y King, J. S. (2005). Effects of soil temperature on nutrient uptake. In

Nutrient acquisition by plants (pp. 277-310). Springer, Berlin, Heidelberg.

Paul, K. I., Polglase, P. J., Smethurst, P. J., O’Connell, A. M., Carlyle, C. J., y Khanna, P. K.

(2004). Soil temperature under forests: a simple model for predicting soil temperature

under a range of forest types. Agricultural and Forest Meteorology, 121(3-4), 167-

182.

Riveros‐Iregui, D. A., Emanuel, R. E., Muth, D. J., McGlynn, B. L., Epstein, H. E., Welsch,

D. L., ... y Wraith, J. M. (2007). Diurnal hysteresis between soil CO2 and soil

temperature is controlled by soil water content. Geophysical Research Letters,

34(17).

Rodríguez, G. (2017). Selección de modelos de heterocedasticidad autorregresiva

condicional: Una aplicación a la volatilidad de los retornos bursátiles en Perú.

Revista de análisis económico, 32(1), 69-94.

Samadianfard, S., Ghorbani, M. A., y Mohammadi, B. (2018). Forecasting soil temperature

at multiple-depth with a hybrid artificial neural network model coupled-hybrid firefly

optimizer algorithm. Information Processing in Agriculture, 5(4), 465-476.

Sanikhani, H., Deo, R. C., Yaseen, Z. M., Eray, O., y Kisi, O. (2018). Non-tuned data

intelligent model for soil temperature estimation: A new approach. Geoderma, 330,

52-64.

Shuttle Radar Topography Mission [SRTM]. (s.f). Spatial Information.

https://srtm.csi.cgiar.org/srtmdata/.

Snyder, R. L., Melo-Abreu, J. P., y VILLAR MIR, J. M. (2010). Protección contra las heladas:

fundamentos, práctica y economía. Serie FAO sobre el Medioambiente y la Gestión

de los Recursos Naturales, 1(10).

Stolpe, N., y Undurraga, P. (2016). Long term climatic trends in Chile and effects on soil

moisture and temperature regimes. Chilean journal of agricultural research, 76(4),

487-496.

Tabari, H., Hosseinzadeh Talaee, P., y Willems, P. (2015). Short‐term forecasting of soil

temperature using artificial neural network. Meteorological Applications, 22(3), 576-

585.

Page 32: Estimación de la temperatura del suelo mediante técnicas ...

26

Toy, T. J., Kuhaida Jr, A. J., y Munson, B. E. (1978). The prediction of mean monthly soil

temperature from mean monthly air temperature. Soil Science, 126(3), 181-189.

van Wijk, W. R., Larson, W. E., y Burrows, W. C. (1959). Soil temperature and the early

growth of corn from mulched and unmulched soil. Soil Science Society of America

Journal, 23(6), 428-434.

Venkatachalam, M. (2019). A Recurrent Neural Network, with a hidden state that is meant

to carry pertinent information from one input item in the series to others [imagen].

https://towardsdatascience.com/recurrent-neural-networks-d4642c9bc7ce.

Consultado el 01 de marzo del 2021.

Villarrubia, G., De Paz, J. F., Chamoso, P., & De la Prieta, F. (2018). Artificial neural

networks used in optimization problems. Neurocomputing, 272, 10-16.

West, E. S. (1952). A study of the annual soil temperature wave. Australian Journal of

Chemistry, 5(2), 303-314.

Wierenga, P. J., Nielsen, D. R., y Hagan, R. M. (1969). Thermal properties of a soil based

upon field and laboratory measurements. Soil science society of America Journal,

33(3), 354-360.

Woodie, A. (2017). Machine Learning, Deep Learning, and AI: What’s the Difference?

[imagen]. https://www.datanami.com/2017/05/10/machine-learning-deep-learning-

ai-whats-difference/. Consultado el 01 de marzo del 2021

Yang, C. C., Prasher, S. O., y Mehuys, G. R. (1997). An artificial neural network to estimate

soil temperature. Canadian Journal of Soil Science, 77(3), 421-429.

Zeynoddin, M., Bonakdari, H., Ebtehaj, I., Esmaeilbeiki, F., Gharabaghi, B., y Haghi, D. Z.

(2019). A reliable linear stochastic daily soil temperature forecast model. Soil and

Tillage Research, 189, 73-87.

Zheng, D., Hunt Jr, E. R., y Running, S. W. (1993). A daily soil temperature model based on

air temperature and precipitation for continental applications. Climate Research,

2(3), 183-191.