Multiformador controlado por wavelet para pronóstico de series temporales de aguas subterráneas

Noticias

HogarHogar / Noticias / Multiformador controlado por wavelet para pronóstico de series temporales de aguas subterráneas

May 20, 2023

Multiformador controlado por wavelet para pronóstico de series temporales de aguas subterráneas

Scientific Reports volumen 13, número de artículo: 12726 (2023) Cite este artículo 1 Detalles de Altmetric Metrics Desarrollar modelos precisos para el control de las aguas subterráneas es fundamental para la planificación y la gestión

Scientific Reports volumen 13, número de artículo: 12726 (2023) Citar este artículo

1 altmétrica

Detalles de métricas

Desarrollar modelos precisos para el control de las aguas subterráneas es fundamental para la planificación y gestión de los recursos sustentadores de la vida (agua) de los acuíferos. Se han logrado avances significativos en el diseño y empleo de modelos de pronóstico profundo para abordar el desafío del pronóstico de series temporales multivariadas. Sin embargo, la mayoría de los modelos se enseñaron inicialmente sólo para optimizar el procesamiento del lenguaje natural y las tareas de visión por computadora. Proponemos el Wavelet Gated Multiformer, que combina la fuerza de un transformador básico con el Wavelet Crossformer que emplea bloques internos de correlación cruzada de wavelets. El mecanismo de autoatención (Transformer) calcula la relación entre los puntos internos de la serie temporal, mientras que la correlación cruzada encuentra patrones de periodicidad de tendencia. El codificador de cabezales múltiples se canaliza a través de una puerta de mezcla (combinación lineal) de subcodificadores (Transformer y Wavelet Crossformer) que envían firmas de tendencias al decodificador. Este proceso mejoró las capacidades predictivas del modelo, reduciendo el error absoluto medio en un 31,26 % en comparación con los modelos tipo transformador de segundo mejor rendimiento evaluados. También hemos utilizado los mapas de calor de correlación cruzada sin tendencia multifractal (MF-DCCHM) para extraer tendencias cíclicas de pares de estaciones en regímenes multifractales eliminando el ruido del par de señales con ondas de Daubechies. Nuestro conjunto de datos se obtuvo de una red de ocho pozos para el monitoreo de aguas subterráneas en acuíferos brasileños, seis estaciones pluviométricas, once estaciones de flujo de ríos y tres estaciones meteorológicas con sensores de presión atmosférica, temperatura y humedad.

Los recursos de aguas subterráneas1 se encuentran entre los activos más críticos para el sustento de la vida2 en comunidades de todo el mundo. Los acuíferos desempeñan un papel crucial en la agricultura de regadío3, el suministro de agua4,5 y el desarrollo industrial6. Las mediciones del nivel freático son vitales para los sistemas de gestión del agua7,8 ya que indican disponibilidad, accesibilidad y posibles perturbaciones9,10. Por lo tanto, un pronóstico preciso de los niveles de agua subterránea también puede proporcionar a los responsables de políticas información para planificar estrategias y gestionar los recursos hídricos que aseguren el desarrollo sostenible en diferentes regiones11,12. Estos sistemas suelen estar integrados en áreas específicas a través de pozos conectados al yacimiento principal. Sin embargo, debido a la complejidad y la no linealidad de la naturaleza, como las fluctuaciones climáticas, la recarga de aguas subterráneas y la tasa de descarga de los ríos, las diversas topografías, las actividades humanas como las operaciones de los embalses acuíferos y los cambios en la presión atmosférica, las precipitaciones, la temperatura y las distintas condiciones hidrogeológicas y sus interacciones pueden afectar profundamente las predicciones de los niveles de agua subterránea13,14.

Se han propuesto numerosos enfoques para modelar, simular y predecir los niveles de agua subterránea utilizando modelos conceptuales15, enfoques de diferencias finitas16 y de elementos finitos17,18. Aunque los modelos clásicos pueden ser fiables para las predicciones, se necesitan grandes volúmenes de datos. Además, los acuíferos tienen diferentes propiedades, como diversas condiciones de contorno subyacentes a las estructuras geológicas, velocidades de difusión de medios porosos y topografía que afecta a los yacimientos. Los modelos físicos pueden rastrear el acondicionamiento del agua para pronosticar distribuciones espaciotemporales19,20. Sin embargo, la complejidad y los costes computacionales son excepcionalmente altos ya que la solución de ecuaciones diferenciales parciales puede tardar varios días. Por lo tanto, diseñar modelos de aprendizaje automático para simular niveles de agua subterránea que capturen la dinámica no lineal de los embalses mediante la identificación de patrones intrínsecos en los datos de series de tiempo sin procesos físicos subyacentes es primordial para los sistemas de gestión del agua21,22,23,24. También se han utilizado redes neuronales basadas en la física para simular el proceso físico que gobierna los acuíferos25,26,27. Además, se han logrado avances en métodos basados ​​en aprendizaje profundo para la predicción de aguas subterráneas28,29, algoritmos genéticos30,31, máquina de vectores de soporte (SVM)32,33,34, redes convolucionales (CNN) y convolucionales temporales35,36, redes neuronales recurrentes. , unidad recurrente cerrada (GRU) y memoria a corto plazo (LSTM)37,38,39, y redes neuronales gráficas basadas en Wavenets40,41 para incluir patrones espaciotemporales para el pronóstico de aguas subterráneas.

Recientemente se han logrado avances en el desarrollo de modelos de pronóstico profundo para abordar el desafío del pronóstico de series temporales multivariadas42. La mayoría de estos modelos inicialmente enseñados solo para optimizar tareas en el procesamiento del lenguaje natural se están adaptando de manera eficiente para aplicaciones en múltiples campos43,44. Los Transformers45, arquitecturas basadas en mecanismos de autoatención, han mostrado una mejora notable en la calidad y el rendimiento para diversas tareas en traducción automática y visión por computadora46,47,48. Estos modelos pueden capturar dependencias, interacciones y relaciones de largo alcance en datos secuenciales, una característica intrínseca de las series temporales. Dado que los transformadores para series temporales son un tema emergente49, se han propuesto muchas variantes para la predicción profunda50, la detección de anomalías51,52, la clasificación53, las tendencias estacionales54 y el aumento de datos55. Los modelos basados ​​en Transform más recientes incluyen Autoformer56, que explora el concepto de autocorrelación para reescribir el bloque de autoatención. Estos bloques de autocorrelación únicos aumentan la robustez y proporcionan resultados más rápidos y precisos que el Transformer original. Además, Informer57 reemplaza la autoatención con el mecanismo de autoatención de Probspace para manejar los desafíos de la complejidad del tiempo cuadrático y el uso de memoria en el Transformer básico. Además, dado que la mayoría de las series temporales tienen una representación escasa en la transformada de Fourier, FEDformer58 introduce el bloque de frecuencia mejorada y la atención de frecuencia mejorada para expandir el modelo original y lograr un rendimiento aún mayor en algunas aplicaciones.

Este trabajo propone el Wavelet Gated Multiformer para el pronóstico de series temporales de aguas subterráneas. Nuestro método combina la fuerza de los conceptos básicos de Transformer45 detrás del Autoformer56. También introduce bloques de autocorrelación wavelet en el codificador y decodificador para eliminar el ruido de las señales. Además, el mecanismo de autoatención es responsable de calcular la relación entre puntos dentro de la serie temporal. Al mismo tiempo, la autocorrelación encuentra patrones de periodicidad (tendencias) dentro de la serie temporal, y estos mecanismos se mezclan a través de una puerta (combinación lineal) en un único codificador para mejorar el reconocimiento de patrones. Un codificador de cabezales múltiples con subcodificadores de mezcla de puertas (Transformer y Wavelet Crossformer) puede brindarle al decodificador una firma más concisa de las señales de tendencia y mejorar las capacidades predictivas del modelo. El análisis de correlación cruzada multifractal se ha utilizado con éxito en una variedad de estudios que involucran investigaciones de patrones de series temporales, incluidas las tendencias económicas59,60 y el clima61. Este trabajo también incluye el análisis multifractal de patrones cíclicos a través de regímenes multifractales entre pares de series temporales (estaciones) a través de mapas de calor de correlación cruzada sin tendencia multifractal (MF-DCCHM)62 con 4 ondas Daubechies para filtrado de alta frecuencia.

El Servicio Geológico de Brasil (SGB) ha desarrollado una red de pozos para el monitoreo de aguas subterráneas en acuíferos de todo Brasil, también conocida como Red Integrada de Monitoreo de Aguas Subterráneas (RIMAS). El Sistema Acuífero de Urucuia (UAS), ubicado en el oeste del estado de Bahía, cuenta con más de 60 pozos para el monitoreo de aguas subterráneas y un constante auge de la economía agrícola durante las últimas décadas en su región. El auge económico vino acompañado de un aumento posterior de la demanda de suministro de agua. Además, el agua subterránea de UAS también ha sido crucial para mantener el flujo de afluentes esenciales del río São Francisco, el río más vital del noreste de Brasil. Por lo tanto, es esencial un monitoreo continuo de los niveles de agua subterránea en el Acuífero de Urucuia. En este trabajo, hemos investigado ocho pozos obtenidos de un conjunto de datos disponible públicamente en RIMAS63, seis estaciones pluviométricas y once estaciones de flujo fluvial de la Red Hidrometeorológica Nacional (RHN) proporcionada por la Agencia Nacional del Agua de Brasil64, y conjuntos de datos del Instituto Nacional de Meteorología. (INMET)65 con tres estaciones meteorológicas que incluyen sensores de presión atmosférica, temperatura y humedad (ubicación UTM y alias utilizados para los sensores en las Tablas S1 a S4 en Materiales complementarios), como se muestra en la Fig. 1. Los datos recopilados tienen muestreos y rangos diarios. del 1 de enero de 2016 al 31 de diciembre de 2019. Para los datos de la estación, realizamos agregación y normalización utilizando un factor de distancia exponencial para reducir el volumen total de datos de entrada mientras consideramos la información de posición relativa de las estaciones con respecto a cada pozo. En la siguiente sección se discutirán los principales resultados y sus tendencias.

Diagrama del mapa con las estaciones y pozos representados en verde (W1-W8), estaciones fluviales en rojo, estaciones pluviométricas en amarillo y estaciones meteorológicas (presión atmosférica, humedad y temperatura) en azul. Consulte la Tabla S1 (material complementario) para obtener información sobre latitud y longitud. El diagrama del mapa fue generado con ArcGIS 10.876 y postprocesado con Inkscape68 (software de código abierto con licencia GPL). El conjunto de datos está disponible públicamente y puede obtenerse del sistema de Geociencias del Servicio Geológico de Brasil (GeoSGB)77. La licencia es Creative Commons Attribution NonCommercial 4.0 International.

Hemos empleado los mapas de calor de correlación cruzada sin tendencia multifractal (detalles en la sección "Métodos"), una técnica basada en coeficientes de correlación cruzada sin tendencia que puede mapear las relaciones entre pares de fluctuaciones en diferentes regímenes multifractales. Hemos utilizado cajas deslizantes con tamaños de hasta el 5\(\%\) de toda la serie para el análisis local. Después de los cálculos principales, las imágenes se generan a partir de tensores y se trazan utilizando Python66 y el paquete matplotlib67. Finalmente, los gráficos se posprocesan con Inkscape68 para generar los diagramas y mapas de calor. Estos mapas de calor pueden descubrir patrones cíclicos no explícitos entre señales obtenidas de una combinación de sensores bajo restricciones específicas. La Figura 2 representa los mapas de calor de correlación cruzada sin tendencia multifractal con un promedio sobre la intensidad de los coeficientes de correlación cruzada para cada día en la parte superior de los mapas. El promedio puede proporcionar una visión peculiar de las tendencias positivas y negativas en múltiples regímenes considerando todas las ventanas y cajas correderas posibles. La importancia del supuesto anterior se basa en la posibilidad de descubrir e inferir patrones cíclicos a través de múltiples regímenes para las series temporales del nivel de agua subterránea medido por sensores de pozo en comparación con otros datos de pozos regionales, presión local, datos de humedad, niveles de ríos o atributos climáticos. como por ejemplo las precipitaciones locales adquiridas a través de sensores de diferentes estaciones. Nuestro conjunto de datos se compone de series de tiempo diarias de múltiples sensores que van desde el 1 de enero de 2016 a 2019: (i) ocho series de datos (W1-W8) que representan los niveles de agua subterránea del sensor dentro de los registros del pozo, (ii) seis series de datos para medir la lluvia (R1–R6) de las estaciones meteorológicas, (iii) once series de datos (RI1–R11) que miden los niveles de los ríos, (iv) tres conjuntos de datos que representan la presión atmosférica (P1–P3) en diferentes ubicaciones, (v) tres series de datos para la temperatura local (T1 – T3), y (vi) tres series de datos para la humedad local (H1 – H3).

Mapas de calor de correlación cruzada sin tendencia multifractal entre los atributos: (a) W1 y W8, (b) W1 y W6, (c) RI2 y RI10, (d) R1 y R4, (e) T1 y H1 (f) T1 y H2 .

La Figura 2a representa la correlación cruzada entre dos pozos, W1 y W8. El eje x representa la variación temporal (series de tiempo diarias). En cambio, el eje vertical simboliza la variación de la escala \(\nu\) considerando el intervalo \(10 \le \nu \le 60\) con una caja deslizante de tamaño fijo. Los colores corresponden a la variación en la intensidad de \(\sigma\), representando los coeficientes de correlación cruzada entre los pozos W1 y W8. Los coeficientes de correlación cruzada sin tendencia calculados están en el intervalo de \(-1 \le \sigma \le 1\), como se muestra en la barra lateral de cada mapa de calor. En la parte superior, el eje vertical describe el \(\sigma\) promedio (coeficientes de correlación cruzada) para todo el alcance del mapa. Este gráfico es crucial ya que podemos centrarnos en identificar tendencias cíclicas debido a oscilaciones y descubrir la tendencia para todo el período (persistencia promedio o antipersistencia). Estas series de tiempo tendrán características de correlación cruzada sin tendencia fuerte o débil dependiendo del color y la uniformidad, dado un rango vertical para todas las escalas \(\nu\).

El MF-DCCHM para el par de pozos W1 y W8 que se muestran en la Fig. 2a muestra la periodicidad para \(\sigma >0\) y \(\nu > 25\), lo que representa aproximadamente 6 meses tomando \(P_{cp) }\) como punto de partida \(\approx\)(2016.7;25), donde \(P_{cp}\) denota los valores con coeficientes de correlación cruzada positivos. Además, hemos identificado un patrón cíclico para \(\sigma < 0\) y \(\nu > 30\), que representa aproximadamente 8 meses, donde el valor de referencia es \(P_{cn} \approx\)(2017.1; 30) para los coeficientes de correlación cruzada negativos. Además del mapa de calor, los coeficientes de correlación cruzada promediados sin tendencia (verticalmente) muestran un patrón cíclico exacto debido a las oscilaciones durante todo el período. Por lo tanto, el nivel freático en estos dos pozos (W1 y W8) sigue una tendencia similar de fluctuaciones para el período con coeficientes positivos. En cambio, sus fluctuaciones tienen una relación inversa para los coeficientes negativos. Además, hemos encontrado coeficientes de correlación cruzada residuales que exhiben correlaciones débiles, rondando \(\sigma \approx 0\).

También hemos obtenido resultados similares para todas las combinaciones de pares considerados (ocho pozos) distribuidos en la región. Nuestros resultados indican que cuanto más cerca están los pozos entre sí, mayor es la probabilidad de que estos pozos sigan las mismas fluctuaciones de volumen de fluido durante períodos específicos. La Figura 2b muestra el MF-DCCHM para los pozos W1 y W6, los cuales tienen un patrón similar en comparación con el par de pozos mostrados en la Fig. 2a (W1 y W8) en el intervalo de tiempo entre enero y agosto de 2016. Sin embargo, tenemos anomalías detectadas para todo el periodo de agosto de 2016. La Figura 2b muestra un color verde uniforme desde 2016 hasta finales de 2019, con coeficientes \(\sigma \approx 0\), para cualquier \(P \approx\)(t > 2016.7 ; \(\nu\)), donde t es la variable temporal. Después de realizar un análisis detallado de las condiciones de todos los pozos, la anomalía en el pozo W6 sugiere una entrada masiva de agua debido al bombeo regular de agua subterránea desde un pozo cercano (a unos 800 m de distancia, según observaciones de campo).

La Figura 2c muestra el MF-DCCHM para el río dos (RI2) y el río diez (RI10). Nuestros resultados indican tendencias de proporcionalidad directa e indirecta relacionadas con el volumen de fluido en diferentes sensores a través de los ríos para diferentes períodos. Al analizar el MF-DCCHM de once series de datos (sensores), hemos descubierto una firma de proporcionalidad directa estándar (\(\sigma\) positiva) entre las fluctuaciones en el nivel de los fluidos de los ríos cada 3 meses, una característica de la región. También hemos observado un patrón anormal periódico en el MF-DCCHM asociado con series de datos de lluvia. La Figura 2d muestra el MF-DCCHM para las estaciones R1 y R4, con un patrón atípico entre febrero y marzo. Estos intervalos periódicos coincidieron con las cuatro bandas mostradas en el mapa, indicando la no aparición de lluvias en el período.

También hemos examinado el MF-DCCHM de nueve series de datos de presión, temperatura y humedad recopilados en tres ubicaciones. Hemos construido los mapas para todos los pares de señales. La Figura 2e representa el mapeo de correlación cruzada entre las series de temperatura y humedad de las estaciones T1 y H1. El mapa contiene patrones cíclicos compuestos de bandas en rojo donde \(\sigma > 0.8\) para toda la longitud de la serie \(10 \le \nu \le 60\), lo que muestra una proporcionalidad sustancial en todos los regímenes. También hemos encontrado el mismo comportamiento al comparar la temperatura en T1, la humedad en H1 y la lluvia en R1 con la humedad en H1. Estos patrones cíclicos de alta correlación cruzada indican una firma de que el aire puede saturarse en condiciones de alta humedad relativa. A una temperatura determinada, el aire no puede retener el contenido de agua, lo que provoca la formación de nubes y precipitaciones. La temperatura a la que el aire se satura (incapaz de retener la humedad) también se conoce como punto de rocío. Sin embargo, hemos notado un debilitamiento de los coeficientes de correlación cruzada sin tendencia que afectan la proporcionalidad directa al considerar diferentes ubicaciones, lo que puede caracterizarse como un efecto regional. La Figura 2f muestra el MF-DCCHM para temperatura y humedad en las estaciones T1 y H1. El período promedio para eventos de proporcionalidad directa e inversa es de aproximadamente 6 meses, con atenuación para diferentes distancias.

Mapas de calor de correlación cruzada sin tendencia multifractal entre los atributos: (a) W1 y R4, (b) W1 y RI10, (c) P1 y T1, (d) W1 (filtro simple) y RI, (e) W1 (filtro WaveLet 0.35 ) y RI y (f) W1 (Filtro WaveLet 0.70) y RI.

La Figura 3a muestra las correlaciones cruzadas para las series de datos del pozo W1 y de lluvia R4. Además de la periodicidad reportada para \(\sigma < 0\) y \(\sigma > 0\), los mapas pueden mostrar bandas compuestas por ausencia de lluvia con patrones de \(0.5\, ciclo/año\) considerando \(\sigma \aprox 0\) y \(10 \le \nu \le 60\). La Figura 3b representa el MF-DCCHM para el par del pozo W1 y el río RI10. Este resultado muestra una relación intrínseca en la correlación cruzada entre los niveles del río y del pozo. Cuanto más cerca esté el pozo del río, mayor será la corrección cruzada entre ellos, ya que la interconexión a través de canales regionales puede proporcionar diferentes retrasos en la entrada y salida de agua, elevando los niveles de agua subterránea a diferentes velocidades. Sin embargo, factores como la intensidad de las precipitaciones en la región impactan considerablemente la afinidad entre los niveles de medición de los pozos y las estaciones fluviales.

Las figuras 3d-f se obtuvieron del par de variables pozo y río, incluido un filtro de paso bajo con 4 ondas Daubechies. En la Fig. 3e, f, hemos utilizado un umbral de filtrado de 0,35 para la Fig. 2e y 0,70, respectivamente. Después de eliminar el ruido blanco, podemos observar un aumento en las bandas uniformes explícitas en los mapas con periodicidades de correlación cruzada positiva y negativa más fuertes. Por lo tanto, al reducir las fluctuaciones de alta frecuencia, nuestra señal lleva tendencias estacionales características de las bajas frecuencias, que pueden ser relevantes para determinar los ciclos. El filtrado ayuda a descubrir tendencias significativas que se extienden a través de múltiples regímenes, ya que la extracción de ruido blanco genera distribuciones más uniformes a lo largo de los ejes verticales. Es crucial resaltar la influencia de las fluctuaciones de alta frecuencia para el reconocimiento de patrones y la sensibilidad del MF-DCCHM para capturar tendencias estacionales después de filtrar el ruido.

Las Figuras S8 y S9 (Material complementario) muestran los análisis \(DFA_0\) y \(DFA_1\) para todas las series de las Figs. 2 y 3. El eje vertical representa la fluctuación, el eje horizontal representa el tamaño de la ventana y la barra vertical al costado muestra el símbolo y el color asociado con cada atributo. En las Figs. 2 y 3, el MF-DCCHM capturó firmas de dos regímenes. También hemos obtenido curvas similares para los análisis \(DCCA_0\) y \(DCCA_1\). Estos regímenes pueden describirse mediante los exponentes multiescala que se muestran en las Tablas S5 a S13. Estos resultados muestran los exponentes de autocorrelación y correlación cruzada con indicaciones de correlación negativa (\(0.0< \alpha < 0.5\)), cercana a no correlacionada (\(\alpha \approx 0.5\)) y correlación positiva (\(0.5\) < \alpha < 1.0\)) patrones. Las tablas 1 y 2 también muestran un exponente de \(\alpha > 1.0\) para el pozo W8 en el segundo régimen representado por la región II. Para el \(DFA_1\), hemos encontrado el río RI35 en la región I y el río RI70 tanto en la región I como en la II. También hemos obtenido un exponente multifractal de \(\alpha > 1.0\). La aparición de \(\alpha > 1.0\)69 también puede asociarse con niveles de ruido de alta frecuencia en la tendencia lineal. Por lo tanto, hemos empleado el filtro de paso bajo Daubechies 4 y logramos amplificar firmas cíclicas críticas, eliminar el ruido de las fluctuaciones y, en el caso del pozo W8, reducir los exponentes multifractales por menos de uno. Este es un resultado muy significativo ya que hemos demostrado que el MF-DCCHM es muy sensible al ruido de alta frecuencia y la eliminación de ruido con umbrales específicos puede ayudar a descubrir tendencias de baja frecuencia.

También hemos predicho la serie de tiempo más probable para una longitud I dada una señal de entrada L y un conjunto de datos multivariado obtenido de múltiples estaciones. Hemos propuesto el Wavelet Gated Multiformer (detalles en la sección "Métodos"), que introduce un bloque de descomposición wavelet para el pronóstico de series temporales multivariadas dentro del codificador. Este enfoque emplea simultáneamente las ventajas de la información pasada de múltiples subcodificadores a través de una puerta de mezcla \(\oplus\), como se muestra en la Fig. 4. Este procedimiento conlleva una combinación de técnicas basadas en transformadores, ya que la salida del codificador tiene información. con respecto a la relación entre puntos dispersos (descubrimiento de dependencias puntuales) de la familia de autoatención50,57, agregación de puntos seleccionados por producto escalar y acumulación de subseries similares de diferentes períodos a través del bloque de retardo de tiempo (Wavelet Crossformer) . Nuestro enfoque también puede ampliarse para su aplicación en otros campos, ya que el modelo profundo proporciona mayor precisión para algunos registros de pozos.

Wavelet Gated Multiformer con (a) codificador, (b) señal de salida por lotes aleatoria de Wavelet Crossformer y (c) transformador, y (d) señal después de la puerta de mezcla. La salida del codificador (e) tendencia cíclica de ondas, (f) tendencia estacional y (g) decodificador con bloques internos de correlación cruzada.

La Figura 4 muestra la señal descompuesta en partes de tendencia cíclica (progresión a largo plazo) y estacional para comprender los patrones temporales durante el pronóstico. Wavelet Crossformer utiliza progresivamente un bloque de descomposición similar al Autoformer para extraer la tendencia estacionaria a largo plazo de las predicciones intermedias. Sin embargo, en lugar de mover el promedio, eliminamos el ruido de la señal con un filtro wavelet de paso bajo basado en Daubechies 4 para concentrarnos en las tendencias a largo plazo. La eliminación del ruido de alta frecuencia ha demostrado ser un factor esencial para la extracción de características de tendencias. Hemos realizado múltiples experimentos con ocho pozos entrenando una secuencia de 180 pasos de tiempo (días) para predecir los siguientes 30 y 60 pasos de tiempo (días). Los resultados se resumen en la Tabla 3. El Wavelet Gated Multiformer propuesto también se comparó con el Transformer45, el Autoformer56 y el Informer57 estándar utilizando dos métricas diferentes: (i) Error cuadrático medio (MSE) y (ii) Error absoluto medio (MAE). . El Wavelet Gated Multiformer, que aprovecha los bloques de correlación cruzada, estaba considerablemente por delante de otros transformadores en los pozos W1 y W8. Sin embargo, hemos obtenido un desempeño mixto para los otros seis pozos sin una arquitectura dominante con respecto a las métricas MSE y MAE (Fig. 5).

Bloque de correlación cruzada Wavelet con (a) operaciones internas de capa y entrada de atención propia para (b) consultas y (c) claves (K). Tensor por lotes aleatorio antes y después de la eliminación de ruido con filtro wavelet db4 para consultas (d, e) y claves (f, g), respectivamente. (h) Representar un lote aleatorio para la correlación cruzada QK utilizando un filtro promedio y wavelet db4.

Comparar las predicciones de estas tres arquitecturas tipo transformador también puede arrojar luz sobre sus capacidades. La Figura 6 muestra las predicciones para el pozo W1, con el Wavelet Gated Crossformer proporcionando un mejor rendimiento (MSE y MAE) para una duración de entrada de 180 días y una duración de predicción de 30 días (izquierda) y 60 días (derecha). Sin embargo, la predicción del Transformer queda completamente fuera de la tendencia de la señal y el Autoformer no logra estabilizar la señal sobre la curva. El Wavelet Gated Crossformer ha mostrado una mayor variación, que puede ser inducida por la wavelet Daubechies 4 seleccionada, que proporciona la señal descompuesta en partes de tendencia y estacionales. La Figura 7 muestra las predicciones en el pozo W4, donde el Wavelet Gated Crossformer tuvo el peor desempeño en comparación con los otros transformadores. Sin embargo, Wavelet Gated Crossformer aún captura la tendencia general en su predicción para duraciones de predicción de 30 y 60 días.

Predicciones de 30 y 60 días para el pozo de agua subterránea P1 con (a, d) Wavelet Gated Multiformer, (b, e) Transformer y (c, f) Autoformer con un tamaño de entrada de 180 días, respectivamente.

Predicciones de 30 y 60 días para el pozo de agua subterránea P4 con (a, d) Wavelet Gated Multiformer, (b, e) Transformer y (c, f) Autoformer con un tamaño de entrada de 180 días, respectivamente.

La Figura 4a resalta los esquemas de nuestro codificador, compuesto por N capas paralelas de múltiples subcodificadores. Luego, la salida de cada subcodificador se mezcla mediante una combinación lineal representada por la puerta de mezcla \(\oplus\). Las Figuras 4b-d muestran el subcodificador Wavelet Crossformer de salida, el subcodificador Transformer y el resultado de utilizar información pasada de múltiples subcodificadores a través de Mixing Gate \(\oplus\), respectivamente. Wavelet Crossformer utiliza bloques de descomposición progresiva similares al Autoformer para lidiar con tendencias estacionarias a largo plazo con un filtro wavelet de paso bajo basado en Daubechies 4 para eliminar el ruido de las señales de salida y extraer tendencias a largo plazo. La eliminación de ruido de señales de alta frecuencia ha demostrado ser un paso esencial para la extracción de características dentro de los bloques. Además, Mixing Gate combina la salida de tendencias del Transformer e incorpora información sobre la relación entre puntos dispersos (descubrimiento de dependencias puntuales) de la familia de autoatención50,57 y la agregación de puntos seleccionados por producto escalar, y la acumulación de datos similares. subseries de diferentes épocas a través del bloque de retardo de tiempo (Wavelet Crossformer). La Figura 4d muestra claramente las características ponderadas de ambos subcodificadores después de la puerta de mezcla. 4e, f muestran la señal descompuesta en partes de tendencia cíclica (progresión a largo plazo) y estacional para comprender los patrones temporales. Nuestro codificador propuesto y sus operaciones se detallan en la sección "Métodos".

Nuestro Decodificador se muestra en la Fig. 4g, detallada en la sección "Métodos", que tiene M capas y dos entradas diferentes, una tendencia cíclica y estacional (residual) derivada de la entrada del codificador. En la Fig. 4e, la parte de la tendencia cíclica, se puede ver que la señal tiene una frecuencia más baja (tendencias a largo plazo) en comparación con las señales de la Fig. 4f, donde dominan las oscilaciones rápidas. Nuestro Decodificador también incluye la eliminación de ruido de wavelet a través del Bloque de Descomposición de Wavelet. El decodificador extrae la tendencia de las variables ocultas y permite que el Wavelet Gated Multiformer refine la predicción de la tendencia eliminando el ruido de las señales con filtros wavelet para el reconocimiento de patrones basados ​​en períodos dentro del bloque de autocorrelación Wavelet.

El bloque de correlación cruzada de Wavelet Gated Crosformer mejora significativamente la eliminación del ruido de alta frecuencia, como se ve en la Fig. 5. Antes de una correlación cruzada efectiva, tanto Q como V, como se ve en las Fig. 5b, c, se filtran con Wavelet. Eliminación de ruido de contracción utilizando 4 wavelets de Daubechies con un umbral suave para estimaciones de coeficientes. La figura 5d muestra el efecto del filtrado de ondas en dos lotes aleatorios con muestras de tensor Q. El contenido de ruido de alta frecuencia se elimina de la señal original por debajo de un umbral específico. Se observan los mismos resultados para K en la Fig. 5f. La Figura 5e, g, con la señal en el dominio de la frecuencia, también respalda la mejora de la calidad proporcionada por el filtrado de ondas. Finalmente, en la Fig. 5h se comparan los resultados de la correlación cruzada de QK con y sin eliminación de ruido de ondas, con una atenuación explícita del ruido blanco en la primera. Este proceso proporciona resultados efectivos una vez que estas señales están correlacionadas de forma cruzada y se utilizan mejores estimaciones para los valores TopK en la agregación de retardo de tiempo del componente de valor V.

Los modelos de pronóstico profundo se entrenaron con un conjunto de datos multivariados de lluvia, clima (sensores de presión atmosférica, temperatura y humedad), ríos y registros de pozos que comprende 4 años de medidas diarias continuas de 34 sensores con un total de 49708 puntos de datos. . Hemos calibrado el conjunto de datos con estandarización (media igual a cero y desviación estándar igual a uno). La entrada tiene una longitud de secuencia de 180 y una longitud de predicción de 30 y 60 días. Hemos dividido el conjunto de datos en \(70\%\) para entrenamiento, \(10\%\) para validación y \(20\%\) para fines de prueba. También hemos afinado y ajustado los siguientes parámetros para la validación: (i) longitud de secuencia de entrada de 180, (ii) tamaño de lote de 32, (iii) tamaño de entrada y salida del codificador de 34, y (iv) 15 épocas de entrenamiento . Para cada época, hemos evaluado la función de pérdida relacionada con el entrenamiento, la validación y las pruebas para comprender posibles compensaciones entre sesgo y varianza y problemas de sobreajuste. Además, también hemos utilizado una abandono de 0,05 para mejorar la convergencia. Estos modelos también se entrenaron con la función de pérdida L2, el optimizador ADAM70 con una tasa de aprendizaje de \(10^{ - 4}\) y tamaños de lote de 32 para todos los experimentos. El proceso de entrenamiento se detuvo en 15 épocas. Todos los experimentos se implementaron en PyTorch71 y se ejecutaron en varias GPU individuales, NVIDIA A100, con 40 GB de VRAM cada una. El umbral del hiperparámetro para la wavelet db4 se fijó en 0,5 y el coeficiente de compuerta de mezcla para el Transformer se fijó en 0,4. El Wavelet Gated Multiformer contiene dos capas de codificador con dos subcodificadores en paralelo y una capa de decodificador.

Hemos explorado el MF-DCCHM para descubrir patrones y tendencias cíclicos de orden cero (alrededor de la media) y de primer orden (alrededor del polinomio de primer grado) entre todos los pares de señales en nuestro conjunto de datos. Estos resultados mostraron el comportamiento local y global relacionado con la dependencia para todos los pares de cantidades físicas analizados. El resultado principal se puede verificar en los mapas de calor de las Figs. 2 y 3 con la varianza de atenuación después de filtrar la tendencia, emplear una ventana deslizante y obtener, para todas las escalas, todos los niveles de intensidad relacionados con los coeficientes de correlación. Por lo tanto, el mapa de calor se construyó con mucha más información en comparación con trabajos anteriores1,2. Además, los mapas de calor proporcionaron tendencias estacionales y ciclos de 90 y 180 días, lo que guió nuestra decisión de utilizar modelos de pronóstico profundo con duraciones de predicción de 30 y 60 días. Es fundamental resaltar que la aplicación de filtros wavelet de Daubechies (db4) puede reducir el ruido y aumentar la magnitud de las señales de baja frecuencia para descubrir tendencias cíclicas. También hemos demostrado que el uso de filtros basados ​​en wavelets de paso bajo permite eliminar el ruido de las fluctuaciones y, en el caso del pozo W8, reducir los exponentes multifractales por menos de uno. También hemos encontrado patrones cíclicos de alta correlación cruzada que indican una firma compatible con una anomalía climática. En este caso, el aire puede saturarse con una humedad relativa alta y, a una temperatura particular, el aire no puede retener el contenido de agua, lo que genera nubes y más precipitaciones, también conocido como punto de rocío. Además, también hemos notado un debilitamiento de los coeficientes de correlación cruzada sin tendencia al considerar diferentes ubicaciones. La Figura 2f muestra el MF-DCCHM para temperatura y humedad en las estaciones T1 y H1. El promedio se atenúa para diferentes distancias. Sin embargo, el plazo para los eventos es de aproximadamente 6 meses.

Con respecto al enfoque de pronóstico de modelo profundo de series temporales multivariadas, la Fig. 4 muestra nuestro Wavelet Gated Crossformer propuesto, que aprovecha múltiples subcodificadores con las puertas de mezcla. Nuestro modelo transporta información sobre todos los subcodificadores paralelos y se puede generalizar para múltiples subcodificadores y decodificadores, posiblemente extrapolando las capacidades de cualquier arquitectura tipo transformador. Además, los bloques de descomposición wavelet proporcionan otra ruta para separar señales en partes de tendencia y estacionales, ya que el promedio móvil del Autoformer sufre el efecto de borde al principio y en las partes posteriores de la curva. Además, la eliminación de ruido por contracción de ondas puede superar esta limitación en la captura de señales de tendencia extrayendo coeficientes de ondas asociados con frecuencias más altas. Las arquitecturas propuestas también implementan un nuevo bloque de correlación cruzada Wavelet que emplea wavelets para eliminar el ruido de la señal antes de la correlación cruzada QK interna. La calidad de señal mejorada concatena la correlación cruzada y proporciona mejores estimaciones para la agregación del retardo de tiempo. El Wavelet Gated Multiformer ha proporcionado mejores resultados en dos de los ocho pozos en comparación con el Autoformer y el Transformer, reduciendo el error absoluto medio (MAE) en un 31,26 % en comparación con los modelos tipo transformador de segundo mejor rendimiento evaluados. Sin embargo, al considerar únicamente las predicciones de tendencias, nuestro enfoque captura eficientemente patrones a largo plazo y tiene potencial para su aplicación en otros campos.

El aprendizaje profundo se ha utilizado con éxito para descubrir patrones sutiles y ocultos en datos de series temporales. Se han utilizado modelos de aprendizaje profundo para comprender el flujo de tráfico y la congestión (series de tiempo) y se han mostrado prometedores en el pronóstico de series de tiempo. Los modelos de predicción profunda más recientes pueden superar a los métodos estadísticos para grandes conjuntos de datos multivariados. Los transformadores se utilizan para realizar tareas de procesamiento del lenguaje natural (NLP), con varias arquitecturas para pronósticos a largo plazo, como FEDformer, PatchTST, Informer, Autoformer y Transformer. Nuestro artículo proporciona un nuevo modelo de pronóstico profundo para predecir el nivel del agua subterránea a partir de un conjunto de datos multivariado que incluye datos de lluvia, clima (sensores de presión atmosférica, temperatura y humedad), ríos y pozos y comprende 4 años de medidas diarias continuas de 34 sensores ( o 49708 puntos de datos). Sin embargo, el rendimiento es una limitación clave de Wavelet Gated Multiformer debido a sus estructuras de codificador paralelo y la contracción adicional del ruido de las wavelet. Los trabajos futuros podrían centrarse en los costos computacionales, beneficiarse del nuevo enfoque y explorar combinaciones de diferentes modelos similares a transformadores. Además, las perspectivas de investigación en este campo podrían investigar el potencial del Wavelet Gated Multiformer para el pronóstico de series temporales utilizando puntos de referencia de código abierto como la temperatura del transformador eléctrico (ETT), un indicador crucial en el despliegue de energía eléctrica a largo plazo.

El codificador que se muestra en la Fig. 4 se descompone en dos subcodificadores (Wavelet Crossformer y Transformer) y se mezcla mediante una combinación lineal representada por la puerta de mezcla \(\oplus\) después de N bloques. Dentro del subcodificador Wavelet Crossformer, la parte de tendencia de la señal se descarta en el bloque de descomposición Wavelet, mientras que la parte estacional permanece. La entrada del subcodificador se compone de los pasos de tiempo de entrada I anteriores \(X_{en} \in R^{I,d}\). Sea \(\Omega\) el bloque de correlación de ondas y \(\Gamma\) el bloque de descomposición de ondas, la ecuación general de la l-ésima capa del subcodificador Crossformer se puede expresar de la siguiente manera:

donde \(T_{en}^{l,1}\) representa una señal de tendencia eliminada del Crossformer, \(\chi _{i}^l = S_{en}^{l,2}\) tal que \ (l=\{1,.., N\}\) representa el resultado de la l-ésima capa del subcodificador y \(X_{en}^{0}\) es el \(X_{en}\ incrustado ). El componente estacional después del primer o segundo bloque de descomposición de wavelets en serie \(k=\{1,2\}\) en la l-ésima capa del subcodificador está representado por \(S_{en}^{l,k}\ ).

Por otro lado, en el codificador Transformer, no hay descomposición Wavelet y la señal se considera completamente. Sus ecuaciones tienen las siguientes operaciones:

donde \(\chi _{j}^l = A_{en}^{l,2}\) representa el resultado de la l-ésima capa del Transformador. La operación final en la compuerta de mezcla \(\chi _{en}^l = \chi _{i}^l \oplus \chi _{j}^l\) se puede expresar como:

y \(G_{en}\) es la tendencia de salida del codificador, compuesta por una combinación lineal de subcodificadores paralelos. El modelo no está restringido a solo dos subcodificadores, ya que puede generalizarse para una combinación lineal de múltiples codificadores.

En este modelo, la entrada del decodificador se divide en dos: una parte estacional \(\chi _{des} \in R^{(\frac{I}{2}+O)xd}\) y una parte de tendencia cíclica \ (\chi _{det} \in R^{(\frac{I}{2}+O)xd}\), cada uno de los cuales está formulado por una regla específica. \(\chi _{des}\) es la concatenación de la segunda mitad de la parte estacional de la entrada del codificador con O ceros, y \(\chi _{det}\) son las concatenaciones de la segunda mitad de la tendencia parte de la entrada del codificador con valores O que representan el promedio de la entrada del codificador \(\chi _{en}\). Se puede expresar formalmente como:

donde \(\chi _{ens}, \chi _{ent} \in R^{\frac{I}{2}xd}\) son las partes estacionales y de tendencia de \(\chi _{en}\) , respectivamente, y \(\chi _{0}, \chi _{Mean} \in R^{Oxd}\) representan marcadores de posición llenos de cero y la media de \(\chi _{en}\), respectivamente.

La Figura 4 muestra el decodificador con dos componentes: la tendencia cíclica acumulada a lo largo del decodificador y una parte estacional apilada en una serie de bloques. Hemos introducido la eliminación de ruido de wavelet en el bloque de descomposición de wavelet para reemplazar el bloque de descomposición en serie original de Autoformer. Dentro del decodificador, la información del codificador se integra como K y V en uno de sus bloques de autocorrelación con eliminación de ruido de ondas. El decodificador extrae la tendencia de las variables ocultas y permite que el Wavelet Gated Multiformer refine la predicción de la tendencia eliminando el ruido de las señales con filtros wavelet para el reconocimiento de patrones basados ​​en períodos dentro del bloque de correlación cruzada de Wavelet. El decodificador tiene M capas y recibe entrada \(\chi _{en}^l\) del codificador e información pasada del decodificador, de modo que la l-ésima capa del decodificador puede representarse mediante \(\chi _{de }^l = Decoder(\chi _{de}^{l-1},\chi _{en}^N)\), donde las operaciones internas se pueden describir como:

donde \(\chi _{de}^{l} = S_{de}^{l,3}, l \in \{1,...,M\}\) es la salida de la l-ésima capa de decodificador . \(\chi _{de}^0\) está incrustado de \(\chi _{des}\) y \(T_{de}^0 = \chi _{det}\). Por lo tanto, la salida de predicción del decodificador está representada por la suma de dos componentes descompuestos \(W_{S}*\chi _{de}^{M}+T_{de}^M\), donde \(W_{S}\ ) indica la proyección de los componentes estacionales \(X_{de}^M\) a la dimensión de salida adecuada y M es el número de capas del decodificador. Las variables \(S_{de}^{l,3}\) y \(T_{de}^{l,3}\) caracterizan los componentes estacionales y cíclicos de tendencia para la primera, segunda y tercera serie de wavelets. bloque de descomposición, respectivamente. El \(W_{l,i}\) representa la proyección de la tendencia \(T_{de}^{l,i}\), donde \(i=\{1,2,3\}\) es directamente asociado con el bloque de descomposición en serie de ondas internas del primer, segundo y tercer decodificador.

Las wavelets forman una base en el espacio de funciones cuadradas integrables y, al igual que otros enfoques como las series de Fourier, los polinomios locales, splines y kernels, se pueden utilizar para representar funciones desconocidas. Una ventaja de las wavelets sobre los otros enfoques es que están localizadas en el tiempo, ya que esta propiedad disminuye sustancialmente el costo computacional en la representación de las funciones. Los coeficientes de la Transformada Wavelet (WT) de una señal x(t) se obtienen a partir de la siguiente ecuación:

donde \(\psi (t)\) es la wavelet de raíz continua escalada por un factor a y mapeada con el factor b. La representación continua tiene infinitos coeficientes a y b mapeados a través de la Transformada Wavelet Continua (CWT). Sin embargo, debido al intenso coste computacional, el CWT sólo es factible cuando se consideran señales discretas con coeficientes limitados. En cambio, la mayoría de las aplicaciones utilizan la Transformada Wavelet Discreta (DWT). En DWT, la eficiencia proviene del aumento de los factores a y b basados ​​en la potencia de dos.

Algunos de estos coeficientes wavelet descompuestos corresponden a promedios de señales y otros están asociados con detalles de la señal original. Los coeficientes DWT se filtran con un umbral para eliminar el ruido o recuperar la tendencia parcial. Además, aplicamos una transformada wavelet inversa para restaurar la señal filtrada al dominio del tiempo, un proceso conocido como eliminación de ruido por contracción de wavelet. Basándonos en la metodología desarrollada por Donoho y Johnstone72, hemos empleado un umbral suave para estimar los coeficientes wavelet de la señal de tendencia.

Hemos utilizado la descomposición para agrupar la señal en dos subgrupos que representan un patrón de tendencia larga con baja frecuencia y una parte estacional con mayor frecuencia y más fluctuaciones. A diferencia de Autoformer, que calcula un promedio de una señal acolchada, hemos propuesto el filtro de paso bajo basado en la descomposición de ondas, que elimina la necesidad de rellenos. Para una señal \(\chi \in R^{L xd}\) el proceso de descomposición es:

donde S y T denotan las señales estacionales y cíclicas de tendencia, respectivamente, y el umbral suave72 se emplea para filtrar los coeficientes wavelet de la señal de tendencia. En aras de la simplicidad, los bloques de descomposición se denotaron como \(S, T = \Gamma (\chi )\) en las secciones anteriores.

El bloque de correlación cruzada Wavelet es una extensión del bloque de autocorrelación introducido por la arquitectura Autoformer56. La Figura 5 muestra que, en el bloque de correlación cruzada de wavelets, los componentes Q y K se eliminan mediante la contracción de wavelets antes del cálculo de la autocorrelación. La correlación cruzada se realiza en tres pasos para una mejor eficiencia de cálculo: (i) Transformada Rápida de Fourier, (ii) multiplicación en el dominio de la frecuencia y (iii) una Transformada Rápida de Fourier inversa. El bloque de correlación cruzada Wavelet también descubre dependencias basadas en períodos agregando subseries con el mecanismo de retardo de tiempo. La agregación de retardo de tiempo es responsable de rodar la serie según el retardo de tiempo seleccionado \(\tau _1,...,\tau _n\). Por lo tanto, el bloque alinea subseries similares con una agregación posterior a través de las confianzas normalizadas de softmax. Para una serie X de longitud L y una sola cabeza, podemos sustituir el mecanismo de autoatención considerando que los valores de Q, K y V se obtienen mediante las siguientes operaciones:

donde \(argmax~Topk(\cdot )\) representa los argumentos de las correlaciones cruzadas de Topk, \(R_{Q, K}\) es la correlación cruzada, \(Roll(V,\tau _i)\) representa la operación en la que V se desplaza hacia la izquierda \(\tau _i\), durante la cual los elementos que se desplazan más allá de la primera posición se colocan en la última posición. Además, K, V son del codificador \(X^N_{en}\), que se redimensiona a la longitud O, y Q proviene del bloque anterior del decodificador. Además, el cabezal múltiple incluiría \(Q_i,\), \(K_i,\) y \(V_i\), para \(i=\{1,...,h\}\), donde h representa el número de cabezas. La i-ésima cabeza contiene \(Q_i, K_i,V_i \in R^{\frac{d_{model}}{h}}\), donde \(d_{model}\) representa los canales.

Los mapas de calor de correlación cruzada sin tendencia multifractal se calcularon estrictamente según Paulo et al.62. El procedimiento consiste en obtener primero la correlación de largo plazo mediante el Análisis de Fluctuación Sin Tendencia (DFA)69,73. Además, hemos estimado el Análisis de correlación cruzada sin tendencia (DCCA)74 para memorias de correlación cruzada de largo alcance. Finalmente, calculamos el promedio de las fluctuaciones \(F_X^2\) para todas las m-ésimas cajas deslizantes con diferentes tamaños v en toda la serie, de modo que:

\(f_X^2(m,v)\) representa la varianza y covarianza de las fluctuaciones, \(M_v\) es el número de ventanas dentro de toda la serie y X caracteriza los métodos DFA y DCCA.

La varianza y covarianza calculadas se pueden caracterizar mediante una ley de potencia \(F_X \approx v^{\alpha }\) donde v representa el tamaño de la caja. El factor de escala \(\alpha\) se obtuvo mediante linealización \(\log (F_X) X \log (v)\), donde \(\alpha = \lambda\) corresponde a la correlación cruzada. Por lo tanto, podemos clasificar patrones antipersistentes y persistentes según el factor de escala multifractal \(\alpha\). La tendencia puede revertirse en breve para \(0<\alpha <0.5\). Sin embargo, el ruido blanco podría afectar la serie integrada y proporcionar 0 correlaciones cruzadas para \(\alpha = 0,5\). La señal integrada continúa la tendencia anterior para \(0,5< \alpha <1,0\).

El mapeo final cuantifica la correlación cruzada de un par de señales no estacionarias75 a través de sus coeficientes en regímenes multifractales. Calculamos el coeficiente de correlación cruzada (CCC) de la siguiente manera:

donde \(i=\{0,1\}\), y \(\sigma _{DCCA_i}(v,t)\) varía en el intervalo \(-1 \le \sigma _{DCCA_i} \le 1 \). Los valores de \(\sigma _{DCCA_i}=\{1,0,-1\}\) representan correlación cruzada máxima, sin correlación cruzada y anticorrelación cruzada. Este método permite observar patrones cíclicos potenciales para diferentes escalas y regímenes multifractales en un mapa y su consistencia. El muestreo promedio de DCCA en todas las ventanas posibles de tamaño v se muestra en la parte superior del mapa de calor de correlación cruzada.

Los conjuntos de datos generados y/o analizados durante el estudio actual están disponibles del autor correspondiente a solicitud razonable.

Famiglietti, JS La crisis mundial de las aguas subterráneas. Nat. Subir. Chang. 4, 945–948 (2014).

ADS del artículo Google Scholar

Postel, SL, Daily, GC & Ehrlich, PR Apropiación humana del agua dulce renovable. Ciencia 271, 785–788 (1996).

Artículo ADS CAS Google Scholar

Giordano, M. ¿Aguas subterráneas globales? Problemas y soluciones. Año. Rev. Medio Ambiente. Recurso. 34, 153-178 (2009).

Artículo de Google Scholar

Siebert, S. y col. Uso de aguas subterráneas para riego: un inventario global. Hidrol. Sistema Tierra. Ciencia. 14, 1863–1880 (2010).

ADS del artículo Google Scholar

Oki, T. & Kanae, S. Ciclos hidrológicos globales y recursos hídricos mundiales. Ciencia 313, 1068–1072 (2006).

Artículo ADS CAS PubMed Google Scholar

Alcamo, J. et al. Estimaciones globales de extracciones y disponibilidad de agua en condiciones actuales y futuras "sin cambios". Hidrol. Ciencia. J. 48, 339–348 (2003).

Artículo de Google Scholar

Gleeson, T., Wada, Y., Bierkens, MF y Van Beek, LP Balance hídrico de los acuíferos globales revelado por la huella hídrica subterránea. Naturaleza 488, 197–200 (2012).

Artículo ADS CAS PubMed Google Scholar

Gleeson, T., Befus, KM, Jasechko, S., Luijendijk, E. & Cardenas, MB El volumen global y la distribución del agua subterránea moderna. Nat. Geociencias. 9, 161-167 (2016).

Artículo ADS CAS Google Scholar

Wada, Y. et al. Agotamiento global de los recursos de aguas subterráneas. Geofís. Res. Lett.https://doi.org/10.1029/2010GL044571 (2010).

Artículo de Google Scholar

Qadir, M., Sharma, BR, Bruggeman, A., Choukr-Allah, R. & Karajeh, F. Recursos hídricos no convencionales y oportunidades para el aumento del agua para lograr la seguridad alimentaria en países con escasez de agua. Agrícola. Gestión del agua. 87, 2-22 (2007).

Artículo de Google Scholar

Scanlon, BR y cols. Recursos hídricos globales y el papel de las aguas subterráneas en un futuro hídrico resiliente. Nat. Rev. Medio Ambiente Tierra. 4, 87 (2023).

ADS del artículo Google Scholar

Schipanski, ME y cols. Pasar de la medición a la gobernanza de los recursos compartidos de aguas subterráneas. Nat. Agua 1, 30–36 (2023).

Artículo de Google Scholar

Dudley, R., Hodgkins, G., Nielsen, M. & Qi, S. Estimación de niveles históricos de agua subterránea basados ​​en relaciones con variables hidrológicas y meteorológicas en el sistema acuífero glacial de EE. UU. J. hidrol. 562, 530–543 (2018).

ADS del artículo Google Scholar

Sahoo, S., Russo, T., Elliott, J. y Foster, I. Algoritmos de aprendizaje automático para modelar cambios en el nivel del agua subterránea en regiones agrícolas de EE. UU. Recurso Acuático. Res. 53, 3878–3895 (2017).

ADS del artículo Google Scholar

Izady, A. et al. Un marco para el desarrollo de un modelo conceptual de aguas subterráneas. Árabe. J. Geosci. 7, 3611–3631 (2014).

Artículo de Google Scholar

Omar, PJ, Gaur, S., Dwivedi, S. y Dikshit, P. Modelado de aguas subterráneas utilizando un método de elementos analíticos y un método de diferencias finitas: una visión de la cuenca baja del río Ganges. J. Sistema de Tierra. Ciencia. 128, 1-10 (2019).

Artículo de Google Scholar

Ukpaka, C., Adaobi, SN-A. & Ukpaka, C. Desarrollo y evaluación de parámetros de aguas subterráneas trans-amadi: la integración de técnicas de elementos finitos. Química. En t. 3, 306 (2017).

CAS Google Académico

Pathania, T., Bottacin-Busolin, A., Rastogi, A. y Eldho, T. Simulación del flujo de agua subterránea en un acuífero inclinado no confinado utilizando el método Galerkin libre de elementos. Recurso Acuático. Gestionar. 33, 2827–2845 (2019).

Artículo de Google Scholar

Brenner, S., Coxon, G., Howden, Nueva Jersey, Freer, J. y Hartmann, A. Modelado basado en procesos para evaluar niveles y frecuencias de agua subterránea simulados en una cuenca de tiza en el suroeste de Inglaterra. Nat. Peligro 18, 445–461 (2018).

Artículo de Google Scholar

Chen, J. y col. Una arquitectura de red neuronal en tándem mejorada para el modelado inverso del transporte reactivo multicomponente en medios porosos. Recurso Acuático. Res. 57, e2021WR030595 (2021).

ADS del artículo Google Scholar

Cerqueira, V., Torgo, L. & Soares, C. Aprendizaje automático versus métodos estadísticos para el pronóstico de series temporales: el tamaño importa. Preimpresión de arXiv arXiv:1909.13316 (2019).

Bai, T. & Tahmasebi, P. Acelerar el modelado geoestadístico mediante el aprendizaje automático basado en geoestadísticas. Computadora. Geociencias. 146, 104663 (2021).

Artículo de Google Scholar

Jiang, Z., Tahmasebi, P. & Mao, Z. Redes neuronales de convolución u-net residual profunda con estrategia autorregresiva para predicciones de flujo de fluidos en geosistemas a gran escala. Adv. Recurso Acuático. 150, 103878 (2021).

Artículo de Google Scholar

Rasp, S., Pritchard, MS y Gentine, P. Aprendizaje profundo para representar procesos de subred en modelos climáticos. Proc. Nacional. Acad. Ciencia. 115, 9684–9689 (2018).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Bai, T. y Tahmasebi, P. Caracterización de la contaminación de las aguas subterráneas: un modelo de aprendizaje profundo basado en transformadores. Adv. Recurso Acuático. 164, 104217 (2022).

Artículo CAS Google Scholar

Kamrava, S., Sahimi, M. y Tahmasebi, P. Simulación del flujo de fluidos en materiales porosos complejos integrando las ecuaciones rectoras con máquinas de capas profundas. npj Computación. Madre. 7, 127 (2021).

ADS del artículo Google Scholar

Raissi, M., Perdikaris, P. y Karniadakis, GE Redes neuronales basadas en física: un marco de aprendizaje profundo para resolver problemas directos e inversos que involucran ecuaciones diferenciales parciales no lineales. J. Computación. Física. 378, 686–707 (2019).

Artículo ADS MathSciNet MATH Google Scholar

Jeihouni, E., Eslamian, S., Mohammadi, M. & Zareian, MJ Simulación de fluctuaciones del nivel del agua subterránea en respuesta a los principales parámetros climáticos utilizando una técnica híbrida wavelet-ann para la llanura de Shabestar, Irán. Reinar. Ciencia de la Tierra. 78, 293 (2019).

ADS del artículo Google Scholar

Daliakopoulos, IN, Coulibaly, P. & Tsanis, IK Predicción del nivel del agua subterránea mediante redes neuronales artificiales. J. hidrol. 309, 229–240 (2005).

ADS del artículo Google Scholar

Sadat-Noori, M., Glamore, W. y Khojasteh, D. Predicción del nivel del agua subterránea mediante programación genética: la importancia de los datos de precipitación y la ubicación de la estación meteorológica en la precisión del modelo. Reinar. Ciencia de la Tierra. 79, 1-10 (2020).

Artículo de Google Scholar

Kasiviswanathan, K., Saravanan, S., Balamurugan, M. & Saravanan, K. Modelos mensuales de pronóstico del nivel de agua subterránea basados ​​en programación genética con cuantificación de incertidumbre. Modelo. Sistema Tierra. Reinar. 2, 1-11 (2016).

Artículo de Google Scholar

Ebrahimi, H. & Rajaee, T. Simulación de variaciones del nivel del agua subterránea utilizando wavelets combinados con redes neuronales, regresión lineal y máquina de vectores de soporte. Planeta global. Cambio 148, 181–191 (2017).

ADS del artículo Google Scholar

Liu, J., Chang, J.-x. y Zhang, W.-g. Predicción dinámica del nivel freático basada en optimización del caos y máquina de vectores de soporte. En: Tercera Conferencia Internacional de 2009 sobre informática genética y evolutiva, 39–43 (IEEE, 2009).

Tang, Y., Zang, C., Wei, Y. y Jiang, M. Modelado basado en datos del nivel del agua subterránea con máquina de vectores de soporte de mínimos cuadrados y análisis espacio-temporal. Geotecnología. Geol. Ing. 37, 1661-1670 (2019).

Artículo de Google Scholar

Wunsch, A., Liesch, T. & Broda, S. Pronóstico del nivel del agua subterránea con redes neuronales artificiales: una comparación de memoria a corto plazo (lstm), redes neuronales convolucionales (cnns) y redes autorregresivas no lineales con entrada exógena (narx). Hidrol. Sistema Tierra. Ciencia. 25, 1671–1687 (2021).

ADS del artículo Google Scholar

Zhang, X., Dong, F., Chen, G. y Dai, Z. Predicción avanzada de los niveles de aguas subterráneas costeras con redes de memoria temporal convolucional y de largo plazo. Hidrol. Sistema Tierra. Ciencia. 27, 83–96 (2023).

ADS del artículo Google Scholar

Cai, H., Shi, H., Liu, S. y Babovic, V. Impactos de las características regionales en la mejora de la precisión de la predicción del nivel del agua subterránea mediante el aprendizaje automático: el caso de los Estados Unidos continentales del centro y este. J. hidrol. Reg. Semental. 37, 100930 (2021).

Artículo de Google Scholar

Vu, M., Jardani, A., Massei, N. y Fournier, M. Reconstrucción de datos faltantes sobre el nivel del agua subterránea mediante el uso de una red neuronal profunda de memoria a corto plazo (lstm). J. hidrol. 597, 125776 (2021).

Artículo de Google Scholar

Jeong, J. y col. Estimación del nivel del agua subterránea basada en el entrenamiento robusto de redes neuronales recurrentes utilizando datos corruptos. J. hidrol. 582, 124512 (2020).

Artículo de Google Scholar

Bai, T. y Tahmasebi, P. Red neuronal gráfica para la predicción del nivel de las aguas subterráneas. J. hidrol. 616, 128792 (2023).

Artículo de Google Scholar

Wu, Z., Pan, S., Long, G., Jiang, J. y Zhang, C. Graph wavenet para modelado de gráficos espacio-temporales profundos. Preimpresión de arXiv arXiv:1906.00121 (2019).

Shaikh, AK, Nazir, A., Khan, I. y Shah, AS Previsión del consumo de energía a corto plazo utilizando análisis de expansión de bases neuronales para series temporales interpretables. Ciencia. Rep. 12, 22562 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Jozefowicz, R., Vinyals, O., Schuster, M., Shazeer, N. y Wu, Y. Explorando los límites del modelado del lenguaje. Preimpresión de arXiv arXiv:1602.02410 (2016).

Wu, Y. et al. El sistema de traducción automática neuronal de Google: cerrando la brecha entre la traducción humana y la automática. Preimpresión de arXiv arXiv:1609.08144 (2016).

Vaswani, A. y col. Atención es todo lo que necesitas. Avances en los sistemas de procesamiento de información neuronal30 (2017).

Devlin, J., Chang, M.-W., Lee, K. y Toutanova, K. Bert: Entrenamiento previo de transformadores bidireccionales profundos para la comprensión del lenguaje. Preimpresión de arXiv arXiv:1810.04805 (2018).

Luong, M.-T., Pham, H. & Manning, CD Enfoques eficaces para la traducción automática neuronal basada en la atención. Preimpresión de arXiv arXiv:1508.04025 (2015).

Han, K. y col. Una encuesta sobre el transformador de visión. Traducción IEEE. Patrón Anal. Mach. Intel. 45, 87-110 (2022).

Artículo PubMed Google Scholar

Wen, Q. y col. Transformadores en series de tiempo: una encuesta. Preimpresión de arXiv arXiv:2202.07125 (2022).

Li, S. y col. Mejorar la localidad y romper el cuello de botella de la memoria del transformador en el pronóstico de series temporales. EnAvances en sistemas de procesamiento de información neuronal32 (2019).

Xu, J., Wu, H., Wang, J. y Long, M. Transformador de anomalías: detección de anomalías en series temporales con discrepancia de asociación. Preimpresión de arXiv arXiv:2110.02642 (2021).

Tuli, S., Casale, G. & Jennings, NR Tranad: Redes de transformadores profundos para la detección de anomalías en datos de series temporales multivariadas. Preimpresión de arXiv arXiv:2201.07284 (2022).

Zerveas, G., Jayaraman, S., Patel, D., Bhamidipaty, A. y Eickhoff, C. Un marco basado en transformadores para el aprendizaje de representación de series temporales multivariadas. En actas de la 27ª Conferencia ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos, 2114-2124 (2021).

Wen, Q. y col. Robuststl: Un algoritmo robusto de descomposición de tendencias estacionales para series temporales largas. Proc. Conferencia AAAI. Artif. Intel. 33, 5409–5416 (2019).

Google Académico

Wen, Q. y col. Aumento de datos de series temporales para el aprendizaje profundo: una encuesta. Preimpresión de arXiv arXiv:2002.12478 (2020).

Wu, H., Xu, J., Wang, J. & Long, M. Autoformer: Transformadores de descomposición con autocorrelación para pronósticos de series a largo plazo. Adv. Neural. inf. Proceso. Sistema. 34, 22419–22430 (2021).

Google Académico

Zhou, H. y col. Informador: Más allá de un transformador eficiente para el pronóstico de series temporales de secuencia larga. Proc. Conferencia AAAI. Artif. Intel. 35, 11106–11115 (2021).

Google Académico

Zhou, T. y col. Fedformer: Transformador descompuesto de frecuencia mejorada para pronósticos de series a largo plazo. En Conferencia internacional sobre aprendizaje automático, 27268–27286 (PMLR, 2022).

Aslam, F. y col. Correlaciones cruzadas entre la incertidumbre de la política económica y los metales preciosos e industriales: un análisis de correlación cruzada multifractal. Recurso. Política 75, 102473 (2022).

Artículo de Google Scholar

Rahmani, F. & Fattahi, MH Una investigación de correlación cruzada multifractal sobre la sensibilidad y dependencia de las sequías meteorológicas e hidrológicas de la precipitación y la temperatura. Nat. Peligros 109, 2197–2219 (2021).

Artículo de Google Scholar

Guo, Y., Shi, F., Yu, Z., Yao, S. y Zhang, H. Multifractalidad asimétrica en el mercado energético de China basada en un análisis mejorado de correlación cruzada multifractal asimétrica. Física. A 594, 127027 (2022).

Artículo de Google Scholar

de Melo Barros, PRJ Mapas de calor de correlación cruzada sin tendencia multifractal para análisis de series de tiempo. Ciencia. Rep. 12, 21655 (2022).

ADS del artículo Google Scholar

Red integrada de seguimiento de aguas subterráneas RIMAS. https://rimasweb.cprm.gov.br.

Red hidrometeorológica nacional (RHN). www.snirh.gov.br/hidroweb.

Instituto nacional de meteorología INMET. https://mapas.inmet.gov.br.

Lenguaje de programación Python Python. https://www.python.org.

Matplotlib: visualización con Python Matplotlib. https://inkscape.org.

Editor de gráficos vectoriales Inkscape Inkscape. https://inkscape.org.

Hu, K., Ivanov, PC, Chen, Z., Carpena, P. & Stanley, HE Efecto de las tendencias en el análisis de fluctuaciones sin tendencia. Física. Rev.E 64, 011114 (2001).

Artículo ADS CAS Google Scholar

Kingma, DP & Ba, J. Adam: Un método de optimización estocástica. Preimpresión de arXiv arXiv:1412.6980 (2014).

Paszke, A. et al. Pytorch: una biblioteca de aprendizaje profundo de alto rendimiento y estilo imperativo. Avances en los sistemas de procesamiento de información neuronal32 (2019).

Donoho, DL y Johnstone, JM Adaptación espacial ideal mediante contracción de ondas. Biometrika 81, 425–455 (1994).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Peng, C.-K. et al. Organización mosaico de los nucleótidos del ADN. Física. Rev. E 49, 1685 (1994).

Artículo ADS CAS Google Scholar

Podobnik, B. & Stanley, HE Análisis de correlación cruzada sin tendencia: un nuevo método para analizar dos series temporales no estacionarias. Física. Rev. Lett. 100, 084102 (2008).

Artículo ADS PubMed Google Scholar

Marinho, E., Bassrei, A. & Andrade, RF Metodología extendida para DFA y DCCA: Aplicación de procedimiento de búsqueda automática y mapa de correlación a las funciones de Weierstrass-Mandelbrot. Anais da Academia Brasileira de Ciênciashttps://doi.org/10.1590/0001-3765202120200859 (2021).

Artículo PubMed Google Scholar

ArcgisArcGIS https://www.arcgis.com.

Geosgb - sistema de geociencias del servicio geológico de brasil - cprm GeoSGB. https://geosgb.cprm.gov.br.

Descargar referencias

Con el apoyo de la Fundación Carl Tryggers y VFN (Verifiering för Nyttiggörande beslutar) de la Universidad de Linköpings con el proyecto titulado Inteligencia artificial para la física y la ingeniería: modelado y simulación. Los cálculos se realizaron con recursos proporcionados por la Infraestructura Nacional Sueca de Computación (SNIC), Proyecto SNIC 2022/22-843, en el Centro Nacional de Supercomputación de la Universidad de Linköping (Tetralith) y el Centro Chalmers de Ciencias e Ingeniería Computacional (C3SE) (Alvis ).

Financiamiento de acceso abierto proporcionado por la Universidad de Linköping.

Estos autores contribuyeron por igual: Vitor Hugo Serravalle Reis Rodrigues, Paulo Roberto de Melo Barros Jr., Euler Bentes dos Santos Marinho y José Luis Lima de Jesús Silva.

Servicio Geológico de Brasil - SGB, Avenida Ulysses Guimarães, 2862 Centro Administrativo da Bahia, Salvador, BA, 1649-026, Brasil

Vitor Hugo Serravalle Reis Rodrigues

Petrobras, Petróleo Brasileiro SA, Av. República de Chile, No 65 Centros, Río de Janeiro, 20031-912, Brasil

Paulo Roberto de Melo Barros Junior

Centro de Investigaciones en Geofísica y Geociencias, Universidad Federal de Bahía, Rua Barão de Jeremoabo, Ondina, Salvador, BA, 40210-630, Brasil

Euler Bentes dos Santos Marinho

División de Inteligencia Artificial y Sistemas Informáticos Integrados, Departamento de Informática y Ciencias de la Información, Universidad de Linköping, SE-581 83, Linköping, Suecia

Jose Luis Lima de Jesus Silva

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Todos los autores contribuyeron por igual a las ideas, el diseño y la ejecución del estudio. Todos los autores revisaron el manuscrito.

Correspondence to Jose Luis Lima de Jesus Silva.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Serravalle Reis Rodrigues, VH, de Melo Barros Junior, PR, dos Santos Marinho, EB et al. Multiformador controlado por wavelets para el pronóstico de series temporales de aguas subterráneas. Informe científico 13, 12726 (2023). https://doi.org/10.1038/s41598-023-39688-0

Descargar cita

Recibido: 07 de marzo de 2023

Aceptado: 29 de julio de 2023

Publicado: 05 de agosto de 2023

DOI: https://doi.org/10.1038/s41598-023-39688-0

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.