Jun 08, 2023
Tiempo
Scientific Reports volumen 13, número de artículo: 14175 (2023) Cite este artículo 1 Detalles de Altmetric Metrics Los registradores de acceso rápido (QAR) proporcionan una importante fuente de datos para la calidad de las operaciones de vuelo
Scientific Reports volumen 13, número de artículo: 14175 (2023) Citar este artículo
1 altmétrica
Detalles de métricas
Los registradores de acceso rápido (QAR) proporcionan una importante fuente de datos para la garantía de calidad de las operaciones de vuelo (FOQA) y la seguridad del vuelo. Generalmente se caracteriza por un gran volumen, alta dimensionalidad y alta frecuencia, y estas características resultan en complejidades e incertidumbres extremas en su uso y comprensión. En este estudio, propusimos un modelo de red de codificador automático convolucional (TFA-CAE) basado en atención de características de tiempo (TFA) para extraer características de vuelo esenciales de los datos QAR. Como estudio de caso, utilizamos los datos QAR del aterrizaje en el Aeropuerto Internacional Kunming Changshui y el Aeropuerto Internacional Lhasa Gonggar como datos experimentales. Los resultados muestran que (1) el modelo TFA-CAE funciona mejor en la extracción de características de vuelo representativas en comparación con algunos enfoques tradicionales o similares, como el Análisis de Componentes Principales (PCA), el Codificador Automático Convolucional (CAE), el Auto-Atención- modelos basados en CAE (SA-CAE), codificador automático basado en unidad recurrente de puerta (GRU-AE) y TFA-GRU-AE; (2) se puedan reconocer patrones de vuelo correspondientes a diferentes pistas; y (3) los vuelos anómalos pueden desviarse efectivamente de muchas observaciones. En general, el modelo TFA-CAE proporciona una técnica bien establecida para un mayor uso de datos QAR, como la detección de riesgo de vuelo o FOQA.
La aviación civil se esfuerza constantemente por mejorar la seguridad de los vuelos. Para cambiar la naturaleza propensa a los accidentes de la aviación civil china y mejorar la seguridad de los vuelos, la Administración de Aviación Civil de China (CAAC) decidió en 1997 hacer obligatorio el proyecto de control de la calidad de los vuelos para todas las aerolíneas de transporte. El 1 de enero de 1998, todos los aviones de transporte matriculados en China debían instalar un registrador de acceso rápido (QAR) o equipo equivalente para registrar el estado de vuelo de todos los aviones durante los vuelos. Los datos de vuelo registrados por los QAR se utilizan para monitorear las operaciones de vuelo, el desempeño de las aeronaves, etc., para detectar vuelos defectuosos que se desvían de los procedimientos de vuelo estándar. Además, se analizan las causas de los vuelos defectuosos y luego se abordan mediante el desarrollo de medidas de orientación mejoradas correspondientes, lo que da como resultado nuevas mejoras en la calidad de los vuelos. A finales de 2013, la CAAC aprobó el proyecto de construcción de la estación base de monitoreo de calidad de vuelo para recopilar, procesar y analizar todos los datos QAR de las aeronaves en China. A finales de 2017, la estación base había recopilado datos QAR de más de 3.000 aviones de las 51 compañías aéreas de transporte de la categoría de aviación civil de China. En esta estación base se recopila continuamente una gran cantidad de datos de vuelo, lo que proporciona una base de datos completa para estudiar los riesgos de vuelo, así como los métodos basados en datos.
Los datos de transmisión automática de vigilancia dependiente (ADS-B) son otro tipo de datos de vuelo y también se utilizan para monitorear la calidad del vuelo, como la hora de aterrizaje de la aeronave1 y la estimación de la hora de llegada de la aeronave2,3. Los datos ADS-B tienen una buena puntualidad en comparación con los datos QAR, pero solo se registra un número limitado de parámetros de vuelo (alrededor de 40 parámetros de vuelo), lo que los hace insuficientes para su uso en escenarios de aplicaciones complejos. En comparación con los datos ADS-B, los datos QAR suelen incluir datos de alta dimensión y alta frecuencia para registrar detalles de un vuelo, incluidos el tiempo, la posición, las operaciones de vuelo, la actitud de vuelo, la dinámica de vuelo y el entorno externo (hasta 2000 vuelos). parámetros). Los parámetros de vuelo registrados reflejan el estado del sistema de la aeronave. Por ejemplo, un valor excesivo del parámetro de vuelo AOA (ángulo de ataque) puede sugerir riesgos potenciales de pérdida de la aeronave, mientras que el parámetro de vuelo VRTG (aceleración normal) se utiliza normalmente para indicar un aterrizaje brusco cuando una aeronave toca el suelo. Por lo tanto, los datos QAR se pueden utilizar para monitorear y detectar diversos eventos de vuelo. Sin embargo, estas características dan lugar a complejidades e incertidumbres extremas en su uso y comprensión. La extracción de características, como tema típico de minería de datos, proporciona un medio técnico para resolver la maldición dimensional4. Desempeña un papel clave en muchas aplicaciones, como clasificación5, regresión6 y minería de datos7,8, y también es una base previa en el diagnóstico de fallas que se centra en la extracción de características de fallas9,10,11,12.
El Análisis de Componentes Principales (PCA), mediante el cual los datos brutos se proyectan en sus dimensiones principales de acuerdo con las varianzas-covarianzas de las muestras originales13, es el método no supervisado más comúnmente utilizado para la extracción de características14,15. El Análisis Discriminante Lineal (LDA) y su variante, el Análisis Marginal de Fisher (MFA), son dos métodos supervisados de extracción de características, entre los cuales LDA encuentra un subespacio lineal útil optimizando los datos de clases discriminantes16 y MFA caracteriza la separabilidad entre clases y la compacidad intraclase de los datos dados. para obtener la proyección óptima17. Todos los métodos de extracción de características anteriores tienen el mismo inconveniente: todas las proyecciones son transformaciones lineales. Aunque otros estudios18,19,20 han intentado resolver este problema utilizando funciones kernel no lineales, las características extraídas por los enfoques desarrollados pueden no cubrir toda la información útil de los datos brutos de entrada, ya que existen diversas correlaciones no lineales en los datos industriales complejos21.
Con el desarrollo continuo de las redes neuronales artificiales (RNA), se han convertido en tecnologías poderosas para aproximar funciones complicadas y han logrado un gran éxito en diversas aplicaciones industriales. Un codificador automático (AE), que contiene un codificador y un decodificador, es un modelo ANN especial que extrae características minimizando el error de reconstrucción de forma no supervisada. Los datos de entrada originales primero se asignan a un espacio de representación de baja dimensión para obtener las características más apropiadas; Luego, el decodificador asigna las características en el espacio de representación de baja dimensión al espacio de entrada. El error de pérdida entre la entrada original del codificador y la salida del decodificador se utiliza como error de pérdida para entrenar el modelo resultante. La Figura 1 muestra una representación gráfica del modelo de red del codificador automático.
La representación pictórica de un modelo de red de codificador automático.
Los EA y sus variantes22,23,24 se han aplicado en diversos campos, como el diagnóstico de fallos25,26, las redes inteligentes27 y el procesamiento del lenguaje natural (PLN)28. Sin embargo, las características extraídas por el EA tradicional pueden no satisfacer la tarea de discriminación final29. Para datos de series de tiempo de múltiples características, el AE tradicional asigna directamente la entrada original para aprender características, pero este proceso ignora las relaciones entre tiempos y entre características. Además, los métodos de extracción de características desarrollados previamente no se basan en los requisitos de aplicaciones específicas, lo que da como resultado características extraídas que no son aplicables a tareas de aplicaciones realistas. En este artículo, se desarrolla un módulo Time Feature Attention (TFA) para capturar la relación interna entre diferentes momentos de vuelo, así como la relación interna entre diferentes parámetros de vuelo. Sobre esta base, se propone un AE convolucional basado en TFA (TFA-CAE) para realizar la extracción de características de datos de series de tiempo de vuelo QAR. El resto de este documento está organizado de la siguiente manera. La metodología utilizada en nuestra investigación se presenta en la sección "Datos y metodología", donde los detalles de TFA y TFA-CAE se describen en las secciones "Módulo TFA" y "Modelo TFA-CAE para extracción de características QAR", respectivamente. La sección "Estudio de caso" presenta los resultados experimentales de un estudio de caso. Este estudio se resume en la sección "Conclusión y discusión".
Durante el vuelo, las aeronaves generalmente se ven influenciadas por diversos tipos de factores, como el entorno meteorológico externo (velocidad y dirección del viento, temperatura y presión atmosférica, etc.), las condiciones de la propia aeronave (estado del motor, ajustes de control de vuelo, etc.). .), competencias y técnicas de pilotaje. Los complejos impactos de estos factores en la aeronave son constantes y fluctúan a lo largo del vuelo30. Aunque estos factores siempre cambian, sus impactos en la aeronave eventualmente se transforman en cambios en los parámetros cinemáticos y de actitud de vuelo de la aeronave31. Por lo tanto, seleccionamos los parámetros de actitud y vuelo cinemático para realizar la extracción de características. Los detalles de los parámetros de vuelo utilizados en este artículo se muestran en la Tabla 1.
La Figura 2 muestra los accidentes fatales y las muertes a bordo en cada fase de vuelo de 2008 a 201732. De los resultados estadísticos, podemos ver que la fase de aterrizaje ocupó solo el 1% del tiempo total de vuelo pero arrojó altos porcentajes de accidentes fatales y muertes a bordo ( hasta un 24% y un 20%, respectivamente). Por lo tanto, la fase de aterrizaje es el tema central de este artículo.
Porcentajes de accidentes mortales y víctimas mortales a bordo por fase del vuelo de 2008 a 201732.
La fase de vuelo de estudio específica en la que se centró nuestra investigación se ilustra en la Fig. 3. Dado que las fases de aterrizaje ocupan aproximadamente 90 s de duración, como se muestra en la Fig. 2, se utiliza una duración de muestra de 90 s en esta fase de vuelo. Específicamente, comenzamos el muestreo 90 s antes del punto de aterrizaje y finalizamos el muestreo en el punto de aterrizaje. Para cada momento de muestreo, los valores muestreados son todos los parámetros de vuelo que se muestran en la Tabla 1.
Diagrama esquemático del proceso de muestreo de datos durante las fases de aterrizaje.
La función del mecanismo de atención ha sido ampliamente demostrada en muchos estudios previos33,34,35,36,37,38,39,40. El mecanismo de atención, por un lado, ayuda al modelo a conocer los lugares clave en los que centrarse y, por otro lado, potencia el valor representacional de los intereses40. Para una serie de datos de tiempo QAR determinada en este artículo, nuestro objetivo es especificar cuándo (el tiempo clave de los datos QAR) y en qué (los parámetros de vuelo clave de los datos QAR) centrarse y mejorar simultáneamente sus valores representacionales correspondientes con el Empleo de un mecanismo de atención. En este artículo, proponemos un módulo TFA para explotar tanto el tiempo como la atención de funciones basándose en una arquitectura eficiente.
El módulo TFA contiene dos submódulos, el módulo de atención de tiempo (TAM) y el módulo de atención de funciones (FAM), que se colocan juntos en orden secuencial. Dada una serie temporal QAR original \(S\in {\mathbb{R}}^{F\times T}\), un mapa de atención temporal unidimensional \({A}_{t}\in {\mathbb{ R}}^{1\times T}\) es producido primero por TAM y luego se multiplica por \(S\in {\mathbb{R}}^{F\times T}\) para generar los datos refinados en el tiempo. \({S}^{\prime}\in {\mathbb{R}}^{F\times T}\). Inmediatamente después, el FAM toma datos refinados en el tiempo \({S}^{\prime}\in {\mathbb{R}}^{F\times T}\) como entrada e infiere un mapa de atención de características unidimensional \({A}_{f}\in {\mathbb{R}}^{F\times 1}\), que se multiplica inmediatamente por \({S}^{\prime}\in {\mathbb{R }}^{F\times T}\) para obtener los datos refinados finales \(S^{\prime\prime}\in {\mathbb{R}}^{F\times T}\). La Figura 4 ilustra el proceso de cálculo general del módulo TFA, que se puede resumir de la siguiente manera:
donde \(\odot \) representa el producto de Hadamard. Durante la multiplicación, los valores de atención de tiempo se transmiten a lo largo de la dirección de la dimensión de los parámetros de vuelo, mientras que los valores de atención de características se transmiten a lo largo de la dirección de la dimensión de tiempo. Las figuras 5 y 6 muestran descripciones generales del módulo de atención de tiempo y del módulo de atención de características, respectivamente. En el resto de esta sección, cubriremos los detalles de estos dos módulos.
Descripción general del módulo TFA.
Descripción general del módulo de atención del tiempo.
Descripción general del módulo de atención de funciones.
(1) Módulo de atención de tiempo (TAM): la función del módulo de atención de tiempo es resaltar los momentos importantes de los datos de series de tiempo QAR y suprimir los momentos innecesarios. Dentro del módulo de atención temporal, esto se logra aumentando el peso de representación de los momentos de vuelo importantes y al mismo tiempo disminuyendo el peso de representación de los innecesarios. Para producir el mapa de atención, explotamos la relación entre los diferentes momentos de vuelo de los datos QAR. Como cada punto temporal de los datos QAR se considera un detector de tiempo, la atención temporal se centra en los puntos temporales que son significativos ("cuándo") dados los datos QAR de entrada. El tiempo de atención se calcula recopilando y comprimiendo la información de la dimensión característica de los datos QAR. Para esto, se propone un módulo de red, a saber, Lista de Perceptrones de Tiempo (TPL), para agregar la información de características, como se muestra en la Fig. 5. El proceso de operación detallado del módulo de atención se describe a continuación.
Dados los datos QAR originales \(S\in {\mathbb{R}}^{F\times T}\) como entrada, TAM primero usa el módulo TPL para agregar la información de la dimensión de característica de \(S\in {\ mathbb{R}}^{F\times T}\), generando un descriptor de contexto de tiempo \({{\varvec{C}}}^{t}=\left\{{c}_{1}^{t },{c}_{2}^{t},\ldots,{c}_{i}^{t},\ldots,{c}_{n}^{t}\right\}\). El TPL consta de múltiples percepciones de una sola capa que están dispuestas de forma secuencial a lo largo del eje del tiempo. El número de percepciones múltiples de una sola capa es igual a la duración de la serie temporal QAR. Cada perceptrón de una sola capa \({fc}_{i}\) se utiliza para recopilar la información de características de la serie temporal QAR en el tiempo \(i\), generando un descriptor de contexto \({c}_{i}^ {t}\). Para producir nuestro mapa de atención temporal \({A}_{t}\in {\mathbb{R}}^{1\times T}\), el descriptor de contexto temporal se envía a un perceptrón multicapa (MLP). Red con una capa oculta. El tamaño de activación de la capa oculta se establece en \({\mathbb{R}}^{T/r\times 1}\) para reducir la sobrecarga de los parámetros del modelo, y r es la relación de reducción. Después de que el mapa de atención temporal pasa por una función sigmoidea, se multiplica con la serie temporal QAR original \(S\in {\mathbb{R}}^{F\times T}\) usando el producto de Hadamard, lo que da como resultado el tiempo. datos refinados \({S}^{\prime}\in {\mathbb{R}}^{F\times T}\). En resumen, el tiempo de atención se calcula como:
donde \(\sigma \) representa la función sigmoidea, \({W}_{0}^{MLP}\) y \({W}_{1}^{MLP}\) representan los pesos de Red MLP, y \({W}_{0}^{MLP}\) va seguido de una función de activación de Unidad lineal rectificada (ReLU). \({W}_{i}^{TPL}\) representa el peso de \({fc}_{i}\) en el TPL.
(2) Módulo de atención de características (FAM): la función del mecanismo de atención de características es centrarse en "qué" características son informativas. Puede considerarse complementario a la atención temporal, que resalta los parámetros importantes de las características de vuelo de los datos QAR refinados en el tiempo y suprime los innecesarios. Se genera un mapa de atención de características explotando las relaciones entre características de los datos QAR dados. Cada serie de características de los datos QAR funciona como un detector de características y se utiliza para calcular su valor de atención de características mediante la recopilación y compresión de su información de la dimensión temporal. De manera similar al cálculo del tiempo de atención, se construye un módulo de Lista de perceptrones de características (FPL) para agregar información de características, como se muestra en la Fig. 6.
Dados datos refinados en el tiempo \({S}^{\prime}\in {\mathbb{R}}^{F\times T}\), primero agregamos la información de características a lo largo del eje temporal de \({S} ^{\prime}\in {\mathbb{R}}^{F\times T}\) utilizando el módulo FPL, generando un descriptor de contexto de característica \({\mathbf{C}}^{f} = \{ c_{1}^{f},c_{2}^{f}, \ldots,c_{j}^{f}, \ldots,c_{m}^{f} \}\). Todas las percepciones de una sola capa están dispuestas a lo largo del eje de características, y cada perceptrón de una sola capa \({fc}_{j}\) en el módulo FPL se utiliza para recopilar la información de características a lo largo del eje de tiempo de \(j \) ésima característica. Luego, el descriptor de contexto de características también se reenvía a una nueva red compuesta por un MLP con una capa oculta, lo que produce un mapa de atención de características \({A}_{f}\in {\mathbb{R}}^{F\times 1 }\). El tamaño de activación de la capa oculta se establece en \({\mathbb{R}}^{F/r\times 1}\) para reducir la sobrecarga de los parámetros del modelo, donde r es la relación de reducción. Después de que el mapa de características pasa una función sigmoidea, se multiplica con datos refinados en el tiempo \({S}^{\prime}\in {\mathbb{R}}^{F\times T}\) usando el producto de Hadamard, dando como resultado los datos finales refinados \({S}^{"}\in {\mathbb{R}}^{F\times T}\). En resumen, la atención de la característica se calcula como:
donde \(\sigma \) representa la función sigmoidea, \({W}_{0}^{MLP}\) y \({W}_{1}^{MLP}\) representan los pesos de Red MLP, y \({W}_{0}^{MLP}\) va seguido de una función de activación ReLU. \({W}_{j}^{FPL}\) representa el peso de \({fc}_{j}\) en el FPL.
Se ha demostrado que las arquitecturas AE, incluidas las AE de red neuronal convolucional (CNN-AE) y las AE de red neuronal recurrente (RNN-AE), son potentes modelos de extracción de características no lineales, que cuentan con flexibilidad y diversidad. Normalmente, la naturaleza de los datos de entrada determina la selección de la arquitectura del modelo. Anteriormente, se aceptaba generalmente que los AE basados en RNN eran la opción preferida para tratar datos de series temporales, mientras que los AE basados en CNN eran los preferidos para datos de imágenes. Sin embargo, recientemente se ha demostrado que los AE basados en CNN superan a los AE generales basados en RNN en datos de series temporales41. Con estructuras complejas, las CNN pueden extraer características ocultas más ricas y complicadas de datos de alta dimensión que las RNN42. Por lo tanto, se seleccionan CNN para construir nuestro modelo AE para extraer características de vuelo de los datos QAR.
En este artículo, construimos un modelo de red de codificador automático convolucional basado en atención de características de tiempo (TFA-CAE) para extraer características de vuelo de datos de series de tiempo QAR. La Figura 7 muestra los detalles del modelo TFA-CAE, incluyendo su estructura y parámetros especiales. El modelo TFA-CAE consta principalmente de tres partes: el módulo TFA, un codificador y un decodificador, donde al módulo TFA le sigue un CAE. El flujo de trabajo general del modelo TFA-CAE se describe a continuación.
La estructura especial y los parámetros del modelo TFA-CAE.
El módulo TFA se aplica primero a los datos QAR originales, produciendo los datos finales de series de tiempo refinados. Dentro del codificador, se apilan múltiples capas convolucionales y capas de agrupación máxima de manera entrelazada para la extracción de características jerárquicas. Se genera un vector 1D aplanando todas las unidades dentro de la salida de la última capa convolucional y luego las dos capas posteriores completamente conectadas lo transforman en un espacio de características de baja dimensión (espacio latente). Diseñado como una forma simétrica del codificador, el decodificador se compone de múltiples capas deconvolucionales y de agrupación unmax que se apilan de manera entrelazada para reconstruir los datos QAR originales a partir de las características latentes. Además, durante el proceso de entrenamiento del modelo TFA-CAE, los índices de cada capa de agrupación máxima dentro del codificador se envían a la capa de agrupación no máxima simétrica dentro del decodificador para realizar un muestreo ascendente. Los parámetros del modelo se optimizan mediante la propagación hacia atrás de la pérdida de error entre los datos QAR originales y la salida reconstruida del decodificador.
En este artículo, los conjuntos de datos de vuelos que aterrizan en los aeropuertos Kunming Changshui International (OACI: ZPPP, en adelante) y Lhasa Gonggar International (OACI: ZULS, en adelante) se toman como datos experimentales para nuestro estudio de caso. El conjunto de datos contiene 12,176 vuelos y todos los vuelos se extraen de la forma que se muestra en la Fig. 3. Todos los vuelos se muestrean con los parámetros de vuelo enumerados en la Tabla 1. Después de estandarizarlos mediante la normalización mínima-máxima, dividimos el conjunto de datos en un entrenamiento. conjunto de datos para entrenar el modelo, un conjunto de datos de validación para determinar cuándo detener el proceso de entrenamiento del modelo y un conjunto de datos de prueba para evaluar el rendimiento del modelo. El conjunto de datos se divide en una proporción de 6:2:2. La Tabla 2 presenta los detalles de la división de cada conjunto de datos.
La autoatención43, como variante del mecanismo de atención bien conocida, fue propuesta con el objetivo de capturar las relaciones internas de datos o características y ha mostrado un gran rendimiento en diversas aplicaciones, como la traducción. Esto es similar a la idea de nuestro módulo TFA propuesto en este artículo. En los experimentos de este artículo, también construimos un modelo CAE basado en autoatención (SA-CAE) para extraer características de vuelo. Además, también adoptamos los modelos tradicionales CAE, codificador automático basado en unidad recurrente de puerta (GRU-AE) y TFA-GRU-AE para compararlos con el modelo TFA-CAE. El marco de aprendizaje profundo PyTorch (versión 1.11) se emplea para construir y entrenar todos los modelos anteriores. Además, el optimizador de estimación de momento adaptativo (Adam) se emplea para la optimización de todos los modelos. El tamaño del lote de los datos de entrenamiento QAR se establece en 32 y la tasa de aprendizaje se establece en 0,0001. Durante los procesos de entrenamiento de todos los modelos de red, introducimos un mecanismo de parada temprana para decidir cuándo finalizar el entrenamiento de los modelos. Su paciencia se establece en 15, lo que significa que el proceso de entrenamiento del modelo se detiene cuando la pérdida de error inducida en el conjunto de validación ya no disminuye después de 15 épocas. Además, los ratios de reducción de atención en el tiempo y atención en las características se fijan en 16 y 4, respectivamente.
Cabe destacar que una pequeña fracción de vuelos anómalos se desvió del patrón de vuelo común en el conjunto de datos, lo que puede deberse a entornos atmosféricos externos hostiles, operaciones inadecuadas de los pilotos y mal funcionamiento de las propias aeronaves. Por lo tanto, para minimizar la distorsión de estos vuelos anómalos en el modelo durante el proceso de entrenamiento, adoptamos la función de pérdida de Huber44 con menor sensibilidad a la anomalía para calcular el valor de pérdida de error. La función de pérdida de Huber se muestra en la ecuación. (4):
donde \(yf(x)\) es el residual y \(\delta \) es el parámetro umbral. Cuando el residual es mayor que \(\delta \), la función de pérdida de Huber utiliza la función de error absoluto medio (MAE) para calcular el error de pérdida; de lo contrario, se emplea la función de error cuadrático medio (MSE) para calcular el error de pérdida. La configuración de \(\delta \) determina cómo se ven las anomalías. En el proceso de entrenamiento del modelo, cada modelo se entrena varias veces con \(\delta \) entre 0,1 y 1; el paso es 0,1. La configuración de \(\delta \) se decide cuando el valor de pérdida promedio en los datos de prueba primero disminuye y luego permanece estable. Finalmente, los valores de \(\delta \) se establecen en 0,5 para el modelo.
Como se describe en la sección "Introducción" sobre el modelo de red AE, el AE utiliza el codificador para asignar la entrada original a la representación de características en el espacio latente y el decodificador para reconstruir la entrada original con la representación de características. Por lo tanto, una pérdida de error menor indica una mejor representación de las características de los datos QAR originales. En este artículo, todos los modelos AE se entrenan con múltiples dimensiones del espacio latente. Los valores de pérdida promedio de todos los modelos se muestran en la Fig. 8. Al comparar los valores de pérdida promedio de los modelos, podemos ver primero que los modelos CAE pueden extraer características de vuelo más representativas que los modelos GRU-AE, ya que los modelos CAE tienen valores de pérdida promedio más pequeños que los modelos GRU-AE. El módulo TFA ayuda a los modelos a extraer características de vuelo más representativas. Los modelos AE con módulo TFA tienen valores de pérdida promedio más pequeños que los correspondientes sin módulo TFA. El modelo TFA-CAE supera a los otros modelos en términos de extracción de características de vuelo a partir de datos QAR, ya que alcanza los valores de pérdida promedio más pequeños, como se muestra en la Fig. 8.
Comparación entre los valores de pérdida promedio de los modelos en el conjunto de datos de prueba.
Con el tamaño del espacio latente (características extraídas) establecido en 2 en nuestro estudio de caso, podemos visualizar los resultados de las características de vuelo extraídas. El resultado de la visualización de las características de vuelo extraídas por los modelos CAE y GRU-AE y el PCA durante la fase de aterrizaje se muestra en la Fig. 8. Todas las características de vuelo extraídas por cada modelo individual están etiquetadas con sus diferentes patrones de vuelo divididos por el ángulo de la cabeza. (Norte Magnético).
Como se muestran los cuatro patrones de vuelo en las figuras 9a a f, podemos ver que tanto el modelo CAE como el GRU superan al método PCA en el descubrimiento de patrones de vuelo en las características de vuelo extraídas, ya que no están claras. Además, los modelos CAE y SA-CAE tradicionales Los modelos pueden extraer características de vuelo más representativas de los datos QAR originales que los modelos GUR-AE y TFA-GRU-AE. Sin embargo, las divisiones de los patrones de vuelo en las Fig. 9e yf son mucho más claras que en las Fig. 9b yc, los modelos tradicionales CAE y SA-CAE son inferiores a los modelos GRU-AE y TFA-GRU-AE a la hora de identificar diferentes patrones de vuelo. . Además, el módulo TFA ayuda a los modelos CAE y GRU-AE a dividir claramente los patrones de vuelo comparando las Fig. 9a,f con las Fig. 9c,e.
Resultados de extracción de características de vuelo obtenidos durante la fase de aterrizaje. Como se ilustra, la subfigura (a) es el resultado de la característica de vuelo extraído por nuestro modelo TFA-CAE; (b) es el resultado de la característica de vuelo extraído por el SA-CAE; (c) es el resultado de la característica de vuelo extraído por el CAE; (d) es el resultado de la característica de vuelo extraído por PCA; (e) y (f) son los resultados de las características de vuelo obtenidos por GRU-AE y TFA-GRU-AE respectivamente.
Además, como se muestra en la Fig. 9a, los objetos de vuelo dentro del área dispersa alrededor de cada patrón de vuelo están claramente separados y generalmente se consideran vuelos anómalos que se desvían del patrón de vuelo común. En general, el modelo TFA-CAE propuesto en este artículo puede extraer características de vuelo más representativas y obtener un mejor resultado del descubrimiento de patrones de vuelo y su división, lo que proporciona una técnica bien establecida para un uso posterior de los datos QAR, como el riesgo de vuelo. detección o FOQA.
En cuanto al tiempo y la atención de las funciones, el orden de disposición de estos dos submódulos puede afectar el rendimiento global, ya que cada módulo tiene funciones diferentes. En esta sección, comparamos las dos formas diferentes de organizar los submódulos de atención de tiempo y características: uso secuencial de tiempo-característica y uso secuencial de característica-tiempo de ambos módulos de atención. Se construyó y entrenó un modelo CAE basado en atención en el tiempo (FTA-CAE) para compararlo con el modelo TFA-CAE. La comparación del valor de pérdida promedio entre los modelos TFA-CAE y FTA-CAE se muestra en la Fig. 10. A partir del resultado, podemos ver que el valor de pérdida promedio del modelo FTA-CAE es mayor que el del modelo TFA-CAE. , la atención de características de tiempo supera la atención de características de tiempo en términos de ayudar al modelo CAE a extraer características de vuelo.
Comparación de los valores de pérdida promedio entre los modelos TFA-CAE y FTA-CAE.
Además, en la Fig. 11 se comparan los resultados de visualización de las características de vuelo extraídas por los modelos FTA-CAE y TFA-CAE. Como se muestra en la Fig. 11b, el modelo FTA-CAE es capaz de descubrir los cuatro patrones de vuelo dentro del vuelo extraído. características. Al comparar las figuras 11a y b, el modelo TFA-CAE supera al modelo FTA-CAE en términos de la división de los patrones de vuelo desde los patrones de vuelo \({P}_{2}\) y \({P}_{ 3}\) no están claramente divididos en la Fig. 11b. Sin embargo, el modelo FTA-CAE supera a los modelos SA-CAE y CAE en la división de patrones de vuelo; La división de estos cuatro patrones de vuelo en la Fig. 11b es más clara que en las Fig. 9b y c.
Resultados de extracción de características de vuelo obtenidos durante la fase de aterrizaje. Como se ilustra, la subfigura (a) es el resultado de la característica de vuelo extraído del modelo TFA-CAE, mientras que (b) es el resultado de la característica de vuelo extraído por el FTA-CAE.
A lo largo de las comparaciones anteriores, podemos aprender que (1) la combinación de tiempo y atención de características puede ayudar al modelo CAE a extraer características de vuelo más representativas de los datos QAR y (2) el módulo secuencial de atención de características de tiempo es mejor que el módulo secuencial de atención de características. módulo de atención del tiempo. Nuestro módulo de atención final y el modelo TFA-CAE se muestran en las Figs. 4 y 7, respectivamente.
En este artículo, para abordar las dificultades de extraer datos QAR causadas por sus características de alta dimensión y alta frecuencia, proponemos un modelo de red TFA-CAE para realizar la extracción de características de vuelo capturando esencialmente las relaciones internas entre las diferentes fases de vuelo, así como diferentes conjuntos de parámetros de vuelo. A modo de comparación, también se realizaron modelos de red PCA clásico, red CAE tradicional, SA-CAE y GRU-AE con el mismo conjunto de datos QAR. Los resultados muestran que nuestro modelo TFA-CAE puede extraer características de vuelo más representativas y, simultáneamente, descubrir patrones de vuelo a nivel de pista que están claramente separados entre sí. Además, dentro de las características de vuelo extraídas, los vuelos anómalos que se desvían del patrón de vuelo común están claramente separados de sus patrones de vuelo correspondientes. El modelo TFA-CAE proporciona una técnica bien establecida para un uso posterior de datos QAR, como la detección de riesgo de vuelo o FOQA.
El transporte aéreo está desempeñando un papel cada vez más popular e irreemplazable en el transporte, y la seguridad de los vuelos siempre ha sido un foco crucial en la gestión de la seguridad de la aviación civil. Con la expectativa de que salgan más vuelos en el futuro, la gestión de la seguridad aérea se enfrenta a desafíos nuevos y crecientes. Para abordar estos desafíos y mejorar aún más la seguridad de los vuelos, se ha realizado un cambio en la gestión de la seguridad de la aviación civil de la investigación y el análisis posteriores a los accidentes a la alerta previa a los accidentes. En respuesta a tal requisito, la aviación civil se esfuerza por prevenir eficazmente posibles accidentes de vuelo antes de que ocurran mediante la identificación de manera innovadora y proactiva de eventos de seguridad operacional significativos que actualmente no están rastreados. Si se abordan adecuadamente estos posibles incidentes de seguridad aérea, la tasa de accidentes por año se mantendrá en su nivel histórico más bajo. Los datos QAR proporcionarán una forma eficaz de lograr la Garantía de Calidad de las Operaciones de Vuelo (FOQA). Dado que los datos QAR son datos de vuelo registrados a bordo y registran muchos tipos diferentes de parámetros de vuelo, reflejan diversas situaciones de vuelo reales que ocurren durante el proceso de vuelo, con factores tales como las capacidades y habilidades básicas reales del piloto, los patrones de vuelo reales, el rendimiento de la propia aeronave y de los posibles fallos o anomalías del vuelo. Los masivos y ricos big data de vuelos proporcionan una base de datos completa para estudiar los riesgos de vuelo y los métodos de aprendizaje profundo. Con el desarrollo continuo de las RNA, la combinación de grandes datos QAR y aprendizaje profundo proporcionará un método importante y eficaz para la gestión de la seguridad de los vuelos.
Sin embargo, solo probamos un conjunto de datos de series temporales bidimensionales como entrada del modelo TFA-CAE, lo que podría ser cuestionable cuando se proporcionan datos más complejos. Por lo tanto, en el futuro se podría anticipar una arquitectura técnica más genérica para extraer características de vuelo a partir de datos de series temporales de longitud variable. Además, la evaluación se limita a un estudio de caso simple con datos QAR recopilados de dos aeropuertos específicos; se requieren más experimentos y comparaciones con más conjuntos de datos y técnicas de referencia para la generalización y perfección de las técnicas propuestas en este estudio. Además, el descubrimiento automático de patrones de vuelo comunes y la detección de vuelos anómalos o riesgos son dos temas futuros que pueden permitir una gestión de la seguridad de los vuelos mejor orientada.
Los datos que respaldan los hallazgos de este estudio están disponibles previa solicitud razonable al autor correspondiente.
Dhief, I. et al. Predecir el tiempo de aterrizaje de aeronaves en TMA extendida utilizando métodos de aprendizaje automático. En Actas de la 9.ª Conferencia Internacional para la Investigación en Transporte Aéreo (ICRAT), Tampa, FL, EE. UU., 23–26 (2020).
Wang, Z., Liang, M. y Delahaye, D. Predicción automatizada basada en datos sobre la hora estimada de llegada de las aeronaves. J. Transporte aéreo. Gestionar. 1(88), 101840 (2020).
Artículo de Google Scholar
Wang, Z., Liang, M. & Delahaye, D. Un modelo híbrido de aprendizaje automático para la predicción del tiempo estimado de llegada a corto plazo en el área de maniobras de la terminal. Transporte. Res. Parte C Emergente. Tecnología. 1(95), 280–294 (2018).
Artículo de Google Scholar
Gionis, A., Indyk, P. y Motwani, R. Búsqueda de similitudes en altas dimensiones mediante hash, vol. 8, núm. 2, 518–529 (1999).
Madan, A. y Gupta, D. Extracción y clasificación de características del habla: una revisión comparativa. En t. J. Computación. Aplica. 90(9), 20-25 (2014).
Google Académico
Tutz, G. & Gertheiss, J. Extracción de características en regresión de señales: una técnica de refuerzo para la regresión de datos funcionales. J. Computación. Grafico. Estadística. 19(1), 154–174 (2010).
Artículo MathSciNet Google Scholar
Aparna, UR & Paul, S. Selección y extracción de características en minería de datos. En 2016, Conferencia internacional en línea sobre ingeniería y tecnologías verdes (IC-GET) 1–3 (IEEE, 2016).
Suresh, R. & Harshni, SR Minería de datos y minería de textos: una encuesta. Conferencia internacional sobre computación de potencia, energía, información y comunicaciones (ICCPEIC), 412–419 (IEEE, 2017).
Widodo, A. & Yang, BS Aplicación de máquinas de vectores de soporte y extracción de características no lineales para el diagnóstico de fallas de motores de inducción. Sistema experto. Aplica. 33(1), 241–250 (2007).
Artículo de Google Scholar
Zhang, J., Li, RX, Han, P., Wang, DF y Yin, XC Extracción de características de paquetes Wavelet para monitoreo de vibraciones y diagnóstico de fallas de turbogeneradores. En Actas de la Conferencia Internacional de 2003 sobre Aprendizaje Automático y Cibernética (IEEE Cat. No. 03EX693), Vol 1, 76–81 (IEEE, 2003).
Saravanan, N. y Ramachandran, KI Diagnóstico de fallas incipientes de la caja de engranajes mediante transformada wavelet discreta (DWT) para la extracción y clasificación de características mediante una red neuronal artificial (ANN). Sistema experto. Aplica. 37(6), 4168–4181 (2010).
Artículo de Google Scholar
Lin, J. & Qu, L. Extracción de características basada en wavelet de Morlet y su aplicación para el diagnóstico de fallas mecánicas. J. Vibración de sonido. 234(1), 135-148 (2000).
ADS del artículo Google Scholar
Wold, S., Esbensen, K. y Geladi, P. Análisis de componentes principales. Quimio. Intel. Laboratorio. Sistema. 2, 37–52 (1987).
Artículo CAS Google Scholar
Demšar, U., Harris, P., Brunsdon, C., Fotheringham, AS y McLoone, S. Análisis de componentes principales de datos espaciales: una descripción general. Ana. Asociación. Soy. Geogr. 103(1), 106-128 (2013).
Artículo de Google Scholar
Tipping, ME & Bishop, CM Análisis probabilístico de componentes principales. Estadística JR. Soc. Ser. Estadística B. Método. 61(3), 611–622 (1999).
Artículo MathSciNet MATEMÁTICAS Google Scholar
Izenman, A. J Análisis discriminante lineal. En Técnicas estadísticas multivariadas modernas 237–280 (Springer, 2013).
Capítulo Google Scholar
Ye, J., Janardan, R. & Li, Q. Análisis discriminante lineal bidimensional. Adv. Inf. neuronal. Proceso. Sistema. 17 (2004).
Schölkopf, B., Smola, A. & Müller, KR Análisis de componentes principales del kernel. En Conferencia internacional sobre redes neuronales artificiales, 583–588 (Springer, 1997).
Lee, JM, Yoo, C., Choi, SW, Vanrolleghem, PA y Lee, IB Monitoreo de procesos no lineales mediante análisis de componentes principales del kernel. Química. Ing. Ciencia. 59(1), 223–234 (2004).
Artículo CAS Google Scholar
Chin, TJ y Suter, D. Análisis incremental de componentes principales del kernel. Traducción IEEE. Proceso de imagen. 16(6), 1662-1674 (2007).
Artículo ADS MathSciNet PubMed Google Scholar
Luo, X., Li, X., Wang, Z. y Liang, J. Codificador automático discriminante para extracción de funciones en el diagnóstico de fallas. Quimio. Intel. Laboratorio. Sistema. 15(192), 103814 (2019).
Artículo de Google Scholar
Navamani, TM Enfoques eficientes de aprendizaje profundo para la informática sanitaria. En Aprendizaje profundo y entorno de computación paralela para sistemas de bioingeniería, 123–137 (Academic Press, 2019).
Arul, VH Métodos de aprendizaje profundo para la clasificación de datos. En Inteligencia artificial en minería de datos, 87–108 (Academic Press, 2021).
Kunapuli, SS y Bhallamudi, PC Una revisión de modelos de aprendizaje profundo para diagnóstico médico. Mach. Aprender. Big Data IoT Med. Informar. 1, 389–404 (2021).
Google Académico
Jiang, L., Ge, Z. & Song, Z. Clasificación de fallas semisupervisada basada en un modelo dinámico de codificadores automáticos apilados dispersos. Quimio. Intel. Laboratorio. Sistema. 15(168), 72–83 (2017).
Artículo de Google Scholar
Sun, W. y col. Un enfoque de red neuronal profunda basado en codificador automático disperso para la clasificación de fallas de motores de inducción. Medición 1(89), 171–178 (2016).
ADS del artículo Google Scholar
Chen, K., Hu, J. & He, J. Un marco para extraer automáticamente características de sobretensión basado en un codificador automático disperso. Traducción IEEE. Red inteligente 9(2), 594–604 (2016).
Artículo de Google Scholar
Li, J., Luong, MT y Jurafsky, D. Un codificador automático neuronal jerárquico para párrafos y documentos. (2015). arXiv:1506.01057.
Snoek, J., Adams, RP y Larochelle, H. Guía no paramétrica de representaciones de codificadores automáticos utilizando información de etiquetas. J. Mach. Aprender. Res. (2012).
Wang, L., Wu, C. y Sun, R. Un análisis de los datos del registrador de acceso rápido (QAR) de vuelo y sus aplicaciones para prevenir incidentes de aterrizaje. Confiable. Ing. Sistema. Seguro. 127, 86–96 (2014).
Artículo de Google Scholar
Robert, FS Flight Dynamics (Princeton University Press, 2015).
Google Académico
Jasra, SK, Valentino, G., Muscat, A., Zammit-Mangion, D. & Camilleri, R. Evaluación de parámetros de vuelo durante las fases de aproximación y aterrizaje mediante la aplicación de análisis de componentes principales. En Foro AIAA Scitech 2020, 0674 (2020).
Mnih, V., Heess, N. & Graves, A. Modelos recurrentes de atención visual. En Avances en sistemas de procesamiento de información neuronal 2204–2212 (Curran Associates, Inc., 2014).
Google Académico
Ba, J., Mnih, V. y Kavukcuoglu, K. Reconocimiento de objetos múltiples con atención visual. (2014) arXiv:1412.7755.
Bahdanau, D., Cho, K. & Bengio, Y. Traducción automática neuronal aprendiendo conjuntamente a alinear y traducir. (2014) arXiv:1409.0473.
Xu, K. y col. Mostrar, atender y contar: Generación de leyendas de imágenes neuronales con atención visual. En Actas de la Conferencia Internacional sobre Aprendizaje Automático, Lille, Francia, 6 a 11 de julio de 2015, 2048-2057 (2015).
Liu, M., Li, L., Hu, H., Guan, W. y Tian, J. Generación de pies de imagen con mecanismo de atención dual. inf. Proceso. Gestionar. 57, 102178 (2020).
Artículo de Google Scholar
Jaderberg, M., Simonyan, K. y Zisserman, A. Redes de transformadores espaciales. (2015) arXiv:1506.02025.
Hu, J., Shen, L. y Sun, G. Redes de compresión y excitación. En Actas de la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones, Salt Lake City, UT, EE. UU., 18 a 23 de junio de 2018, págs. 7132 a 7141 (2018).
Woo, S. y col. Cbam: Módulo de atención de bloques convolucionales. En Actas de la Conferencia europea sobre visión por computadora (ECCV), Múnich, Alemania, 8 a 14 de septiembre de 2018, 3 a 19 (2018).
Bai, S., Kolter, JZ y Koltun, V. Una evaluación empírica de redes convolucionales y recurrentes genéricas para el modelado de secuencias (2018) arXiv:1803.01271.
Gorokhov, O., Petrovskiy, M. & Mashechkin, I. Redes neuronales convolucionales para la detección de anomalías no supervisadas en datos de texto. En Actas de la Conferencia Internacional sobre Ingeniería de Datos Inteligentes y Aprendizaje Automatizado, Guilin, China, 30 de octubre a 1 de noviembre de 2017, 500–507 (Springer, 2017).
Vaswani, A. y col. Atención es todo lo que necesitas. Adv. Inf. neuronal. Proceso. Sistema. 30 (2017).
Peter, JH Estimación robusta de un parámetro de ubicación. En Avances en estadística 492–518 (Springer, 1992).
Google Académico
Descargar referencias
Agradecemos el apoyo para este trabajo de la Fundación Nacional de Ciencias Naturales de China (No. U2033216; No. 42071368), el Programa Clave de Investigación y Desarrollo Provincial de Hubei (2021BAA185) y los Fondos de Investigación Fundamental para las Universidades Centrales de China (Subvención No. 2042022dx0001).
Escuela de Ingeniería de la Información y Percepción Remota, Universidad de Wuhan, Wuhan, 430079, China
Qixin Wang, Kun Qin y Binbin Lu
Centro de Ingeniería e Investigación Técnica de Análisis y Prevención de la Seguridad de la Aviación Civil, Academia de Ciencia y Tecnología de la Aviación Civil de China, Beijing, 100028, China
Huabo Sun y Ping Shu
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
Conceptualización, BL y KQ; metodología, QW; software, QW; validación, HS, BL y PS; análisis formal, QW; investigación, QW; recursos, SA; curación de datos, HS; redacción: preparación del borrador original, QW; redacción: revisión y edición, BL; visualización, QW; supervisión, KQ; administración de proyectos, BL; adquisición de financiación, BL Todos los autores han leído y aceptado la versión publicada del manuscrito.
Correspondencia a Binbin Lu.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Wang, Q., Qin, K., Lu, B. et al. Codificador automático convolucional basado en atención de características de tiempo para extracción de características de vuelo. Representante científico 13, 14175 (2023). https://doi.org/10.1038/s41598-023-41295-y
Descargar cita
Recibido: 16 de mayo de 2023
Aceptado: 24 de agosto de 2023
Publicado: 30 de agosto de 2023
DOI: https://doi.org/10.1038/s41598-023-41295-y
Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.