T-MIE(2024) https://doi.org/10.1016/0045-7949(92)90132-J

USO DE REDES NEURONALES EN LA DETECCIÓN DE DAÑO ESTRUCTURAL

X. Wu †, J. Ghaboussi †, J.H. Garrett Jr

https://doi.org/10.1016/0045-7949(92)90132-J

Received 15 November 1990

Traducido por: TheJameZ

Resumen: El daño a las estructuras puede ser causado como resultado de operaciones normales, accidentes, deterioro o eventos naturales severos como terremotos y tormentas. En la mayoría de los casos, la magnitud y la ubicación del daño pueden determinarse mediante inspección visual. Sin embargo, en algunos casos, la inspección visual puede no ser factible. El estudio reportado en este documento es la primera etapa de una investigación dirigida al desarrollo de métodos automáticos de monitoreo para la detección de daños estructurales. En este estudio de viabilidad, hemos explorado el uso de las capacidades de autoorganización y aprendizaje de las redes neuronales en la evaluación de daños estructurales. La estrategia básica consiste en entrenar una red neuronal para reconocer el comportamiento de la estructura sin daños, así como el comportamiento de la estructura con diversos estados de posible daño. Cuando la red entrenada se somete a las mediciones de la respuesta estructural, debería poder detectar cualquier daño existente. Hemos probado esta idea básica en una estructura simple y los resultados son prometedores.

1. INTRODUCCION. 

Una metodología efectiva y confiable para evaluar el daño será una herramienta valiosa en la determinación oportuna del estado de daño y deterioro de los elementos estructurales. La información generada por un proceso de evaluación de daños puede desempeñar un papel vital en el desarrollo de programas económicos de reparación y refuerzo.

El método más común de evaluación de daños es la inspección visual. Sin embargo, la inspección visual de estructuras grandes y complejas puede ser difícil y costosa debido a problemas de accesibilidad, y en algunos casos, la inspección visual puede resultar poco confiable. Ejemplos de tales estructuras son plataformas de exploración y producción de petróleo y gas en alta mar y fuselajes de aeronaves.

En los últimos años, la metodología de diagnóstico indirecto para la evaluación de daños estructurales ha atraído la atención de muchos investigadores. El enfoque básico consiste en detectar cambios en la respuesta dinámica y/o en las características dinámicas de la estructura. Estos cambios se relacionan posteriormente con varios estados de daño. El objetivo de cualquier evaluación de daños es determinar si ha ocurrido daño estructural y, en caso afirmativo, determinar la ubicación y la magnitud del daño.

La mayoría de los métodos de evaluación de daños propuestos en la literatura siguen más o menos el mismo enfoque. Se pueden identificar una serie de pasos básicos en estos métodos tradicionales de evaluación de daños. En primer lugar, se construye un modelo matemático para la estructura. Luego, el modelo matemático se utiliza para desarrollar una comprensión del comportamiento estructural y establecer correlaciones entre condiciones específicas de daño en los miembros y cambios en la respuesta estructural. Estos modelos matemáticos son inherentemente modelos de proceso directo, avanzando linealmente de causas a efectos.

Sin embargo, la identificación del daño en los miembros a partir de la respuesta de la estructura dañada es un proceso inverso; es decir, las causas deben discernirse a partir de los efectos. Este paso de diagnóstico es una búsqueda exhaustiva de las causas del comportamiento estructural observado; este proceso es computacionalmente costoso y requiere un sistema de seguimiento de datos bien desarrollado.

Los investigadores han propuesto esquemas de evaluación de daños basados en el análisis de respuestas dinámicas medidas de la estructura antes y después del daño. Algunos de los esquemas propuestos solo utilizan la respuesta en frecuencia de la estructura bajo cargas aplicadas o el contenido de frecuencia de las pruebas de vibración ambiente [1-5]. Trabajos más recientes en esta área también utilizan información sobre las formas modales de la estructura [6]. Mientras que los modelos matemáticos existentes para estructuras complejas pueden ser lo suficientemente precisos para fines de análisis y diseño, estos modelos por sí solos no son suficientes para diagnosticar qué miembros pueden estar causando los cambios observados en la respuesta dinámica de la estructura.

Una metodología robusta de evaluación de daños debe ser capaz de reconocer patrones en la respuesta observada de la estructura resultantes del daño en miembros individuales, incluida la capacidad de determinar la magnitud del daño en los miembros. Esta capacidad parece estar dentro del alcance de las capacidades de coincidencia de patrones de las redes neuronales. La utilización de estas capacidades de las redes neuronales en la evaluación de daños constituye la base de la investigación descrita en este documento.

En este estudio, se utilizan redes neuronales para extraer y almacenar el conocimiento de los patrones en la respuesta de la estructura sin daños y la estructura dañada. De esta manera, se evita la necesidad de construir modelos matemáticos y llevar a cabo una búsqueda inversa exhaustiva. Las redes neuronales son modelos computacionales, inspirados de manera flexible en la estructura y las capacidades de procesamiento de información del cerebro humano. Una red neuronal es un conjunto de numerosas unidades de procesamiento simples altamente interconectadas (neuronas). Las conexiones entre las neuronas tienen valores numéricos que representan la fuerza de estas conexiones, denominados pesos. El conocimiento se almacena en forma de una colección de fuerzas de conexión. Estas redes neuronales son capaces de autoorganización y adquisición de conocimiento (aprendizaje). Esta capacidad permite la determinación automática de las fuerzas de conexión a partir de los datos que contienen el conocimiento a extraer.

El objetivo del estudio piloto presentado aquí es explorar la aplicabilidad de las redes neuronales en la evaluación de daños estructurales. Se entrenan redes neuronales adecuadas para reconocer la respuesta en frecuencia de una estructura sin daños, así como las respuestas en frecuencia de la estructura en la cual miembros individuales han sufrido diversos grados de daño. Estas redes neuronales entrenadas tendrán la capacidad de reconocer la ubicación y la magnitud del daño en miembros individuales a partir de la respuesta medida de la estructura.

2. REDES NEURONALES

Como se mencionó en la introducción, las redes neuronales se han inspirado en la arquitectura y operación neuronal del cerebro. Rumelhart y otros [7] argumentan que la razón por la cual el cerebro es capaz de un rendimiento elevado en tareas naturales de procesamiento de información, como la percepción, la comprensión del lenguaje, el control motor, etc., es que:

  • estas tareas requieren la consideración simultánea de un gran número de piezas de información y restricciones, y
  • la arquitectura neuronal, que consta de miles de millones de neuronas interconectadas con un fan-in y fan-out del orden de aproximadamente 1000-100000, es idealmente adecuada para la computación tipo relajación necesaria para la consideración simultánea de la multitud de información y restricciones mencionadas anteriormente [7].
Por lo tanto, este paradigma de computación y representación del conocimiento inspirado en la neurona consiste en un modelo de una neurona individual, llamado unidad de procesamiento, que se instancia miles de veces, con muchas conexiones existentes entre estas diversas instancias. El modelo básico de una neurona individual fue desarrollado en 1943 por Warren McCulloch y Walter Pitts y todavía sigue siendo fundamental en la mayoría de las redes neuronales [8]. Dado que la estructura fisiológica de una neurona se asemeja a la que se muestra en la parte superior de la Fig. 1, McCulloch y Pitts propusieron el siguiente modelo de una neurona (ver parte inferior de la Fig. 1):

  • cada neurona tiene una actividad, xi, que es la suma de las entradas que llegan a través de vías ponderadas,
  • la entrada desde una vía particular es una señal entrante, Si, multiplicada por el peso, wij, de esa vía,
  • wij representa la eficacia sináptica: la cantidad de potencial postsináptico transmitido al soma j si se produce un pico en el soma i, y
  • la señal saliente de la neurona i se calcula como Sj = f(xj), donde f(xj) es la función umbral binaria de la actividad, xj, en esa neurona.

La neurona de McCulloch-Pitts también puede tener un término de sesgo, θj, que actúa como una especie de umbral. En el modelo de neurona de McCulloch-Pitts, las señales, Si, están restringidas a tomar los valores de 0 y 1, como es evidente en la función de salida f(xj).

Cada procesador en la red mantiene solo una pieza de información dinámica (su nivel actual de activación) y es capaz de realizar solo algunas operaciones simples (sumar entradas, calcular un nuevo nivel de activación o comparar la entrada con un valor umbral). Una red neuronal realiza 'computaciones' propagando cambios en la activación (es decir, el nivel de estimulación) entre los procesadores, lo cual puede o no involucrar retroalimentación y relajación.

Rosenblatt [9] extendió el modelo de McCulloch-Pitts con la intención de dotar a las redes de estas unidades con capacidades de autoorganización a través de una modificación dinámica y localizada de los pesos. Aunque su trabajo fue ampliamente criticado por tratar solo con redes simples de dos capas que no eran capaces de aprender ciertos tipos de funciones, sí abrió el camino para investigaciones más modernas sobre mecanismos de aprendizaje para redes de múltiples capas, como la retropropagación [10-12] (discutida más adelante en este documento).

Sin estas capacidades, cualquier cálculo complejo realizado por una red neuronal de estilo McCulloch-Pitts requeriría la configuración manual de todas las fuerzas de conexión, lo cual sería imposible. Por lo tanto, una característica clave de las redes neuronales es su capacidad de autoorganización o 'aprendizaje'. A diferencia de las técnicas tradicionales de programación secuencial, las redes neuronales se entrenan con ejemplos de los conceptos que deben capturar. La red luego se organiza internamente para poder reconstruir los ejemplos presentados. Otras características interesantes y valiosas son:

(1) su capacidad para producir respuestas correctas o casi correctas cuando se les presentan estímulos parcialmente incorrectos o incompletos; y

(2) su capacidad para realizar una cantidad limitada de generalización a partir de los casos en los que se entrenan.

Ambas características se derivan del hecho de que una red neuronal, a través de la autoorganización, desarrolla un conjunto interno de características que utiliza para clasificar los estímulos presentados y devolver la respuesta esperada.

En las primeras etapas del aprendizaje, las fuerzas de conexión inmaduras causan que la respuesta real de la red sea bastante diferente de la esperada. El error se define como una medida de la diferencia entre el patrón de salida calculado y el patrón de salida esperado. La mayoría de los mecanismos de aprendizaje buscan reducir este error para todas las asociaciones (pares de patrones de entrada/salida) que se deben aprender mediante una estrategia iterativa de modificación de peso localizada que sirve para reducir la suma de los cuadrados de los errores para cada par de patrones.

Rumelhart y otros [7] proporcionan una excelente descripción de la anatomía básica de las redes neuronales, que dividen en siete aspectos fundamentales:

(1) un conjunto de unidades de procesamiento,

(2) el estado de activación de una unidad de procesamiento,

(3) la función utilizada para calcular la salida de una unidad de procesamiento,

(4) el patrón de conectividad entre las unidades de procesamiento,

(5) la regla de propagación empleada,

(6) la función de activación empleada y

(7) la regla de aprendizaje empleada.

La topología de la red (es decir, el número de nodos y su conectividad) y la forma de las reglas y funciones son variables en una red neuronal y dan lugar a una amplia variedad de tipos de redes. Algunos de los tipos de redes neuronales conocidos descritos en [12] son:

  • el aprendizaje competitivo [13,14], 
  • la máquina de Boltzmann [15], 
  • la red de Hopfield [16], 
  • la red de Kohonen [17] y 
  • la red de retropropagación [10-12]. 
La red de retropropagación recibe su nombre debido a la forma en que aprende, retropropagando los errores observados en los nodos de salida. Aunque existen muchas otras variaciones de redes neuronales, las redes de retropropagación son actualmente consideradas por la mayoría de los desarrolladores de aplicaciones de redes neuronales.

2.1 Redes neuronales de retropropagación

Las unidades de procesamiento en las redes neuronales de retropropagación están dispuestas en capas. Cada red neuronal tiene una capa de entrada, una capa de salida y un número de capas ocultas. Como se ilustra en los ejemplos mostrados en la Fig. 2, es la presencia de estas unidades ocultas la que permite a estas redes representar y calcular asociaciones más complicadas entre patrones. La propagación se realiza de manera hacia adelante, desde la capa de entrada hasta la capa de salida. El patrón de conectividad y el número de unidades de procesamiento en cada capa pueden variar con algunas restricciones. No se permite la comunicación entre las unidades de procesamiento dentro de una capa, pero las unidades de procesamiento en cada capa pueden enviar su salida a las unidades de procesamiento en capas superiores. En el tipo específico de arquitectura de red neuronal utilizado en este estudio, cada unidad recibe entrada de todas las unidades en la capa precedente y envía su salida a todas las unidades en la siguiente capa. Un ejemplo típico de tal arquitectura de red neuronal se muestra en la Fig. 2.

Asociado con cada conexión hay un valor numérico que es la fuerza o el peso de esa conexión: wij = fuerza de la conexión entre las unidades i y j. Las fuerzas de conexión se desarrollan durante el entrenamiento de la red neuronal. Al principio del proceso de entrenamiento, las fuerzas de conexión se asignan un valor aleatorio. A medida que se presentan ejemplos durante el entrenamiento, la aplicación de las 'reglas de aprendizaje' (que se describirán más adelante) modifica las fuerzas de conexión en un proceso iterativo. Al completar con éxito el entrenamiento, cuando el proceso iterativo ha convergido, la colección de fuerzas de conexión captura y almacena el conocimiento y la información presentes en los ejemplos utilizados en su entrenamiento. Una red neuronal entrenada de esta manera está lista para ser utilizada. Cuando se le presenta un patrón de entrada, la computación de la red de avance resulta en un patrón de salida que es el resultado de la generalización y síntesis de lo que ha aprendido y almacenado en sus fuerzas de conexión.

Una computación de red de avance con estas redes neuronales de retropropagación procede de la siguiente manera:

  • Las unidades en la capa de entrada reciben sus activaciones en forma de un patrón de entrada, lo que inicia el proceso de avance.
  • Las unidades de procesamiento en cada capa reciben salidas de otras unidades y realizan los siguientes cálculos:
  • Calculan su entrada neta Nj,

donde 0k es la salida de las unidades que inciden en la unidad j y M es el número de unidades que inciden en la unidad j.

  • Calculan sus valores de activación a partir de los valores de entrada netos.

Fj es generalmente una función sigmoide.

  • Calculan sus salidas a partir de sus valores de activación. En el tipo de red neuronal utilizado en este estudio, la salida es la misma que el valor de activación.

  • Los valores de salida se envían a otras unidades de procesamiento a lo largo de las conexiones salientes.
  • Este proceso continúa hasta que las unidades de procesamiento en la capa de salida calculan sus valores de activación. Estos valores de activación son la salida de las computaciones neuronales.
2.2 Autoorganización y reglas de aprendizaje

Se han desarrollado y descrito varios mecanismos para impartir autoorganización a estas redes multicapa [7]. Una de las principales características de estos mecanismos de aprendizaje es si el aprendizaje ocurre de manera supervisada o no supervisada. El aprendizaje supervisado significa que la salida esperada se incluye en lo que la red debe aprender. El aprendizaje no supervisado significa que la red no se le dice qué debe aprender sobre la entrada que se le presenta y debe descubrir por sí misma regularidades y similitudes entre los patrones de entrada.

Una forma de aprendizaje supervisado, desarrollada por Rumelhart, Hinton y Williams, se llama la regla delta generalizada [11] y es el mecanismo de aprendizaje utilizado en las redes neuronales de retropropagación. Todas las redes de retropropagación, que utilizan la regla delta generalizada para la autoorganización y derivan su nombre de la necesidad de retropropagar el error, tienen la misma arquitectura general mostrada en la Fig. 2.

El entrenamiento (es decir, el aprendizaje supervisado) de una red neuronal de retropropagación de varias capas, mediante la regla delta generalizada, es un proceso iterativo. Cada paso implica la determinación del error asociado con cada unidad y luego la modificación de los pesos en las conexiones que llegan a esa unidad. Cada presentación de un caso de entrenamiento y la modificación subsiguiente de las fuerzas de conexión se llama un ciclo. Cada ciclo involucra tres subpasos:

(1) para el caso de entrenamiento que se va a aprender, la red se presenta con el patrón de entrada y luego propaga la activación a través de las unidades de procesamiento;

(2) el error en las unidades de salida se retropropaga a las unidades de procesamiento ocultas; y

(3) las conexiones que llegan a las unidades ocultas luego modifican sus fuerzas de conexión utilizando este error retropropagado.

Un conjunto de ciclos, compuesto por un ciclo para cada caso de entrenamiento, se llama una época. El proceso de entrenamiento para una red puede requerir varias centenas o miles de épocas para que todos los casos de entrenamiento se 'aprendan' dentro de una tolerancia de error especificada. La regla delta generalizada realiza básicamente un descenso de gradiente en el espacio de error que consiste en normas euclidianas de los errores de todos los patrones presentados durante el entrenamiento. No se garantiza la convergencia. La convergencia depende en cierta medida de la arquitectura de la red, su capacidad y la cantidad de información que debe aprender. Esta relación aún no se comprende bien y es objeto de investigaciones actuales.

La modificación de las fuerzas de las conexiones en la regla delta generalizada, descrita en [11], se logra mediante el descenso del gradiente sobre el error total en un caso de entrenamiento dado.

En esta ecuación, η es una constante de aprendizaje llamada 'tasa de aprendizaje', y δj es el gradiente del error total con respecto a la entrada neta en la unidad j. En las unidades de salida, δj se determina a partir de la diferencia entre las activaciones esperadas, tj, y las activaciones calculadas, aj.

donde F' es la derivada de la función de activación. En las unidades ocultas, las activaciones esperadas no se conocen de antemano. La siguiente ecuación proporciona una estimación razonable de δj para las unidades ocultas:

En esta ecuación, el error atribuido a una unidad oculta depende del error de las unidades que influye. La cantidad de error de estas unidades atribuido a la unidad oculta depende de la fuerza de conexión desde la unidad oculta hacia esas unidades; una unidad oculta con una conexión excitatoria fuerte a una unidad que muestra error será fuertemente 'culpada' por este error, lo que causará que la fuerza de conexión se reduzca.

3. ENFOQUE BASADO EN REDES NEURONALES PARA LA EVALUACION DE DAÑOS

La estrategia básica para desarrollar un enfoque basado en redes neuronales para la evaluación de daños en un sistema estructural es entrenar una red neuronal de retropropagación para reconocer el daño en miembros individuales a partir de la respuesta medida de las estructuras. Esta estrategia se basa en el hecho de que la respuesta medida de cualquier estructura contiene información sobre sus frecuencias naturales y formas modales de vibración. El daño estructural afecta estas características dinámicas de la estructura. Así, en teoría, la respuesta medida de una estructura dañada, cuando se compara con la respuesta de la estructura no dañada, contiene información sobre la ubicación y la magnitud del daño. Sin embargo, esta información puede ser extremadamente difícil de extraer mediante los métodos tradicionales; las reglas que rigen las relaciones de causa y efecto deben establecerse explícitamente y se debe desarrollar una metodología para utilizar estas relaciones de antemano.

En el enfoque propuesto, el proceso de entrenamiento se utiliza para extraer las relaciones de causa y efecto, que luego se almacenan dentro de las fuerzas de conexión de una red neuronal de retropropagación adecuada. De esta manera, se aprovechan la capacidad de autoorganización y aprendizaje de estas redes neuronales para eliminar la necesidad de extraer explícitamente las relaciones de causa y efecto. Estas relaciones existen de manera distribuida dentro de las fuerzas de conexión de las redes neuronales, pero no son evidentes ni están disponibles externamente para el usuario.

El entrenamiento de una red neuronal con datos apropiados que contienen la información sobre las relaciones de causa y efecto está en el corazón del método propuesto de evaluación de daños. Por lo tanto, el primer paso es generar un conjunto de datos que pueda ser utilizado para entrenar una red neuronal adecuada para reconocer patrones de daño a partir de la respuesta de la estructura. Idealmente, este conjunto de datos debería contener la respuesta de la estructura no dañada, así como las respuestas de la estructura en diversos estados dañados. Este conjunto de datos se puede generar mediante la medición de la respuesta estructural, los resultados de pruebas de modelos o a través de simulación numérica, o una combinación de los tres tipos de datos. En este primer estudio, hemos utilizado simulaciones numéricas.

En cualquier aplicación típica de una red neuronal de retropropagación, en primer lugar, se debe determinar una arquitectura de red apropiada y seleccionar un algoritmo de entrenamiento. Luego, se entrena esa red neuronal específica con el conjunto de datos de entrenamiento. La red entrenada se prueba para verificar cuán bien ha aprendido los casos de entrenamiento. El último paso suele ser probar la capacidad de generalización de la red neuronal. En este paso, la red entrenada se prueba con datos que no estaban presentes en el conjunto de datos de entrenamiento. Este último paso es, de hecho, la prueba de la capacidad de rendimiento de la red. Cuán bien una red entrenada puede generalizar depende en gran medida de la adecuación de la arquitectura de red seleccionada y la riqueza del conjunto de datos de entrenamiento en la información necesaria para la evaluación de daños. A menudo, se necesitan cambios en la arquitectura de la red y/o adiciones al conjunto de datos de entrenamiento. Tales cambios se siguen con la repetición de todo el proceso de entrenamiento y prueba. Este ajuste fino cuasi-iterativo se repite hasta obtener un rendimiento satisfactorio.

En este estudio, hemos utilizado los historiales temporales de aceleración calculados como la respuesta medida de la estructura. Estos historiales temporales de aceleración se someten a un proceso de transformada rápida de Fourier (FFT), y los espectros de Fourier resultantes de los historiales temporales de aceleración se utilizan como entrada para la red neuronal. El espectro de Fourier entre 0 y 20 Hz se discretiza en intervalos de 0.1 Hz, y los valores espectrales se introducen en 200 nodos en la capa de entrada, como se muestra en la Fig. 4. La capa de salida contiene un nodo por miembro y los valores de activación en estos nodos representan el estado de daño en ese miembro; un valor de activación de uno significa que no hay daño y un valor de activación de cero significa daño completo. Hemos probado varios números de capas ocultas. Generalmente, la capacidad de una red neuronal es una función del número de capas ocultas, el número de unidades de procesamiento en cada capa y el patrón de conectividad entre capas [18]. En este estudio, se utiliza un patrón simple de conectividad: cada unidad de procesamiento tiene conexiones de salida con todas las unidades de procesamiento en la siguiente capa. La capacidad de la red neuronal está de alguna manera relacionada con la cantidad de información en los datos de entrenamiento y la complejidad del conocimiento contenido en esos datos. Actualmente, no hay reglas confiables para determinar la capacidad de una red neuronal de retropropagación de varias capas, ya que esta pregunta aún no se comprende bien.

4. CASO DE ESTUDIO

En este estudio de caso, se ha aplicado el método propuesto a un marco simple de tres pisos, como se muestra en la Fig. 3. El marco se modela como un 'edificio cortante', con vigas asumidas como infinitamente rígidas y las columnas siendo flexibles. La estructura tiene tres grados de libertad (traslaciones del piso) y las columnas en cada piso representan un miembro. La estructura fue sometida a una aceleración de base sísmica y la respuesta transitoria se calculó en el dominio del tiempo con el método de Newmark [19]. Los espectros de Fourier de los historiales temporales de aceleración relativa calculados del piso superior se utilizaron en el entrenamiento de la red neuronal.


El daño a los elementos se definió como una reducción en la rigidez del elemento. Se calcularon las respuestas dinámicas de la estructura en el tercer piso (piso superior) para varias condiciones de daño en los elementos. Para esta investigación, solo se "dañó" un miembro a la vez; el daño se representó mediante una reducción porcentual en la rigidez del miembro estructural, y el estado de daño del elemento se define como el porcentaje de retención de rigidez en la representación de salida de la red neuronal, es decir, si la estructura está intacta, el estado de daño se designa como 100%. Se realizó una Transformada Rápida de Fourier (FFT) en la respuesta transitoria de aceleración relativa para convertirla del dominio del tiempo al dominio de la frecuencia, y los espectros de Fourier discretizados de las aceleraciones relativas se utilizaron como datos de entrada en los conjuntos de datos de entrenamiento. La red neuronal seleccionada se entrenó con varios espectros de Fourier de aceleraciones relativas registradas en el piso superior para identificar el daño en los miembros estructurales, y el enfoque se muestra de manera esquemática en la Fig. 3. Las siguientes secciones describen el esquema para la representación de entrada y salida, la determinación de la arquitectura de la red y el entrenamiento y prueba de la red con más detalle.

4.1 Entrada y salida de la red neuronal.

La entrada a la red neuronal se tomó como los espectros de Fourier de las aceleraciones relativas registradas en el tercer piso (piso superior). Nótese que, para estructuras más complicadas, se tendrían que utilizar más acelerómetros para poder discernir el estado de daño correspondiente a un miembro estructural de otro. El propósito de esta investigación fue ilustrar la metodología basada en redes neuronales y demostrar que este enfoque podría desarrollarse para identificar el daño en los miembros. Sin embargo, estructuras más complicadas deberán ser investigadas en futuras investigaciones para determinar cómo se comporta este método en esos casos.

El espectro de Fourier registrado en el tercer piso se representó mediante un conjunto de 200 unidades de procesamiento, donde cada unidad representaba una parte del espectro de frecuencia. Por lo tanto, la entrada a la red neuronal consta de 200 unidades con niveles variables de valor de activación que representan las amplitudes del espectro de Fourier. La salida de la red neuronal es una identificación del alcance del daño para cada miembro en la estructura; las unidades con baja activación representan un daño grave de un miembro estructural y el valor de activación de 1.0 representa miembros estructurales no dañados en la estructura. Por lo tanto, la capa de salida de la red neuronal en esta investigación consistió en tres nodos, cada uno representando la condición de daño para cada miembro en la estructura.

4.2 Arquitectura de la red neuronal.

Como se mencionó anteriormente, se utilizó una arquitectura de red neuronal de retropropagación en esta investigación. En la sección anterior, se describieron las capas de entrada y salida. Se determinó que se usara una capa oculta con 10 nodos. La arquitectura final de la red neuronal, con una ilustración del esquema de representación para el estado de daño de los elementos estructurales, se muestra en la Fig. 4. Se descubrió a través de experimentos que si la capa oculta era demasiado pequeña, la red no convergía; si la red era demasiado grande, tampoco convergía. Con una capa oculta de 10 nodos, la red convergía y la modificación de la arquitectura cesaba en ese punto.

4.3 Entrenamiento de la red neuronal.

Se presentaron un total de 42 casos de entrenamiento (que consisten en 42 espectros de frecuencia de aceleración relativa registrados en el piso superior junto con la información que indica qué miembro está dañado y en qué medida está dañado) a la red neuronal de la siguiente manera:

  • ningún miembro estructural está dañado, es decir, todas las unidades de salida tienen niveles de activación cercanos a 1.0, para los seis diferentes terremotos utilizados como aceleraciones de base para la estructura (seis casos);
  • se asume que el miembro estructural 1 del primer piso está dañado en cierta medida, es decir, su rigidez se reduce en un 75% y un 50% (representado por niveles de activación de 0.25 y 0.50, respectivamente), para seis terremotos diferentes (12 casos);
  • el miembro estructural 2 del segundo piso está dañado en cierta medida, es decir, su rigidez se reduce en un 75% y un 50% para seis terremotos diferentes (12 casos);
  • el miembro estructural 3 del tercer piso está dañado en cierta medida, es decir, su rigidez se reduce en un 75% y un 50% para seis terremotos diferentes (12 casos).
En nuestra investigación sobre la modelización de materiales con redes neuronales [20,21], se descubrió que un entrenamiento incremental era más eficiente que simplemente presentar todo el conjunto de entrenamiento a la red de una vez. Los patrones de entrenamiento se presentaron a la red neuronal en etapas, comenzando con los espectros de respuesta en frecuencia correspondientes a ningún daño y al 50% de daño para todos los registros de terremotos, seguidos de aquellos correspondientes a casos de 75% de daño. Para que la red 'aprendiera' los primeros 24 casos, tomó 1280 épocas hasta la convergencia (una época se define como todas las operaciones necesarias para la alimentación directa y la retropropagación de error de todos los casos), con una tasa de aprendizaje de η = 0.2 y un error máximo permisible del 10%. Para el segundo conjunto de 18 casos, la red necesitó 1437 épocas adicionales. Como se puede ver en los resultados de entrenamiento mostrados en la Figura 5, la red fue capaz de aprender la relación entre los patrones de los espectros de respuesta en frecuencia y el estado de daño correspondiente de la estructura para identificar los 42 casos de daño cuando se entrenó en los espectros de Fourier de la aceleración relativa registrada en el piso superior.

4.4 Pruebas de la red neuronal.

Después de que la red fue entrenada con los 42 casos de entrenamiento, se probó para ver qué tan bien reconocería otros estados de daño, como aquellos correspondientes a un 60% de daño en el miembro estructural. Los resultados de estas pruebas se muestran en la Figura 6 y, como se puede ver en esta figura, la red pudo reconocer adecuadamente el daño del miembro estructural 3. Sin embargo, la red entrenada no pudo identificar adecuadamente el miembro dañado y reconocer el alcance del daño ocurrido para los miembros estructurales 1 y 2. Sin embargo, la red pudo detectar que se produjo daño en los tres casos, pero estaba confundida sobre si el miembro 1 o el miembro 2 estaba dañado. Aunque este error puede deberse a diversas causas, se sintió que esta incapacidad se debía probablemente a que a la red no se le proporcionó suficiente información para distinguir entre los estados de daño de los miembros estructurales. Norton [22] señaló que la selección de una ubicación adecuada para los transductores de medición o acelerómetros es de suma importancia para capturar correctamente las características de vibración de la estructura.

Para aumentar la información en la que se basa la identificación del elemento dañado, se decidió: (1) proporcionar a la red espectros de Fourier registrados en dos niveles de piso (el segundo y el tercero); (2) modificar la arquitectura de la red para que constara de dos conjuntos de entrada de 200 nodos (uno obtenido del segundo piso y otro del tercer piso) y dos capas ocultas; y (3) volver a entrenar la red. Se pensó que dos capas ocultas eran necesarias para poder buscar combinaciones (es decir, características) de las frecuencias en los espectros de Fourier registrados en los dos niveles de piso. El tamaño de las capas ocultas para el cual la red pudo converger resultó ser de ocho unidades en cada capa. Los resultados de entrenamiento para esta nueva red fueron casi idénticos a los mostrados en la Figura 5 y, por lo tanto, no se muestran aquí por razones de espacio. Sin embargo, los resultados de prueba de la nueva red cambiaron con respecto a los de la Figura 6 y se muestran en la Figura 7. Cabe destacar que la red, cuando se le proporcionó más información sobre el comportamiento dinámico de la estructura, pudo distinguir mejor entre los diversos estados de daño y pudo identificar al miembro estructural que experimentaba un daño del 60%. La red pudo identificar correctamente el daño en el primer y tercer miembro, pero aún no pudo identificar que el segundo miembro estructural estaba dañado en un 60%.

5. CONCLUSIONES

Con base en los estudios de caso presentados, se considera que el uso de redes neuronales para la evaluación de daños estructurales es una línea de investigación prometedora. Estos primeros resultados indican que las redes neuronales son capaces de aprender sobre el comportamiento de estructuras no dañadas y dañadas, así como de identificar el miembro dañado y la magnitud del daño a partir de patrones en la respuesta en frecuencia de la estructura. Sin embargo, existen algunas cuestiones que deben resolverse antes de que este enfoque se convierta en un método verdaderamente viable para la evaluación de daños estructurales.

En primer lugar, para estructuras complejas del mundo real, la red neuronal, después de un entrenamiento adecuado, debería poder distinguir entre los patrones de respuesta en frecuencia registrados en varios lugares de la estructura, de manera que el miembro dañado y su extensión de daño puedan identificarse.

En segundo lugar, se debe cuantificar la cantidad de información necesaria para entrenar una red neuronal, de modo que la red entrenada no solo aprenda los casos de entrenamiento, sino que también pueda generalizar con precisión a otros casos; es decir, ¿cuántas grabaciones de acelerómetros y en qué ubicaciones deben obtenerse para identificar de manera confiable los miembros estructurales dañados?

Para estructuras más complicadas, se anticipa que se deberán utilizar muchas más grabaciones de acelerómetros que las dos utilizadas en este estudio de caso. 

Finalmente, ¿cuántos estados de daño para cada miembro estructural deben presentarse a la red antes de que esta adquiera un rendimiento adecuado para todos los estados de daño de un solo miembro? Se anticipa, basándose en la capacidad de generalización de las redes neuronales, que solo varias variaciones del estado de daño para miembros estructurales clave seleccionados pueden ser suficientes para entrenar adecuadamente la red.

Investigaciones adicionales en esta área no solo deben abordar los problemas mencionados anteriormente, sino que también deben investigar el papel del ruido en las mediciones reales, la aplicación a estructuras grandes y complejas, y el uso de mediciones de pruebas de fuerza aplicada o pruebas de vibración ambiental.