El comportamiento de animales de laboratorio es estudiado usualmente por medio de la observación directa, utilizando catálogos de conductas predefinidas. El uso de videocámaras y otros métodos de registro han permitido determinar tipo y duración de eventos y evitar posibles efectos subjetivos del observador en la recolección de los datos. Sin embargo la determinación de eventos en señales derivadas de sensores de alta precisión como los acelerómetros, es muy difícil de lograr por inspección, por lo cual es necesario entrenar métodos de clasificación usando datos sincronizados, segmentados manualmente, de series derivadas de videograbaciones, además de los datos de acelerómetros.
Se recolectaron los datos tanto de video como registros de acelerómetros colocados en codornices japonesas para crear una database de comportamientos que se utilizan para entrenar algoritmos de tipo red neuronal de clasificación. Esta red es capaz de encontrar eventos poco frecuentes.
Se estudió la optimalidad de una red neuronal Long Short Time Memory (LSTM) entrenada con nuestros datos, los cuales son series multivariadas de las coordenadas espaciales del acelerómetro (aX, aY, aZ) medidas cuando éste es colocado sobre el cuerpo del animal , permiten almacenar información traducible en la diversidad de comportamientos mediante el análisis de señales generadas por el propio movimiento y por la acción de la gravedad.
Una característica de este tipo de red es que la información puede permanecer introduciendo bucles en el diagrama, por lo que pueden recordar estados previos y utilizar esta información para decidir cuál será el siguiente paso. Esto las hace muy adecuadas para manejar series de tiempo, como estas relacionadas al comportamiento animal.
Se entrenó una unidad LSTM con una puerta de entrada, una capa LSTM seguida de una capa fully connected, una capa softmax y por último una capa de clasificación. La capa de entrada tiene tamaño 3, ya que para secuencias vectoriales se define como un escalar positivo correspondiente al número de características. La capa LSTM tiene 20 unidades ocultas con modo de salida que devuelve la secuencia completa. Tenga en cuenta que no es necesario especificar la longitud de la secuencia con la que se trabajará.
Al momento de entrenar la red se seleccionaron los hiperparámetros de descenso por el gradiente estocástico para el solver, un valor de 0.80 para la contribución del paso anterior, notar que la contribución es un valor escalar entre 0 y 1. Además como tasa de aprendizaje inicial del entrenamiento se tomo 0.5 y un umbral de degrado del gradiente igual a 2, consiguiendo una buena clasificación del 97.5%