Comunicaciones

Resumen

Sesión Aplicaciones de la Matemática y Física Matemática

Redes neuronales en mecánica no holónoma

Leandro Martin Salomone

Universidad Nacional de La Plata, Argentina   -   Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

La formulación lagrangiana de la mecánica es una de las teorías más utilizadas (junto con la formulación hamiltoniana) para describir un sistema físico clásico. El ingrediente fundamental de la misma es la función Lagrangiana $L:TQ\rightarrow Q$, donde $Q$ es el espacio de configuraciones del sistema y $TQ$ el espacio de las posibles velocidades, es decir, el fibrado tangente a $Q$. El principio variacional de Hamilton establece que una curva $q(t)$ en $Q$ es una trayectoria del sistema físico si y solo si es extremal de la funcional acción $S[q(t)]=\int_{t_0}^{t_1}L\left(q(t),\dot q(t)\right) {\rm d} t$. No es difícil ver que esto impone un sistema de ecuaciones diferenciales de segundo orden sobre $q(t)$, llamadas ecuaciones de Euler-Lagrange del sistema: \begin{align} \frac{{\rm d}}{{\rm d} t}\frac{\partial L}{\partial \dot q}\left(q(t),\dot q(t)\right)-\frac{\partial L}{\partial q}\left(q(t),\dot q(t)\right)=0.\label{EL} \end{align}

Estas ecuaciones describen satisfactoriamente la dinámica de las trayectorias de sistemas sin vínculos. Sin embargo, si sobre el sistema se impone un conjunto de vínculos cinemáticos no holónomos dados por $\Phi(q,\dot q)=0$, las ecuaciones que describen adecuadamente la evolución del sistema se deducen del principio variacional de D'Alembert, que a su vez conduce a las ecuaciones de Lagrange-D'Alembert \begin{equation} \left\{ \begin{array}{ll} \frac{{\rm d}}{{\rm d} t}\frac{\partial L}{\partial \dot q}\left(q(t),\dot q(t)\right)-\frac{\partial L}{\partial q}\left(q(t),\dot q(t)\right)=\lambda(t)\frac{\partial \Phi}{\partial \dot q}\left(q(t),\dot q(t)\right),\\ \Phi\left(q(t),\dot q(t)\right)=0.\label{LD} \end{array} \right. \end{equation} donde las funciones $\lambda$ son los multiplicadores de Lagrange.

Por otra parte, las redes neuronales son modelos computacionales basados en el funcionamiento de un cerebro humano. Existe una gran variedad de arquitecturas y diseños posibles, dentro de las cuales destacan las feed-forward neural networks. Estas últimas constan de una capa inicial de $m$ neuronas seguida de un número de capas intermedias dependientes de parámetros $w$ llamados pesos y una capa final de $k$ neuronas. El objetivo de la red es aproximar una función $f:\mathbb{R}^m\rightarrow\mathbb{R}^k$ mediante el entrenamiento de los pesos $w$.

En los últimos años se han propuesto distintas versiones de redes para aprender el Lagrangiano y el Hamiltoniano de un sistema mecánico a partir de los datos $q, \dot q$ que determinan completamente $\ddot q$ a partir de las ecuaciones $(1)$. A diferencia de las redes baseline diseñadas para aprender directamente el campo de aceleraciones del sistema, las trayectorias generadas a partir del Lagrangiano aprendido por estas redes neuronales Lagrangianas, exhiben mejoras en cuanto al comportamiento de la energía a lo largo del tiempo.

En este trabajo proponemos una red neuronal no holónoma, que utiliza como criterio de aprendizaje la Ec. $(2)$, en lugar de la Ec. $(1)$, que resulta ser más apropiada para aprender el Lagrangiano de un sistema con vínculos no holónomos, discutimos su aplicación en algunos ejemplos clásicos y comparamos los resultados con los de una red neuronal Lagrangiana sin vínculos.

Trabajo en conjunto con: Viviana Díaz (Universidad Nacional del Sur) y Marcela Zuccalli (Universidad Nacional de La Plata).

Ver resumen en PDF