La IA reconstruye moléculas a partir de fragmentos que explotan

Los investigadores entrenaron una red neuronal que puede utilizar el momento iónico para trabajar hacia atrás y predecir la geometría previa a la explosión de una molécula

23.03.2026
Illustration: Greg Stewart/SLAC National Accelerator Laborator

Los investigadores entrenaron un nuevo modelo de Al para reconstruir estructuras tridimensionales de moléculas a partir de la información captada al hacerlas estallar con potentes rayos X.

Investigadores del Laboratorio Nacional de Aceleradores SLAC (Estados Unidos), el XFEL europeo e instituciones colaboradoras han creado recientemente un modelo generativo de IA capaz de recrear estructuras moleculares a partir del movimiento de los iones de la molécula tras ser destruida por rayos X, una técnica denominada imagen de explosión de Coulomb. Los datos del instrumento Small Quantum Systems (SQS) del XFEL europeo han sido cruciales para demostrar la aplicabilidad de este método recién desarrollado.

La investigación, publicada en Nature Communications, es un paso importante para poder tomar instantáneas de las moléculas durante las reacciones químicas, un avance que podría tener importantes repercusiones en la medicina y la industria. El modelo de aprendizaje automático predijo con exactitud las geometrías de una serie de moléculas de menos de diez átomos, lo que allana el camino para aplicar la técnica a moléculas más grandes. "Estábamos muy entusiasmados", afirma Xiang Li, científico asociado de la Fuente de Luz Coherente Linac (LCLS) del SLAC y autor principal del estudio. "Es el primer modelo de IA construido para la reconstrucción de estructuras moleculares a partir de imágenes de explosiones de Coulomb". Rebecca Boll, científica del instrumento SQS y coautora del trabajo, añadió: "Reconstruir una molécula explotada en el espacio real a partir de los momentos registrados es muy difícil. La inteligencia artificial puede ayudarnos a conseguirlo".

Una nueva forma de ver moléculas

En la actualidad, las opciones para obtener imágenes de moléculas aisladas en fase gaseosa son limitadas. Con la microscopía electrónica, por ejemplo, los objetos deben fijarse en su lugar, lo que hace imposible obtener imágenes de moléculas que flotan libremente. Y para que las técnicas basadas en la difracción funcionen, la muestra de moléculas debe ser lo suficientemente densa como para generar una señal intensa en el detector. La imagen resultante es técnicamente una media de muchas moléculas, lo que impide a los investigadores estudiar detalles que sólo son visibles cuando se toman imágenes de moléculas aisladas.

En el artículo, los investigadores se centraron en la formación de imágenes por explosión de Coulomb. En esta técnica, un pulso de rayos X golpea una molécula aislada en una cámara de vacío, arrancando los electrones de la molécula. Esto deja iones positivos que se repelen entre sí de forma explosiva y chocan contra un detector. El detector capta su momento, que puede utilizarse para reconstruir la estructura de la molécula. "Esta técnica tiene la capacidad de aislar pequeños detalles que son relevantes desde el punto de vista químico", afirma James Cryan, subdirector interino de ciencia, investigación y desarrollo del LCLS y coautor del artículo.

"Anteriormente habíamos utilizado con gran éxito la imagen de explosión de Coulomb en el SQS", afirma Michael Meyer, coautor y científico principal del instrumento europeo XFEL. "Pero a menudo, hasta ahora ha sido inviable hacer una reconstrucción real de la geometría molecular debido a las limitaciones informáticas". Aunque el pulso de rayos X elimina rápidamente los electrones, los iones restantes no explotan instantáneamente. Durante este breve retardo, los átomos pueden desplazarse ligeramente, lo que dificulta la reconstrucción de la estructura original utilizando la ley de Coulomb para las fuerzas electrostáticas. "No será exacto porque el uso simple de esa ley sólo funciona si el proceso de carga es instantáneo", explica Li.

Para complicar aún más las cosas, cada átomo adicional en la molécula añade un nivel exponencial de complejidad. "Resulta muy complicado trabajar hacia atrás para obtener la estructura original", explica Phay Ho, físico del Laboratorio Nacional de Argonne (Estados Unidos) y coautor del estudio. Es como romper un vaso e intentar recomponerlo a partir de los trozos que se desprendieron". Muchos problemas de la física y la química modernas implican reconstruir estructuras ocultas a partir de mediciones indirectas. Este trabajo demuestra cómo la IA puede ayudar a abordar esos problemas inversos."

Aprendizaje automático de estructuras moleculares

El equipo de investigación se propuso construir un modelo de aprendizaje automático que pudiera superar esta limitación informática. Desarrollaron y entrenaron el modelo en la Instalación de Datos Científicos Compartidos (S3DF) del SLAC. Los modelos de IA generativa son idóneos para esta tarea porque "piensan" de forma diferente a una simulación informática estándar. En lugar de trabajar con una serie de ecuaciones, aprenden encontrando patrones en los datos de entrenamiento. A continuación, utilizan esos patrones para hacer predicciones estadísticas.

Para reunir los datos de entrenamiento, el equipo recurrió a una simulación creada por Ho. La simulación analiza estructuras moleculares y calcula el momento de sus iones tras una explosión de Coulomb. Tras más de un mes de funcionamiento, la simulación, que requiere un gran esfuerzo informático y utiliza ecuaciones de mecánica cuántica y física clásica, generó un conjunto de datos de 76.000 muestras moleculares.

Al principio, los investigadores entrenaron la IA sólo con este conjunto de datos, que es pequeño para los estándares de entrenamiento de IA, y descubrieron que el modelo predecía estructuras inexactas a partir de los datos de la explosión. Así que repitieron el entrenamiento añadiendo otro conjunto de datos obtenido exclusivamente a partir de la física clásica. El segundo conjunto era menos preciso, pero unas 100 veces mayor que el primero.

Este entrenamiento en dos pasos fue el truco para predecir estructuras precisas.

Los investigadores probaron el modelo de IA pidiéndole que predijera estructuras moleculares en una parte de los datos de simulación que no había visto en el entrenamiento. El modelo, que el equipo bautizó como MOLEXA (abreviatura de "molecular structure reconstruction from Coulomb explosion imaging"), tomó los momentos de los iones y calculó las estructuras más probables. "Descubrimos que este proceso de entrenamiento en dos pasos suprimía el error de predicción en un factor de dos", afirma Li.

A continuación, el equipo probó MOLEXA con conjuntos de datos experimentales registrados en SQS. Entre las moléculas que probaron estaban el agua, el tetrafluorometano y el etanol. Introdujeron los momentos iónicos experimentales en el modelo, reconstruyeron las estructuras moleculares y compararon las reconstrucciones con las estructuras conocidas del Instituto Nacional de Normalización y Tecnología.

Comprobaron que las predicciones coincidían en gran medida con las estructuras establecidas. En general, los enlaces estaban en los lugares correctos, con sólo ligeras variaciones en sus ángulos. En general, los errores de posición eran inferiores a la mitad de la longitud de un enlace químico típico. "La mayoría de las veces, el modelo lo hace mejor que eso", añade Li. "Es sólo un punto de partida para futuras investigaciones, que no sólo mejorarán la precisión del modelo, sino que también ampliarán su aplicabilidad a sistemas moleculares más grandes".

Ampliación a moléculas y reacciones químicas de mayor tamaño

"Experimentos como el de las imágenes de explosión de Coulomb suelen generar una cantidad abrumadora de datos difíciles de interpretar", explica Serguei Molodtsov, director científico del XFEL europeo. "Empleando inteligencia artificial para analizar estos datos, podemos ampliar el alcance de los experimentos que es factible realizar en nuestras instalaciones, permitiendo a nuestros usuarios explorar estudios que antes se consideraban demasiado complejos." En el futuro, los investigadores planean ampliar el número de átomos que el modelo de aprendizaje automático puede reconstruir y aplicar el modelo a experimentos con resolución temporal en el LCLS y el XFEL europeo. De este modo, los investigadores podrán reconstruir instantáneas de moléculas en movimiento y crear películas moleculares similares a las de un libro de bolsillo que permitan comprender cómo se desarrollan las reacciones químicas.

El equipo también está probando la capacidad del modelo para reconstruir moléculas a partir de datos incompletos. La mayoría de las veces, el detector no detecta un ion producido en la explosión de Coulomb. Li quiere saber, por ejemplo: ¿Puede la IA reconstruir una molécula de etanol si uno o varios de sus iones de hidrógeno no se registran en el detector?

Si se resuelven estos problemas, la técnica podría ser más aplicable en la investigación biológica y química. Las proteínas, por ejemplo, pueden estar formadas por miles de átomos. "Ése es realmente el objetivo", afirma Li. "Podremos estudiar sistemas más relevantes desde el punto de vista biológico o industrial".

En el equipo también participaron investigadores del Instituto PULSE de Stanford, la Universidad de Stanford, la Universidad Estatal de Kansas, el Instituto Max Planck de Física Nuclear (Alemania), el Instituto Fritz Haber (Alemania) y la Universidad de la Sorbona (Francia).

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Tan cerca que
incluso las moléculas
se vuelven rojas...