La inteligencia artificial "lee" y "comprende" los trabajos de investigación

Investigadores de una startup entrenan una red neuronal para reconocer fórmulas químicas a partir de documentos de investigación

17.02.2022 - Rusia

Investigadores de Syntelly -una startup originada en Skoltech-, la Universidad Estatal Lomonosov de Moscú y la Universidad Sirius han desarrollado una solución basada en redes neuronales para el reconocimiento automático de fórmulas químicas en escaneos de documentos de investigación. El estudio se ha publicado en Chemistry-Methods, una revista científica de la Sociedad Europea de Química.

La humanidad está entrando en la era de la inteligencia artificial. La química también se verá transformada por los modernos métodos de aprendizaje profundo, que invariablemente requieren grandes cantidades de datos cualitativos para el entrenamiento de las redes neuronales.

La buena noticia es que los datos químicos "envejecen bien". Incluso si un determinado compuesto se sintetizó originalmente hace 100 años, la información sobre su estructura, propiedades y formas de síntesis sigue siendo relevante en la actualidad. Incluso en nuestra época de digitalización universal, puede ocurrir que un químico orgánico recurra a un artículo original de una revista o a una tesis de una colección de la biblioteca -publicada ya a principios del siglo XX, por ejemplo, en alemán- para obtener información sobre una molécula poco estudiada.

Los productos químicos tóxicos pueden detectarse con un nuevo método de IA

Se podría reducir el número de experimentos con animales, así como los costes económicos a la hora de desarrollar nuevos productos químicos

Leer noticia

La mala noticia es que no existe una forma estándar aceptada de presentar las fórmulas químicas. Los químicos acostumbran a utilizar muchos trucos en forma de notación abreviada para los grupos químicos conocidos. Por ejemplo, los posibles nombres de un grupo tert-butílico son "tBu", "t-Bu" y "tert-Bu". Para empeorar las cosas, los químicos suelen utilizar una plantilla con diferentes "marcadores de posición" (R1, R2, etc.) para referirse a muchos compuestos similares, pero esos símbolos marcadores de posición pueden definirse en cualquier parte: en la propia figura, en el texto del artículo o en los suplementos. Por no mencionar que los estilos de dibujo varían entre las revistas y evolucionan con el tiempo, los hábitos personales de los químicos difieren y las convenciones cambian. Como resultado, incluso un químico experto se encuentra a veces perdido tratando de dar sentido a un "rompecabezas" que ha encontrado en algún artículo. Para un algoritmo informático, la tarea parece insuperable.

Sin embargo, cuando lo abordaron, los investigadores ya tenían experiencia en abordar problemas similares con Transformer, una red neuronal propuesta originalmente por Google para la traducción automática. En lugar de traducir texto entre idiomas, el equipo utilizó esta potente herramienta para convertir la imagen de una molécula o una plantilla molecular en su representación textual. Dicha representación se denomina Functional-Group-SMILES.

Para auténtica sorpresa de los investigadores, la red neuronal demostró ser capaz de aprender casi cualquier cosa siempre que el estilo de representación pertinente estuviera representado en los datos de entrenamiento. Sin embargo, Transformer necesita decenas de millones de ejemplos para entrenarse, y recopilar a mano tantas fórmulas químicas de los artículos de investigación es imposible. Así que, en lugar de eso, el equipo adoptó otro enfoque y creó un generador de datos que produce ejemplos de plantillas moleculares combinando fragmentos de moléculas y estilos de representación seleccionados al azar.

"Nuestro estudio es una buena demostración del actual cambio de paradigma en el reconocimiento óptico de estructuras químicas. Mientras que las investigaciones anteriores se centraban en el reconocimiento de estructuras moleculares per se, ahora que disponemos de las capacidades únicas de Transformer y redes similares, podemos dedicarnos a crear generadores de muestras artificiales que imiten la mayoría de los estilos existentes de representación de plantillas moleculares. Nuestro algoritmo combina moléculas, grupos funcionales, fuentes, estilos, incluso defectos de impresión, introduce trozos de moléculas adicionales, fragmentos abstractos, etc. Incluso a un químico le cuesta decir si la molécula ha salido directamente de un papel real o del generador", dijo el investigador principal del estudio, Sergey Sosnin, que es el director general de Syntelly, una startup fundada en Skoltech.

Los autores del estudio esperan que su método constituya un paso importante hacia un sistema de inteligencia artificial que sea capaz de "leer" y "comprender" documentos de investigación en la medida en que lo haría un químico altamente cualificado.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Ivan Khokhlov et al.; "Image2SMILES: Transformer-Based Molecular Optical Recognition Engine"; Chemistry - Methods; 2022

https://www.quimica.es/noticias/1174826/la-inteligencia-artificial-lee-y-comprende-los-trabajos-de-investigacion.html

Publicación original

Ivan Khokhlov et al.; "Image2SMILES: Transformer-Based Molecular Optical Recognition Engine"; Chemistry - Methods; 2022

Temas

redes neuronales inteligencia artificial aprendizaje profundo

Ver todos

Organizaciones

Skolkovo Institute of Science and Technology

Syntelly

Algo está pasando en la industria química ...

Así es el verdadero espíritu pionero: Muchas start-ups innovadoras están aportando ideas frescas, savia nueva y espíritu emprendedor para cambiar el mundo del mañana a mejor. Sumérjase en el mundo de estas jóvenes empresas y aproveche la oportunidad de ponerse en contacto con los fundadores.

Descubra nuevas empresas ahora

Más del departamento ciencias Suscribirse al boletín

Reciba la química en su bandeja de entrada

La inteligencia artificial "lee" y "comprende" los trabajos de investigación

Investigadores de una startup entrenan una red neuronal para reconocer fórmulas químicas a partir de documentos de investigación

Los productos químicos tóxicos pueden detectarse con un nuevo método de IA

Publicación original

Una técnica de IA "descodifica" imágenes de microscopio, superando un límite fundamental

Más noticias del departamento ciencias

Una bacteria produce "lavavajillas orgánico" para degradar el petróleo

Un catalizador altamente reactivo permite etiquetar compuestos biológicamente activos

Las materias primas críticas de los electrolizadores vuelven al ciclo

Récord mundial de conductores de iones de litio

Una molécula única podría conducir a ordenadores más pequeños y eficientes

Almacenamiento de energía eléctrica: BAM, HZB y HU Berlin planean un laboratorio conjunto de baterías en Berlín

Fabricación ecológica de materiales híbridos como detectores de rayos X de alta sensibilidad

Los PFAS influyen en la respuesta inmunitaria celular al coronavirus

BAM desarrolla un material de referencia PFAS certificado a partir de ropa de exterior usada

Transformación del CO₂ en materiales esenciales

La clasificación de residuos mediante sensores reduce el número de incendios de baterías en las plantas de reciclaje

Nuevas investigaciones refuerzan la extracción de tierras raras

Mejora de la sostenibilidad de los plásticos con residuos de azufre

Un nuevo método de cribado acelera el diseño de baterías de estado sólido estables y de alto rendimiento

El efecto acordeón hace que el grafeno sea estirable

Níquel verde para una electrificación sostenible

Las sustancias químicas procedentes del uso de zapatillas de escalada causan problemas en las salas cubiertas

Brujería con "small data": la IA revoluciona el reciclaje de CO2 con modelos de "small data

Más fuerte y más seguro: la nueva estrategia de diseño para el aluminio combina la fuerza con la resistencia a la fragilización por hidrógeno

Importante avance en la química de los compuestos fluorados

Reciba la química en su bandeja de entrada

Noticias más leídas

Seguimiento preciso de la biodegradación del plástico

Un problema de hace 150 años resuelto con IA

Nuevo método para detectar nanoplásticos en fluidos corporales

Récord de eficiencia en células solares totalmente orgánicas

El tubo de ensayo más pequeño del mundo

Hidrógeno verde: un material estructurado en forma de jaula se transforma en un catalizador eficaz

Níquel verde para una electrificación sostenible

Un nuevo modelo predice el punto de no retorno de una reacción química

Un chatbot abre la química computacional a los no expertos

El elemento más pesado jamás estudiado químicamente

Cómo reciclar el CO2 de los gases de combustión

Cómo utilizar el metano y el CO2 para combatir la contaminación por plásticos

Más noticias de nuestros otros portales

Esperanza para los enfermos de cáncer: agente activo contra la metástasis

El fin de los iglús para terneros: ¿prohibición inminente en toda la UE?

Ajo silvestre: la confusión a menudo conduce a la intoxicación

Sabor 100% natural y 100% refrescante: Corona Cero - con 0,0% de alcohol

¿Peróxido de hidrógeno como objetivo en la lucha contra el cáncer?

Pequeñas cantidades de regaliz elevan la tensión arterial

Microbio del año 2023: Bacillus subtilis - para la salud y la tecnología

Casi el 40% de los alemanes opta por alternativas a la carne

Cómo reparan las células humanas el ADN dañado

No todas las fresas son iguales

Los investigadores encuentran que el alimento favorito de una enigmática bacteria intestinal

Conservación, encurtido y fermentación: Cómo conservar la fruta y la verdura durante mucho tiempo

Cómo afecta el ibuprofeno al metabolismo de las grasas en el cerebro

Estudio de los microbiomas de los fermentos de masa madre para mejorar la calidad y seguridad del pan

Clorotonil: un cambio de juego en la lucha contra los patógenos multirresistentes

10 cosas que no sabías sobre el café

El hedonismo conduce a la felicidad

Lo que el consumidor busca en el café

¿Cómo envejece el sistema inmunitario?

10 años de La Voz de los Niños: la historia del éxito de HARIBO

Algo está pasando en la industria química ...