Un nuevo sistema de IA extrae datos numéricos de textos académicos, liberando a los investigadores de tareas rutinarias

El marco Quinex estructura automáticamente los datos cuantitativos y está diseñado para ayudar a gestionar la creciente avalancha de datos

21.04.2026

Imagen simbólica

AI-generated image

Anuncios

Microscopio de imágenes Raman en 3D: Nano-analítica correlativa de alta resolución

Sonda de autosampler ICP de alta precisión con filtración de partículas

Escáner TC de alta tensión y alta resolución para inspección industrial no destructiva y análisis de fallos

Los números son el lenguaje de la ciencia, pero en los artículos de investigación a menudo quedan enterrados en el texto y son difíciles de analizar. Los investigadores de Jülich han desarrollado un sistema de IA que identifica automáticamente estos números, los clasifica y los convierte en datos estructurados. El marco Quinex elimina así la necesidad de un trabajo manual que lleva mucho tiempo.

Ya sea en el campo de la energía, el clima o la investigación de materiales, los artículos científicos están llenos de cifras o, más exactamente, de datos cuantitativos: eficiencias, temperaturas, costes, emisiones. A menudo son cruciales para mejorar los modelos o identificar tendencias. Al mismo tiempo, el número de publicaciones científicas crece rápidamente. Para muchas cuestiones de investigación, resulta prácticamente imposible evaluar manualmente todas las publicaciones pertinentes: el tiempo y los recursos necesarios serían enormes.

El marco Quinex ("Quantitative Information Extraction"), desarrollado por investigadores de Jülich, se basa en modelos lingüísticos y automatiza este proceso: La inteligencia artificial identifica los valores numéricos, los asigna a las unidades apropiadas y reconoce qué se midió, cuándo, dónde y cómo. Así, una frase como "Se presuponen niveles de eficiencia del 63% al 71% para 2025" se transforma en un conjunto de datos estructurado que contiene toda la información contextual pertinente, desde el año y el método de medición hasta la fuente.

Un agente de IA ayuda a identificar más rápidamente las propiedades de los materiales

Las mediciones de difracción de rayos X de alto rendimiento generan enormes cantidades de datos - El agente los hace utilizables más rápidamente

Leer noticia

IA abierta y eficiente

A diferencia de muchas soluciones de IA propietaria, Quinex se basa por completo en modelos lingüísticos abiertos, relativamente pequeños y, por tanto, eficientes. Estos han sido entrenados específicamente para reconocer y clasificar información cuantitativa en textos científicos. En comparación con sistemas similares, Quinex ofrece resultados más precisos, capta la información contextual de forma más matizada y también tiene en cuenta las características implícitas.

A pesar de su tamaño compacto, Quinex alcanza una precisión de reconocimiento (F1) de alrededor del 98 por ciento para números y unidades asociadas, y de aproximadamente el 87 y el 82 por ciento para la clasificación de propiedades y entidades cuantificadas. Estos elevados índices de precisión se lograron mediante conjuntos de datos de entrenamiento creados especialmente y mejoras metodológicas.

"Queríamos desarrollar una herramienta que fuera potente, pero también transparente y eficiente en cuanto a recursos", explica el Dr. Jann Weinand, jefe del Departamento de Escenarios Integrados de Jülich System Analysis. "Quinex hace que la inteligencia artificial sea más accesible para el análisis de datos en la ciencia".

Prueba práctica con éxito

Para probar la idoneidad práctica de Quinex, el sistema se aplicó a miles de resúmenes científicos de diversos campos. Extrajo con éxito datos sobre los costes de producción de electricidad de varias tecnologías energéticas, sobre la absorción máxima de oxígeno en humanos, sobre las magnitudes y localizaciones de terremotos y sobre los huecos de banda de los materiales fotovoltaicos.

Los valores obtenidos automáticamente se ajustaron perfectamente a los datos de referencia correspondientes. Esto demuestra que Quinex es idóneo para analizar grandes volúmenes de literatura académica en una amplia gama de campos de investigación y deducir tendencias fiables a partir de ellos.

Nuevas perspectivas para la investigación

"Los modelos lingüísticos abren nuevas perspectivas para la ciencia y ayudan a mantener una visión de conjunto de campos de investigación enteros", afirma el autor principal Jan Göpfert. "Permiten búsquedas bibliográficas automatizadas, la creación de bases de datos de investigación uniformemente estructuradas y análisis de tendencias que revelan la evolución de la ciencia y la tecnología en una fase temprana".

"Nuestro objetivo es aliviar a los investigadores del trabajo rutinario", afirma el Dr. Patrick Kuckertz, responsable del Grupo de Gestión de Datos de Investigación. "Quinex está diseñado para ayudarles a llegar a ideas más rápidamente y gestionar la creciente avalancha de datos en la ciencia".

Limitaciones y futuras mejoras

Quinex tampoco está totalmente libre de errores, pero la transparencia forma parte de su diseño. "El sistema reconoce los números y las unidades con gran fiabilidad", afirma Jan Göpfert. "Como están tomados directamente del texto, no se pueden 'alucinar'. Sin embargo, a veces se producen interpretaciones erróneas, por ejemplo cuando hay referencias importantes dispersas por el texto."

Así pues, Quinex sigue siendo una herramienta que apoya a las personas, pero no las sustituye. "Recomendamos utilizar Quinex cuando informa y alivia a los investigadores, pero la responsabilidad de interpretar los resultados sigue siendo suya", afirma Göpfert. Cada número reconocido puede rastrearse hasta su fuente y, cuando es posible, se resalta en el texto original.

El equipo está trabajando para seguir desarrollando Quinex con otros conjuntos de datos y modelos específicos de cada ámbito, para que sea aún más eficaz y lo suficientemente flexible como para adaptarse a las distintas necesidades de la investigación.

Bienvenida a la colaboración abierta

Forschungszentrum Jülich ofrece Quinex como un proyecto de código abierto.

Con ello se pretende dar a los investigadores de todo el mundo la oportunidad de probar, ampliar y adaptar el sistema a sus propios campos, desde la investigación energética hasta la química y la biomedicina.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Jan Göpfert, Patrick Kuckertz, Gian Müller, Luna Lütz, Celine Körner, Hang Khuat, Detlef Stolten, Jann Michael Weinand; "Quinex: Quantitative information extraction from text using open and lightweight LLMs"; The Innovation

https://www.quimica.es/noticias/1188534/un-nuevo-sistema-de-ia-extrae-datos-numericos-de-textos-academicos-liberando-a-los-investigadores-de-tareas-rutinarias.html

Publicación original

Temas

inteligencia artificial análisis de los datos investigación bibliográfica literatura técnica análisis de datos

Ver todos

Organizaciones

Forschungszentrum Jülich

Enlace relacionado

https://github.com/FZJ-IEK3-VSA/quinex

Anuncios

La cromatografía digital de membrana abre nuevos horizontes en el análisis de proteínas

Analizador de potencial zeta para superficies sólidas

Autoanalizador CFA de última generación: compacto y económico

Tan cerca que
incluso las moléculas
se vuelven rojas...

Fabricante de espectrómetros NIR

Más del departamento ciencias Suscribirse al boletín

Un nuevo sistema de IA extrae datos numéricos de textos académicos, liberando a los investigadores de tareas rutinarias

El marco Quinex estructura automáticamente los datos cuantitativos y está diseñado para ayudar a gestionar la creciente avalancha de datos

Un agente de IA ayuda a identificar más rápidamente las propiedades de los materiales

IA abierta y eficiente

Prueba práctica con éxito

Nuevas perspectivas para la investigación

Limitaciones y futuras mejoras

Bienvenida a la colaboración abierta

Publicación original

Una start-up de IA ayuda a las empresas a utilizar sus datos para tomar la mejor decisión posible en cualquier circunstancia

Más noticias del departamento ciencias

Una nueva base de materias primas para la industria química

La naturaleza como modelo para el almacenamiento sostenible de hidrógeno

Nuevas soluciones al problema de los PFAS

Fertilizantes de la zona: cuando las plantas de amoníaco locales resultan rentables

Las empresas de suministro energético como proveedores de materias primas: la geotermia suministrará litio para baterías

La química de interfaces de precisión permite que las células solares de perovskita superen el 26 % de eficiencia

La personalidad del fundador determina cómo las empresas emergentes superan las crisis

Moléculas tridimensionales mediante una «cascada de dominó»

Este material obtiene agua potable del aire y enfría con mayor eficiencia que los sistemas actuales

Éxito en la investigación para el desarrollo de un nuevo antibiótico de reserva

Micelio fúngico en lugar de resina epoxi: se ha desarrollado una placa de circuito impreso compostable

Los investigadores observan cómo se desarrolla la reacción química átomo a átomo

La Universidad Técnica de Berlín y la BAM crean un instituto conjunto dedicado a la ingeniería de procesos segura, digital y sostenible

Las bacterias transforman el uranio en un compuesto químico estable

Baterías «habladoras»: unos investigadores desarrollan un nuevo sistema de comunicación

Los residuos se convierten en materia prima

La luz láser controla las estructuras moleculares

Las ondas ultrasónicas abren las jaulas supramoleculares y liberan el fármaco anticancerígeno cisplatino

Imágenes magnéticas: las microflores aumentan el campo magnético local

Las máquinas moleculares programables están cada vez más cerca

Noticias más leídas

Las botellas de plástico podrían cobrar nueva vida en las baterías en forma de grafito

Este material obtiene agua potable del aire y enfría con mayor eficiencia que los sistemas actuales

Escenarios para una nueva «era del hierro»: el hierro complementa al hidrógeno como fuente de energía

La inteligencia artificial analiza los espectros químicos en cuestión de minutos

Una nueva tecnología de membranas podría transformar el procesamiento de hidrocarburos al reducir drásticamente el consumo de energía

Unos investigadores descubren una vía de síntesis inesperada: una nueva vía para obtener metano climáticamente neutro

Más noticias de nuestros otros portales

¿Los sustitutos del azúcar afectan a la salud intestinal y al metabolismo?

Según el informe, una de cada cinco tazas de café contiene residuos tóxicos de pesticidas

Menos experimentos con animales gracias al ratón virtual

Friesland-Campina amplía la capacidad de producción de su planta de mantequilla en Lochem

El microcosmos de la esponja de cocina: la contaminación bacteriana no siempre se ve, se huele ni se nota al tacto

Sensores cuánticos para detectar fraudes alimentarios directamente en el supermercado

Inducción de la muerte celular en las células cancerosas del páncreas

Puede que no se trate sólo de lo que contienen los alimentos ultraprocesados, sino de cómo se elaboran

Los PFAS presentes en los medicamentos suelen poder sustituirse por alternativas

Los complementos alimenticios a base de levadura podrían constituir una estrategia nutricional segura para reforzar la inmunidad frente al cáncer

INNEXIS adquiere el Life Science Campus Kundl a Novartis

Un avance decisivo en el diseño de enzimas a medida

Primera biotecnología europea con tecnología CAR-T y LNP bajo un mismo techo

Tan cerca que incluso las moléculas se vuelven rojas...

Tan cerca que
incluso las moléculas
se vuelven rojas...