La búsqueda de nuevas moléculas con propiedades específicas para crear medicamentos y materiales innovadores es un proceso complejo y costoso. Requiere una gran cantidad de recursos computacionales y meses de trabajo para reducir el inmenso universo de candidatos potenciales.
LLMs al rescate del descubrimiento molecular
Los modelos de lenguaje grandes (LLMs), como ChatGPT, podrían agilizar este proceso. Sin embargo, lograr que un LLM comprenda y razone sobre los átomos y enlaces que forman una molécula, de la misma manera que lo hace con las palabras que forman oraciones, ha sido un desafío científico considerable.
Investigadores del MIT y del MIT-IBM Watson AI Lab han creado un enfoque prometedor que complementa un LLM con otros modelos de aprendizaje automático conocidos como modelos basados en grafos, diseñados específicamente para generar y predecir estructuras moleculares.
Llamole: El LLM Multimodal para el diseño molecular
Su método emplea un LLM base para interpretar consultas en lenguaje natural que especifican las propiedades moleculares deseadas. Automáticamente alterna entre el LLM base y los módulos de IA basados en grafos para diseñar la molécula, explicar la lógica y generar un plan paso a paso para sintetizarla. Intercala texto, grafos y generación de pasos de síntesis, combinando palabras, grafos y reacciones en un vocabulario común para que el LLM lo consuma.
Este sistema, llamado Llamole (Large Language Model for Molecular Discovery), utiliza un LLM como puerta de entrada para entender la petición del usuario, que se expresa en lenguaje natural. Por ejemplo, se podría solicitar una molécula que pueda penetrar la barrera hematoencefálica e inhibir el VIH, dado que tiene un peso molecular de 209 y ciertas características de enlace.
A medida que el LLM predice texto en respuesta a la consulta, conmuta entre módulos de grafo. Un módulo utiliza un modelo de difusión de grafo para generar la estructura molecular condicionada a los requisitos de entrada. Un segundo módulo utiliza una red neuronal de grafo para codificar la estructura molecular generada de nuevo en tokens para que los LLM los consuman. El módulo de grafo final es un predictor de reacción de grafo que toma como entrada una estructura molecular intermedia y predice un paso de reacción, buscando el conjunto exacto de pasos para hacer la molécula a partir de bloques de construcción básicos.
Los investigadores crearon un nuevo tipo de token de activación que le indica al LLM cuándo activar cada módulo. Cuando el LLM predice un token de activación “diseño”, conmuta al módulo que esboza una estructura molecular, y cuando predice un token de activación “retro”, conmuta al módulo de planificación retrosintética que predice el siguiente paso de reacción.
Resultados prometedores
En comparación con los enfoques existentes basados en LLM, esta técnica multimodal generó moléculas que se ajustaban mejor a las especificaciones del usuario y eran más propensas a tener un plan de síntesis válido, mejorando la tasa de éxito del 5% al 35%.
También superó a los LLM que son más de 10 veces su tamaño y que diseñan moléculas y rutas de síntesis solo con representaciones basadas en texto, lo que sugiere que la multimodalidad es clave para el éxito del nuevo sistema.
Al final, Llamole genera una imagen de la estructura molecular, una descripción textual de la molécula y un plan de síntesis paso a paso que proporciona los detalles de cómo fabricarla, hasta las reacciones químicas individuales.
En experimentos que involucraron el diseño de moléculas que coincidían con las especificaciones del usuario, Llamole superó a 10 LLM estándar, cuatro LLM ajustados y un método específico de dominio de última generación. Al mismo tiempo, aumentó la tasa de éxito de la planificación retrosintética del 5% al 35% mediante la generación de moléculas de mayor calidad, lo que significa que tenían estructuras más simples y bloques de construcción de menor costo.
El futuro del diseño molecular impulsado por IA
Este avance podría ser una solución integral donde, de principio a fin, se automatice todo el proceso de diseño y fabricación de una molécula. Si un LLM pudiera simplemente dar la respuesta en unos segundos, sería un gran ahorro de tiempo para las compañías farmacéuticas.
En el futuro, los investigadores planean generalizar Llamole para que pueda incorporar cualquier propiedad molecular. Además, planean mejorar los módulos de grafo para aumentar la tasa de éxito de la retrosíntesis de Llamole.
A largo plazo, esperan utilizar este enfoque para ir más allá de las moléculas, creando LLM multimodales que puedan manejar otros tipos de datos basados en grafos, como sensores interconectados en una red eléctrica o transacciones en un mercado financiero.
Llamole demuestra la viabilidad de utilizar modelos de lenguaje grandes como una interfaz para datos complejos más allá de la descripción textual, y anticipamos que serán una base que interactúe con otros algoritmos de IA para resolver cualquier problema de grafo.
Fuente: MIT News – AI
Leave a Comment