En las noticiasNoticias en los mediosAprendizaje automático en farmacia

En las noticias | 5 de diciembre de 2023

Seis formas en que el aprendizaje automático transformará el ciclo de vida biofarmacéutico

Daniel Tabas, científico de datos sénior de IDBS, analiza el potencial transformador de la IA en la industria biofarmacéutica. Con un descubrimiento de fármacos más rápido, un diseño de experimentos más ágil, un intercambio de datos eficiente y mucho más en juego, explica por qué inculcar una gestión de datos adecuada y prácticas relacionadas con la IA puede suponer una gran diferencia en la investigación y el desarrollo de fármacos.
Más información en este artículo, publicado originalmente en Redes tecnológicas. Compartido aquí con permiso.

Las herramientas de inteligencia artificial (IA) generativa, como GPT-4 para texto y Midjourney para imágenes, han asombrado al público en el último año. Mucha gente simplemente desconocía el potencial de la inteligencia artificial - y aprendizaje automático (ML) en particular- para remodelar las industrias.

En la industria biofarmacéutica, el aprendizaje automático ya está cambiando desarrollo de fármacos y la producción. En la próxima década, acelerará el ciclo de vida biofarmacéutico al hacer más eficientes los procesos y democratizar los conocimientos. Sin embargo, para lograr estos avances tan esperados será necesario un cambio de paradigma en lo que significa gestionar bien los datos.

Aquí hay cuatro maneras en que la IA y ML están acelerando el ciclo de vida biofarmacéutico y dos grandes formas en que las empresas están empezando a pensar en sus datos de manera diferente.

Acelerar el descubrimiento de fármacos

Es engañoso afirmar que los ordenadores puedan llegar a ser inteligentes del mismo modo que los humanos, ya que los cerebros y las máquinas procesan la información de forma muy diferente. Pero en aspectos concretos, la inteligencia artificial ya está superando la capacidad humana, sobre todo cuando se trata de detectar patrones en enormes conjuntos de datos.

Por ejemplo, algunos modelos de IA pueden resumir y analizar textos científicos mejor que los sistemas tradicionales de procesamiento del lenguaje natural y órdenes de magnitud más rápido que los humanos. Estos modelos podrían utilizarse, por ejemplo, para encontrar posibles nuevas asociaciones entre fármacos y enfermedades. Otros modelos, centrados en la estructura química, pueden optimizar automáticamente el diseño de moléculas, mejorando propiedades como la afinidad de unión o la toxicidad.

Mejorar el diseño experimental

Una vez desarrollados los nuevos fármacos, averiguar cómo producirlos de la manera más eficiente también es un reto que requiere mucho tiempo.

Cuando se utiliza un biorreactor para crear una proteína terapéutica a partir de un cultivo celular, las variables a tener en cuenta incluyen las materias primas, la temperatura y la presión. Ajustar los niveles de cada variable para optimizar el rendimiento suele implicar mucho ensayo y error. Los científicos dedicados al desarrollo de procesos ajustan minuciosamente las variables una por una: una temperatura más alta hace que las células crezcan más deprisa, pero si hace demasiado calor se atascan, por ejemplo.

Con cientos de parámetros y múltiples cultivos celulares a tener en cuenta, este trabajo puede ser laborioso, lento e ineficaz. Ahora, con herramientas de análisis avanzadas, el análisis multivariante puede reducir rápidamente el puñado de variables más importantes e identificar cómo se relacionan entre sí: la temperatura, por ejemplo, puede afectar al pH. A continuación, las técnicas de aprendizaje automático pueden generar diseños experimentales y recomendar exactamente qué experimentos realizar -y en qué orden- para averiguar los mejores valores de cada uno.

Racionalización de los procesos de producción

La modelización del diseño experimental es una parte importante de las primeras etapas de la producción. A lo largo de la optimización y definición del proceso de producción, es fundamental captar una imagen completa de los datos generados en el desarrollo. Sólo registrando cómo interactúan el proceso y el producto -y eliminando el sesgo hacia los datos de "éxito"- podremos empezar a ver todas las ventajas de la IA y otros análisis avanzados para la optimización de procesos.

Los medicamentos deben producirse de forma constante para garantizar su pureza y potencia, y cuando se pasa de pequeños biorreactores a tanques de un millón de litros, los errores que comprometen estos factores son mucho más dispendiosos. Aquí es donde La IA puede ayudar para ahorrar tiempo y dinero en la fabricación de medicamentos.

Se pueden crear gemelos digitales de biorreactores que hagan uso del aprendizaje automático, incluso antes de iniciar las ejecuciones reales, para optimizar el proceso. A medida que cambia la escala, cambian las condiciones en el interior del biorreactor, pero la realización de pruebas virtuales puede anticipar estas variaciones, lo que supone un importante ahorro de tiempo. Sin embargo, los técnicos tienen que detectar inmediatamente los valores atípicos. Eso significa saber desde el principio qué niveles están dentro del alcance. Para identificar los niveles óptimos, los científicos de datos pueden promediar docenas de ejecuciones en un biorreactor a pequeña escala, crear modelos utilizando esas ejecuciones y luego probar los modelos para identificar objetivos exactos para cada variable.

Democratizar los conocimientos

Mediante el análisis de enormes conjuntos de datos y la predicción de patrones, la IA y el ML ya están acelerando la investigación y el desarrollo tempranos, el diseño de la producción de fármacos y el proceso de fabricación a escala. También están acelerando el ciclo de vida biofarmacéutico de otra forma: haciendo más accesibles los conocimientos.

En el pasado, las personas que trabajaban en el banco tenían que confiar en los equipos de ciencia de datos tanto para adquirir los datos como para interpretarlos. Ahora, estos equipos de ciencia de datos ayudan a crear herramientas que permiten a los usuarios extraer información perspicaz, derivada de los datos originales, y crear cuadros de mando para una interpretación aún más sencilla.

En el laboratorio y en la fábrica, el aprendizaje automático puede simplificar los cuadros de mando identificando las variables más importantes y cómo interactúan. En lugar de supervisar 20 parámetros, los técnicos pueden supervisar un gráfico que muestra la desviación de la trayectoria correcta, lo que ahorra tiempo y mejora los resultados.

Para los directivos, las técnicas de aprendizaje automático pueden proporcionar más visibilidad entre silos. Muchos equipos almacenan trabajos de investigación o notas en la nube, y grandes modelos lingüísticos como GPT-4 puede resumir estos documentos o analizarlos en busca de palabras clave. Así, los gestores pueden detectar equipos que trabajan en problemas similares y facilitar el intercambio de información.

Redefinir qué datos importan

Todos estos avances, sin embargo, requieren nuevas formas de pensar sobre los datos; el dicho "el proceso es el producto" nunca ha sido más cierto. Por un lado, los modelos de aprendizaje automático son tan inteligentes como los datos con los que se entrenan.

Tome un modelo que analice automáticamente la pureza celular utilizando datos de citometría de flujo en su proceso de desarrollo de fármacos. Para que el modelo categorice las muestras, los humanos necesitan etiquetar un lote inicial. Para que el modelo sea preciso, ese primer lote debe estar equilibrado; debe contener aproximadamente tantas muestras celulares de alta pureza como de baja pureza. Esto también es cierto cuando hay múltiples variables en juego. Por ejemplo, un modelo diseñado para detectar valores atípicos en cribados de alto rendimiento necesitará muchos ejemplos de diversos tipos de valores atípicos.

Para producir buenos datos de formación es necesario un cambio de mentalidad. En el pasado, la norma era dar con un proceso que funcionara y luego ampliarlo sin comprender en profundidad por qué funcionaba. Muchos equipos se centraban en el seguimiento de los éxitos y a menudo descartaban los datos de los "fracasos". Del mismo modo, los investigadores a menudo sólo publicaban los experimentos exitosos y no se molestaban en enviar los resultados nulos para su revisión por pares. Ahora, los valores atípicos y los errores son valiosos; esos datos son necesarios para crear modelos precisos. Los equipos necesitan un plan para recopilar conjuntos de datos equilibrados o para generar datos de fallos sintéticamente.

Cambiar la forma de almacenar los datos

Además de cambiar qué datos importan, el aprendizaje automático también está cambiando cómo deben almacenarse los datos. Para muchas empresas, este suele ser el mayor reto.

Los científicos de datos pueden trabajar con datos estructurados y no estructurados, imágenes, documentos, lecturas de dispositivos IoT y mucho más. Pero para utilizar esos conjuntos de datos, necesitan poder encontrarlos. Para que sean accesibles, los datos deben ser accesibles mediante un sistema a veces conocido como columna vertebral de datos. También deben ir acompañados de metadatos y contexto claros, para que los científicos de datos sepan lo que están viendo.

Los datos lo suficientemente organizados como para que la IA pueda interpretarlos también ofrecen otras ventajas. Los datos organizados ahorran tiempo a los científicos de datos, que pueden centrarse en proyectos de más alto nivel. También puede permitir modelos de aprendizaje automático plug-and-play que los usuarios finales pueden aplicar de forma independiente, democratizando aún más los conocimientos. Por último, puede revelar relaciones ocultas entre silos y ayudar a los equipos anteriores y posteriores a transferir información más fácilmente.

El aprendizaje automático transformará el ciclo de vida biofarmacéutico

Figura 1: Tipos de datos para capturar el contexto experimental significativo necesario para liberar el poder de los modelos AI/ML.

Implantar una nueva estrategia de gestión de datos es una gran empresa. Pero en el camino, las empresas probablemente tropezarán con eficiencias sorprendentes y descubrirán cosas que no habrían descubierto por sí solas. Dado lo mucho que la IA y el ML pueden acelerar el tiempo de comercialización, la inversión merece la pena.

Sobre el autor

aprendizaje automático en farmaciaDaniel Tabas trabaja como científico de datos senior en el grupo Data Science & Analytics de IDBS. Es un informático con un doctorado en Bioinformática, especializado en ciencia de datos, analítica e inteligencia artificial, y con amplia experiencia en los dominios biomédico/biofarmacéutico. Después de obtener su licenciatura en Informática en la Universidad Complutense de Madrid, se unió al Centro Nacional de Biotecnología, donde trabajó en un grupo de la instalación central, mientras que completó su doctorado en Bioinformática. Posteriormente, trabajó en PerkinElmer como ingeniero principal de IA.

Acerca del IDBSPóngase en contacto con nosotros