NotizieNotizie nei mediaL'apprendimento automatico nel settore farmaceutico

Nelle notizie | 5 dicembre 2023

Sei modi in cui l'apprendimento automatico trasformerà il ciclo di vita biofarmaceutico

Daniel Tabas, Senior Data Scientist di IDBS, parla del potenziale di trasformazione dell'IA nel settore biofarmaceutico. Con una scoperta più rapida dei farmaci, una progettazione più snella degli esperimenti, una condivisione efficiente dei dati e molto altro ancora, spiega perché l'inculcazione di una corretta gestione dei dati e di pratiche legate all'IA può fare la differenza nella ricerca e nello sviluppo dei farmaci.
Maggiori informazioni in questo articolo, pubblicato originariamente su Reti tecnologiche. Condiviso qui per autorizzazione.

Gli strumenti di intelligenza artificiale generativa (AI), come GPT-4 per il testo e Midjourney per le immagini, hanno stupito il pubblico nell'ultimo anno. Molte persone non erano semplicemente a conoscenza del potenziale dell'intelligenza artificiale - e apprendimento automatico (ML) in particolare - per rimodellare le industrie.

Nell'industria biofarmaceutica, l'apprendimento automatico sta già cambiando sviluppo del farmaco e produzione. Nel prossimo decennio, accelererà il ciclo di vita biofarmaceutico rendendo i processi più efficienti e democratizzando le conoscenze. Per ottenere questi progressi tanto attesi, tuttavia, sarà necessario un cambiamento di paradigma in ciò che significa gestire bene i dati.

Ecco quattro modi in cui l'IA e il ML stanno accelerando il ciclo di vita biofarmaceutico e due grandi modi in cui le aziende stanno iniziando a pensare ai loro dati in modo diverso.

Accelerare la scoperta di farmaci

È fuorviante affermare che i computer potranno mai essere intelligenti come gli esseri umani, poiché il cervello e le macchine elaborano le informazioni in modo molto diverso. Tuttavia, in modi mirati, l'intelligenza artificiale sta già superando le capacità umane, in particolare quando si tratta di individuare modelli in enormi serie di dati.

Ad esempio, alcuni modelli di IA sono in grado di sintetizzare e analizzare testi scientifici meglio dei tradizionali sistemi di elaborazione del linguaggio naturale e con una velocità superiore di alcuni ordini di grandezza rispetto agli esseri umani. Questi modelli potrebbero essere utilizzati, ad esempio, per trovare potenziali nuove associazioni farmaco-malattia. Altri modelli, incentrati sulla struttura chimica, possono ottimizzare automaticamente la progettazione delle molecole, migliorando proprietà come l'affinità di legame o la tossicità.

Migliorare il disegno sperimentale

Una volta sviluppati i nuovi farmaci, anche capire come produrli nel modo più efficiente è una sfida che richiede tempo.

Quando si utilizza un bioreattore per creare una proteina terapeutica da una coltura cellulare, le variabili da considerare includono ingredienti grezzi, temperatura e pressione. La regolazione dei livelli di ciascuna variabile per ottimizzare la resa comporta di solito molti tentativi ed errori. Gli scienziati che si occupano dello sviluppo dei processi modificano minuziosamente le variabili una per una: una temperatura più calda fa crescere le cellule più velocemente, ma se è troppo calda il processo si blocca, ad esempio.

Con centinaia di parametri e colture cellulari multiple da considerare, questo lavoro può risultare laborioso, lento e inefficiente. Ora, utilizzando strumenti analitici avanzati, l'analisi multivariata può rapidamente restringere la manciata di variabili che probabilmente hanno maggiore importanza e identificare il modo in cui si relazionano l'una con l'altra: la temperatura, ad esempio, può influenzare il pH. Poi, le tecniche di apprendimento automatico possono generare disegni sperimentali e consigliare esattamente quali esperimenti eseguire, e in quale ordine, per capire quali sono i valori migliori per ciascuno di essi.

Razionalizzazione dei processi produttivi

La modellazione della progettazione sperimentale è una parte importante delle prime fasi della produzione. Durante l'ottimizzazione e la definizione del processo di produzione, è fondamentale acquisire un quadro completo dei dati generati durante lo sviluppo. Solo registrando l'interazione tra il processo e il prodotto e rimuovendo l'orientamento verso i dati di "successo", potremo iniziare a vedere tutti i vantaggi dell'IA e di altre analisi avanzate per l'ottimizzazione dei processi.

I farmaci devono essere prodotti in modo costante per garantire la purezza e la potenza, e quando si passa da piccoli bioreattori a serbatoi da milioni di litri, gli errori che compromettono questi fattori sono molto più dispendiosi. È qui che L'intelligenza artificiale può aiutare per risparmiare tempo e denaro nella produzione di farmaci.

I gemelli digitali dei bioreattori che sfruttano l'apprendimento automatico possono essere creati, anche prima di iniziare le corse reali, per ottimizzare il processo. Al variare della scala, le condizioni all'interno del bioreattore cambiano, ma l'esecuzione di test virtuali può anticipare queste variazioni, con un notevole risparmio di tempo. Tuttavia, i tecnici devono individuare subito i valori anomali. Ciò significa sapere fin dall'inizio quali sono i livelli da raggiungere. Per identificare i livelli ottimali, gli scienziati dei dati possono calcolare la media di decine di cicli in un bioreattore di piccole dimensioni, creare modelli sulla base di tali cicli e quindi testare i modelli per identificare gli obiettivi esatti per ciascuna variabile.

Democratizzare le intuizioni

Analizzando enormi serie di dati e prevedendo modelli, l'IA e il ML stanno già accelerando le prime fasi di ricerca e sviluppo, la progettazione della produzione di farmaci e il processo di produzione su scala. Inoltre, stanno accelerando il ciclo di vita biofarmaceutico in un altro modo: rendendo più accessibili le informazioni.

In passato, le persone al banco dovevano affidarsi a team di data science per acquisire i dati e interpretarli. Oggi, questi team di scienza dei dati contribuiscono a creare strumenti che consentono agli utenti di estrarre informazioni utili, derivate dai dati originali, e di creare dashboard per un'interpretazione ancora più semplice.

In laboratorio e in fabbrica, l'apprendimento automatico può semplificare i cruscotti identificando le variabili più importanti e la loro interazione. Invece di monitorare 20 parametri, i tecnici possono monitorare un solo grafico che mostra la deviazione dal percorso corretto, risparmiando tempo e migliorando i risultati.

Per i manager, le tecniche di apprendimento automatico possono fornire maggiore visibilità attraverso i silos. Molti team archiviano i documenti di ricerca o gli appunti nel cloud, e modelli linguistici di grandi dimensioni come il GPT-4 possono riassumere questi documenti o analizzarli alla ricerca di parole chiave. I manager possono così individuare i team che stanno lavorando su problemi simili e supportare meglio la condivisione delle informazioni.

Ridefinire quali dati sono importanti

Tutti questi progressi, tuttavia, richiedono nuovi modi di pensare ai dati; il detto "il processo è il prodotto" non è mai stato così vero. Per prima cosa, i modelli di apprendimento automatico sono intelligenti solo quanto i dati su cui vengono addestrati.

Prendete un modello che analizzi automaticamente la purezza delle cellule utilizzando i dati della citometria a flusso nel vostro processo di sviluppo dei farmaci. Affinché il modello possa classificare i campioni, gli esseri umani devono etichettare un lotto iniziale. Affinché il modello sia accurato, il primo lotto deve essere bilanciato: deve contenere all'incirca lo stesso numero di campioni di cellule ad alta purezza di quelli a bassa purezza. Questo vale anche quando ci sono più variabili in gioco. Per esempio, un modello progettato per individuare gli outlier negli screening ad alta produttività avrà bisogno di molti esempi di diversi tipi di outlier.

Per produrre buoni dati di formazione è necessario un cambiamento di mentalità. In passato, la norma era individuare un processo che funzionasse e poi scalarlo senza capire a fondo perché il processo funzionasse. Molti team si concentravano sul monitoraggio dei successi e spesso scartavano i dati relativi ai "fallimenti". Allo stesso modo, i ricercatori spesso pubblicavano solo gli esperimenti di successo e non si preoccupavano di inviare i risultati nulli per la revisione paritaria. Ora, gli errori e gli outlier sono preziosi; questi dati sono necessari per creare modelli accurati. I team hanno bisogno di un piano per raccogliere serie di dati equilibrati o per generare sinteticamente i dati sui fallimenti.

Modifica delle modalità di archiviazione dei dati

Oltre a cambiare l'importanza dei dati, l'apprendimento automatico sta cambiando anche il modo in cui i dati devono essere archiviati. Per molte aziende, questa è spesso la sfida più grande.

I data scientist possono lavorare con dati strutturati e non strutturati, immagini, documenti, letture da dispositivi IoT e altro ancora. Ma per utilizzare questi set di dati, devono essere in grado di trovarli. Per essere accessibili, i dati devono essere raggiungibili tramite un sistema talvolta noto come dorsale dei dati. Devono inoltre essere corredati da metadati e contesti chiari, in modo che i data scientist sappiano cosa stanno guardando.

I dati sufficientemente organizzati per essere interpretati dall'intelligenza artificiale offrono ulteriori vantaggi. I dati organizzati fanno risparmiare tempo ai data scientist, che possono così concentrarsi su progetti di livello superiore. Può anche consentire modelli di apprendimento automatico plug-and-play che gli utenti finali possono applicare in modo indipendente, democratizzando ulteriormente le intuizioni. Infine, può rivelare relazioni nascoste tra i silos e aiutare i team a monte e a valle a trasferire più facilmente le informazioni.

L'apprendimento automatico trasformerà il ciclo di vita dei prodotti biofarmaceutici

Figura 1: Tipi di dati per catturare il contesto sperimentale significativo necessario per sbloccare la potenza dei modelli AI/ML.

L'implementazione di una nuova strategia per la gestione dei dati è una grande impresa. Tuttavia, lungo il percorso, le aziende probabilmente si imbatteranno in efficienze sorprendenti e scopriranno cose che non avrebbero scoperto da sole. Considerando quanto l'IA e il ML possono accelerare il time to market, l'investimento vale la pena.

L'autore

l'apprendimento automatico nel settore farmaceuticoDaniel Tabas lavora come senior data scientist nel gruppo Data Science & Analytics di IDBS. È un informatico con un dottorato di ricerca in Bioinformatica, specializzato in scienza dei dati, analisi e intelligenza artificiale e con una vasta esperienza nei settori biomedico/biofarmaceutico. Dopo aver conseguito la laurea in Informatica presso l'Università Complutense di Madrid, è entrato a far parte del Centro Nazionale Spagnolo per le Biotecnologie, dove ha lavorato in un gruppo di strutture centrali mentre completava il suo dottorato in Bioinformatica. In seguito, ha lavorato in PerkinElmer come ingegnere AI principale.

Informazioni su IDBSContattateci