Dans l'actualitéNouvelles dans les médiasL'apprentissage automatique dans l'industrie pharmaceutique

Dans l'actualité | 5 décembre 2023

Six façons dont l'apprentissage automatique va transformer le cycle de vie des produits biopharmaceutiques

Daniel Tabas, Senior Data Scientist chez IDBS, discute du potentiel de transformation de l'IA dans l'industrie bio-pharmaceutique. L'accélération de la découverte de médicaments, la rationalisation de la conception des expériences, l'efficacité du partage des données et bien d'autres choses encore étant en jeu, il explique pourquoi l'inculcation d'une bonne gestion des données et de pratiques liées à l'IA peut faire toute la différence dans les premières phases de la recherche et du développement de médicaments.
Plus d'informations dans cet article, publié à l'origine dans Réseaux technologiques. Partagé ici avec l'autorisation de l'auteur.

Les outils d'intelligence artificielle générative (IA), tels que GPT-4 pour le texte et Midjourney pour les images, ont étonné le public au cours de l'année écoulée. De nombreuses personnes n'étaient tout simplement pas conscientes du potentiel de l'intelligence artificielle - et de ses avantages pour la société. apprentissage automatique (ML) en particulier - pour remodeler les industries.

Dans l'industrie biopharmaceutique, l'apprentissage automatique change déjà la donne développement de médicaments et la production. Au cours de la prochaine décennie, elle accélérera le cycle de vie des produits biopharmaceutiques en rendant les processus plus efficaces et en démocratisant les connaissances. La réalisation de ces avancées tant attendues nécessitera toutefois un changement de paradigme dans ce que signifie une bonne gestion des données.

Voici quatre façons dont l'IA et la ML accélèrent le cycle de vie biopharmaceutique et deux grandes façons dont les entreprises commencent à penser leurs données différemment.

Accélérer la découverte de médicaments

Il est trompeur de dire que les ordinateurs pourraient un jour être aussi intelligents que les humains, car les cerveaux et les machines traitent l'information de manière très différente. Mais à certains égards, l'intelligence artificielle dépasse déjà les capacités humaines, notamment lorsqu'il s'agit de repérer des schémas dans d'énormes ensembles de données.

Par exemple, certains modèles d'IA peuvent résumer et analyser des textes scientifiques mieux que les systèmes traditionnels de traitement du langage naturel et plusieurs fois plus vite que les humains. Ces modèles pourraient être utilisés, par exemple, pour trouver de nouvelles associations potentielles entre médicaments et maladies. D'autres modèles, axés sur la structure chimique, peuvent optimiser automatiquement la conception des molécules, en améliorant des propriétés telles que l'affinité de liaison ou la toxicité.

Améliorer la conception des expériences

Une fois les nouveaux médicaments mis au point, la recherche de la manière la plus efficace de les produire est également un défi qui prend du temps.

Lorsqu'on utilise un bioréacteur pour créer une protéine thérapeutique à partir d'une culture cellulaire, les variables à prendre en compte sont les ingrédients bruts, la température et la pression. L'ajustement des niveaux de chaque variable pour optimiser le rendement implique généralement de nombreux essais et erreurs. Les scientifiques chargés du développement des procédés ajustent minutieusement les variables une par une - une température plus chaude accélère la croissance des cellules, mais si elle est trop élevée, le processus s'arrête, par exemple.

Avec des centaines de paramètres et de multiples cultures cellulaires à prendre en compte, ce travail peut être laborieux, lent et inefficace. Aujourd'hui, grâce à des outils d'analyse avancés, l'analyse multivariée permet de réduire rapidement la poignée de variables susceptibles d'avoir le plus d'importance et d'identifier leurs relations mutuelles - la température, par exemple, peut influer sur le pH. Ensuite, les techniques d'apprentissage automatique peuvent élaborer des plans d'expérience et recommande exactement les expériences à réaliser - et dans quel ordre - pour déterminer les meilleures valeurs pour chacune d'entre elles.

Rationalisation des processus de production

La modélisation de la conception expérimentale est un élément important des premières étapes de la production. Tout au long de l'optimisation et de la définition du processus de production, il est essentiel d'obtenir une image complète des données générées lors du développement. Ce n'est qu'en enregistrant la manière dont le processus et le produit interagissent - et en éliminant le biais en faveur des données de "réussite" - que nous pourrons commencer à voir tous les avantages de l'IA et d'autres analyses avancées pour l'optimisation des processus.

Les médicaments doivent être produits de manière cohérente pour garantir leur pureté et leur puissance, et lorsque l'on passe de petits bioréacteurs à des cuves d'un million de litres, les erreurs qui compromettent ces facteurs sont beaucoup plus coûteuses. C'est dans ce contexte que le L'IA peut aider pour gagner du temps et de l'argent dans la fabrication des médicaments.

Des jumeaux numériques de bioréacteurs utilisant l'apprentissage automatique peuvent être créés, avant même de commencer les essais réels, afin d'optimiser le processus. Lorsque l'échelle change, les conditions à l'intérieur du bioréacteur changent, mais les tests virtuels permettent d'anticiper ces variations, ce qui se traduit par des gains de temps considérables. Cependant, les techniciens doivent toujours repérer immédiatement les valeurs aberrantes. Cela signifie qu'il faut savoir dès le départ quels sont les niveaux à atteindre. Pour identifier les niveaux optimaux, les scientifiques des données peuvent faire la moyenne de dizaines d'essais dans un bioréacteur à petite échelle, créer des modèles à partir de ces essais, puis tester les modèles afin d'identifier les cibles exactes pour chaque variable.

Démocratiser les connaissances

En analysant d'énormes ensembles de données et en prédisant des modèles, l'IA et la ML accélèrent déjà la recherche et le développement précoces, la conception de la production de médicaments et le processus de fabrication à l'échelle. Elles accélèrent également le cycle de vie biopharmaceutique d'une autre manière : en rendant les connaissances plus accessibles.

Dans le passé, les personnes travaillant sur le banc devaient s'appuyer sur des équipes de science des données pour acquérir les données et les interpréter. Aujourd'hui, ces équipes aident à créer des outils qui permettent aux utilisateurs d'extraire des informations pertinentes, dérivées des données originales, et de créer des tableaux de bord pour une interprétation encore plus facile.

En laboratoire comme en usine, l'apprentissage automatique peut simplifier les tableaux de bord en identifiant les variables les plus importantes et leur interaction. Au lieu de surveiller 20 paramètres, les techniciens peuvent surveiller un graphique montrant les écarts par rapport à la trajectoire correcte, ce qui permet de gagner du temps et d'améliorer les résultats.

Pour les gestionnaires, les techniques d'apprentissage automatique peuvent offrir une meilleure visibilité à travers les silos. De nombreuses équipes stockent des documents de recherche ou des notes dans le nuage, et les techniques d'apprentissage automatique peuvent fournir une meilleure visibilité à travers les silos. les grands modèles linguistiques comme le GPT-4 peut résumer ces documents ou les analyser à la recherche de mots-clés. Les responsables peuvent alors repérer les équipes qui travaillent sur des problèmes similaires et mieux soutenir le partage d'informations.

Redéfinir les données qui comptent

Toutes ces avancées exigent cependant de nouvelles façons de penser les données ; le dicton "le processus est le produit" n'a jamais été aussi vrai. D'une part, les modèles d'apprentissage automatique ne sont pas plus intelligents que les données sur lesquelles ils sont formés.

Prenez un modèle qui analysera automatiquement la pureté des cellules à l'aide de données de cytométrie de flux dans votre processus de développement de médicaments. Pour que le modèle puisse classer les échantillons, les humains doivent marquer un lot initial. Pour que le modèle soit précis, ce premier lot doit être équilibré ; il doit contenir à peu près autant d'échantillons de cellules de haute pureté que de cellules de faible pureté. Cela est également vrai lorsque plusieurs variables entrent en jeu. Par exemple, un modèle conçu pour repérer les valeurs aberrantes dans les criblages à haut débit aura besoin de nombreux exemples de différents types de valeurs aberrantes.

Un changement de mentalité est nécessaire pour produire de bonnes données de formation. Dans le passé, la norme consistait à trouver un processus qui fonctionnait et à l'appliquer à plus grande échelle sans comprendre en profondeur pourquoi le processus fonctionnait. De nombreuses équipes se concentraient sur le suivi des réussites et rejetaient souvent les données relatives aux "échecs". De même, les chercheurs ne publiaient souvent que les expériences réussies et ne se donnaient pas la peine de soumettre les résultats nuls à un examen par les pairs. Aujourd'hui, les valeurs aberrantes et les erreurs sont précieuses ; ces données sont nécessaires pour créer des modèles précis. Les équipes ont besoin d'un plan pour collecter des ensembles de données équilibrés ou pour générer synthétiquement des données d'échec.

Modifier le mode de stockage des données

En plus de modifier l'importance des données, l'apprentissage automatique modifie également la manière dont les données doivent être stockées. Pour de nombreuses entreprises, il s'agit souvent du plus grand défi.

Les scientifiques des données peuvent travailler avec des données structurées et non structurées, des images, des documents, des relevés d'appareils IoT et bien d'autres choses encore. Mais pour utiliser ces ensembles de données, ils doivent pouvoir les trouver. Pour être accessibles, les données doivent être accessibles à l'aide d'un système parfois connu sous le nom de colonne vertébrale de données. Elles doivent également être accompagnées de métadonnées et d'un contexte clairs, afin que les scientifiques des données sachent ce qu'ils regardent.

Les données suffisamment organisées pour être interprétées par l'IA offrent également d'autres avantages. Les données organisées permettent aux data scientists de gagner du temps et de se concentrer sur des projets de plus haut niveau. Elles peuvent également permettre la mise en place de modèles d'apprentissage automatique prêts à l'emploi que les utilisateurs finaux peuvent appliquer de manière indépendante, démocratisant ainsi davantage les connaissances. Enfin, elles peuvent révéler des relations cachées entre les silos et aider les équipes en amont et en aval à transférer des informations plus facilement.

L'apprentissage automatique va transformer le cycle de vie des produits biopharmaceutiques

Figure 1 : Types de données pour capturer le contexte expérimental significatif nécessaire pour libérer la puissance des modèles d'IA/ML.

La mise en œuvre d'une nouvelle stratégie de gestion des données est une entreprise de grande envergure. Mais en cours de route, les entreprises tomberont probablement sur des gains d'efficacité surprenants et découvriront des choses qu'elles n'auraient pas découvertes par elles-mêmes. Étant donné à quel point l'IA et la ML peuvent accélérer les délais de mise sur le marché, l'investissement en vaut la peine.

A propos de l'auteur

l'apprentissage automatique dans l'industrie pharmaceutiqueDaniel Tabas travaille en tant que data scientist senior au sein du groupe Data Science & Analytics chez IDBS. Il est informaticien et titulaire d'un doctorat en bio-informatique, spécialisé dans la science des données, l'analyse et l'intelligence artificielle, et possède une vaste expérience dans les domaines biomédical et biopharmaceutique. Après avoir obtenu sa licence en informatique à l'université Complutense de Madrid, il a rejoint le Centre national espagnol de biotechnologie, où il a travaillé dans un groupe de base pendant qu'il terminait son doctorat en bioinformatique. Plus tard, il a travaillé chez PerkinElmer en tant qu'ingénieur principal en IA.

À propos de l'IDBSContactez nous