In den NachrichtenNachrichten in den MedienMaschinelles Lernen in der Pharmazie

In den Nachrichten | 5. Dezember 2023

Sechs Wege, wie maschinelles Lernen den bio-pharmazeutischen Lebenszyklus verändern wird

Daniel Tabas, Senior Data Scientist bei IDBS, erörtert das transformative Potenzial von KI in der biopharmazeutischen Industrie. Da es um eine schnellere Entdeckung von Arzneimitteln, eine straffere Versuchsplanung, eine effiziente gemeinsame Nutzung von Daten und vieles mehr geht, begründet er, warum die Einführung eines angemessenen Datenmanagements und KI-bezogener Praktiken einen großen Unterschied in der frühen Arzneimittelforschung und -entwicklung ausmachen kann.
Lesen Sie mehr in diesem Artikel, der ursprünglich veröffentlicht wurde in Technologie-Netzwerke. Hier mit Genehmigung geteilt.

Werkzeuge der generativen künstlichen Intelligenz (KI), wie GPT-4 für Text und Midjourney für Bilder, haben die Öffentlichkeit im letzten Jahr in Erstaunen versetzt. Viele Menschen waren sich des Potenzials der künstlichen Intelligenz einfach nicht bewusst - und maschinelles Lernen (ML), um die Industrie neu zu gestalten.

In der biopharmazeutischen Industrie verändert das maschinelle Lernen bereits Arzneimittelentwicklung und Produktion. In den nächsten zehn Jahren wird sie den biopharmazeutischen Lebenszyklus beschleunigen, indem sie die Prozesse effizienter macht und die Erkenntnisse demokratisiert. Um diese sehnlichst erwarteten Fortschritte zu erreichen, ist jedoch ein Paradigmenwechsel in Bezug auf die Bedeutung eines guten Datenmanagements erforderlich.

Hier finden Sie vier Möglichkeiten, wie KI und ML den biopharmazeutischen Lebenszyklus beschleunigen, und zwei große Möglichkeiten, wie Unternehmen beginnen, anders über ihre Daten zu denken.

Beschleunigung der Arzneimittelentdeckung

Es ist irreführend zu sagen, dass Computer jemals genauso intelligent sein könnten wie Menschen, da Gehirne und Maschinen Informationen sehr unterschiedlich verarbeiten. Aber in bestimmten Bereichen übertrifft die künstliche Intelligenz bereits die menschlichen Fähigkeiten - vor allem, wenn es darum geht, Muster in riesigen Datensätzen zu erkennen.

So können einige KI-Modelle wissenschaftliche Texte besser zusammenfassen und analysieren als herkömmliche Systeme zur Verarbeitung natürlicher Sprache und um Größenordnungen schneller als Menschen. Diese Modelle könnten z. B. eingesetzt werden, um potenzielle neue Assoziationen zwischen Medikamenten und Krankheiten zu finden. Andere Modelle, die sich auf die chemische Struktur konzentrieren, können das Moleküldesign automatisch optimieren und Eigenschaften wie Bindungsaffinität oder Toxizität verbessern.

Verbesserung der Versuchsplanung

Sobald neue Medikamente entwickelt sind, ist es eine zeitraubende Herausforderung herauszufinden, wie sie am effizientesten hergestellt werden können.

Bei der Verwendung eines Bioreaktors zur Herstellung eines therapeutischen Proteins aus einer Zellkultur sind unter anderem die Variablen Rohstoffe, Temperatur und Druck zu berücksichtigen. Die Einstellung der einzelnen Variablen zur Optimierung der Ausbeute erfordert in der Regel eine Menge Versuch und Irrtum. Die Wissenschaftler in der Prozessentwicklung passen die Variablen sorgfältig eine nach der anderen an - eine wärmere Temperatur lässt die Zellen schneller wachsen, aber wenn sie zu heiß ist, gerät sie ins Stocken.

Bei Hunderten von Parametern und mehreren Zellkulturen, die berücksichtigt werden müssen, kann diese Arbeit arbeitsintensiv, langsam und ineffizient sein. Mithilfe fortschrittlicher Analysetools kann die multivariate Analyse nun schnell die wenigen Variablen eingrenzen, die wahrscheinlich am wichtigsten sind, und ermitteln, wie sie miteinander in Beziehung stehen - die Temperatur kann beispielsweise den pH-Wert beeinflussen. Dann können Techniken des maschinellen Lernens Versuchspläne erstellen und empfehlen genau, welche Experimente in welcher Reihenfolge durchgeführt werden sollten, um die besten Werte für jeden einzelnen zu ermitteln.

Rationalisierung der Produktionsprozesse

Die Modellierung der Versuchsplanung ist ein wichtiger Bestandteil der frühen Produktionsphasen. Während der gesamten Optimierung und Definition des Produktionsprozesses ist es entscheidend, ein vollständiges Bild der in der Entwicklung generierten Daten zu erfassen. Nur wenn aufgezeichnet wird, wie Prozess und Produkt interagieren - und die Voreingenommenheit gegenüber "Erfolgsdaten" beseitigt wird - können wir die Vorteile von KI und anderen fortschrittlichen Analysen für die Prozessoptimierung voll ausschöpfen.

Medikamente müssen konsistent produziert werden, um ihre Reinheit und Wirksamkeit zu gewährleisten, und beim Scale-up von kleinen Bioreaktoren zu Millionen-Liter-Tanks sind Fehler, die diese Faktoren beeinträchtigen, sehr viel verschwenderischer. Dies ist der Punkt, an dem KI kann helfen um bei der Herstellung von Arzneimitteln Zeit und Geld zu sparen.

Digitale Zwillinge von Bioreaktoren, die maschinelles Lernen nutzen, können erstellt werden, noch bevor reale Läufe beginnen, um den Prozess zu optimieren. Wenn sich der Maßstab ändert, ändern sich auch die Bedingungen innerhalb des Bioreaktors. Durch die Durchführung virtueller Tests können diese Schwankungen jedoch vorhergesehen werden, was zu erheblichen Zeiteinsparungen führt. Dennoch müssen die Techniker Ausreißer sofort erkennen. Das bedeutet, dass sie von Anfang an wissen müssen, welche Werte in Frage kommen. Um optimale Werte zu ermitteln, können Datenwissenschaftler Dutzende von Durchläufen in einem kleinen Bioreaktor mitteln, anhand dieser Durchläufe Modelle erstellen und dann die Modelle testen, um genaue Zielwerte für jede Variable zu ermitteln.

Erkenntnisse demokratisieren

Durch die Analyse riesiger Datensätze und die Vorhersage von Mustern beschleunigen KI und ML bereits die frühe Forschung und Entwicklung, das Design der Arzneimittelproduktion und den Herstellungsprozess in großem Maßstab. Sie beschleunigen den biopharmazeutischen Lebenszyklus auch auf eine andere Weise: indem sie Erkenntnisse leichter zugänglich machen.

In der Vergangenheit mussten sich die Mitarbeiter auf Data-Science-Teams verlassen, um sowohl die Daten zu erfassen als auch zu interpretieren. Jetzt helfen diese Data-Science-Teams bei der Entwicklung von Werkzeugen, mit denen die Nutzer aufschlussreiche Informationen aus den Originaldaten extrahieren und Dashboards für eine noch einfachere Interpretation erstellen können.

Im Labor und in der Fabrik kann maschinelles Lernen die Dashboards vereinfachen, indem es die wichtigsten Variablen und ihre Wechselwirkungen identifiziert. Anstatt 20 Parameter zu überwachen, können Techniker ein einziges Diagramm überwachen, das die Abweichung vom richtigen Weg anzeigt - das spart Zeit und verbessert die Ergebnisse.

Für Manager können Techniken des maschinellen Lernens für mehr Transparenz über Silos hinweg sorgen. Viele Teams speichern Forschungsunterlagen oder Notizen in der Cloud, und große Sprachmodelle wie GPT-4 können diese Dokumente zusammenfassen oder nach Schlüsselwörtern durchsuchen. Manager können dann Teams erkennen, die an ähnlichen Problemen arbeiten, und den Informationsaustausch besser unterstützen.

Die Bedeutung der Daten neu definieren

All diese Fortschritte erfordern jedoch eine neue Art des Denkens über Daten; das Sprichwort "der Prozess ist das Produkt" war noch nie so wahr wie heute. Zum einen sind die Modelle des maschinellen Lernens nur so intelligent wie die Daten, auf denen sie trainiert werden.

Nehmen Sie ein Modell, das automatisch die Zellreinheit anhand von Durchflusszytometriedaten in Ihrem Arzneimittelentwicklungsprozess analysiert. Damit das Modell die Proben kategorisieren kann, müssen Menschen eine erste Charge markieren. Damit das Modell genau ist, muss diese erste Charge ausgewogen sein; sie sollte etwa gleich viele Zellproben mit hoher Reinheit wie solche mit niedriger Reinheit enthalten. Dies gilt auch, wenn mehrere Variablen im Spiel sind. Ein Modell, das Ausreißer in Hochdurchsatz-Screenings erkennen soll, benötigt zum Beispiel viele Beispiele für verschiedene Arten von Ausreißern.

Um gute Schulungsdaten zu erzeugen, ist ein Umdenken erforderlich. In der Vergangenheit war es üblich, einen funktionierenden Prozess zu finden und ihn dann zu erweitern, ohne zu verstehen, warum der Prozess funktionierte. Viele Teams konzentrierten sich auf die Verfolgung von Erfolgen und verwarfen oft "Misserfolgsdaten". Ebenso veröffentlichten Forscher oft nur erfolgreiche Experimente und machten sich nicht die Mühe, ungültige Ergebnisse zur Überprüfung durch Fachkollegen einzusenden. Jetzt sind Ausreißer und Fehler wertvoll; diese Daten werden benötigt, um genaue Modelle zu erstellen. Teams brauchen einen Plan für die Sammlung ausgewogener Datensätze - oder für die synthetische Erzeugung von Fehlerdaten.

Änderung der Art der Datenspeicherung

Das maschinelle Lernen verändert nicht nur, welche Daten von Bedeutung sind, sondern auch, wie die Daten gespeichert werden müssen. Für viele Unternehmen ist dies oft die größere Herausforderung.

Datenwissenschaftler können mit strukturierten und unstrukturierten Daten, Bildern, Dokumenten, Messwerten von IoT-Geräten und mehr arbeiten. Um diese Datensätze nutzen zu können, müssen sie jedoch in der Lage sein, sie zu finden. Um zugänglich zu sein, sollten die Daten über ein System erreichbar sein, das auch als Daten-Backbone bezeichnet wird. Außerdem sollten sie mit eindeutigen Metadaten und Kontext versehen sein, damit die Datenwissenschaftler wissen, was sie da sehen.

Daten, die so organisiert sind, dass sie von KI interpretiert werden können, bieten noch weitere Vorteile. Organisierte Daten sparen den Datenwissenschaftlern Zeit, sodass sie sich auf übergeordnete Projekte konzentrieren können. Sie können auch Plug-and-Play-Modelle für maschinelles Lernen ermöglichen, die von den Endnutzern unabhängig angewendet werden können, wodurch die Erkenntnisse weiter demokratisiert werden. Und schließlich können verborgene Zusammenhänge über Silos hinweg aufgedeckt und der Informationsaustausch zwischen vor- und nachgelagerten Teams erleichtert werden.

Maschinelles Lernen wird den biopharmazeutischen Lebenszyklus verändern

Abbildung 1: Datentypen zur Erfassung des aussagekräftigen experimentellen Kontexts, der erforderlich ist, um die Leistungsfähigkeit von KI/ML-Modellen zu erschließen.

Die Umsetzung einer neuen Strategie für die Datenverwaltung ist ein großes Unterfangen. Aber auf dem Weg dorthin werden Unternehmen wahrscheinlich über überraschende Effizienzgewinne stolpern und Dinge entdecken, die sie von sich aus nicht entdeckt hätten. Wenn man bedenkt, wie sehr KI und ML die Zeit bis zur Marktreife verkürzen können, ist die Investition es wert.

Über den Autor

Maschinelles Lernen in der PharmazieDaniel Tabas arbeitet als Senior Data Scientist in der Gruppe Data Science & Analytics bei IDBS. Er ist Informatiker mit einem Doktortitel in Bioinformatik, spezialisiert auf Datenwissenschaft, Analytik und künstliche Intelligenz und mit umfassender Erfahrung in den Bereichen Biomedizin und Biopharma. Nach seinem Bachelor-Abschluss in Informatik an der Universität Complutense in Madrid arbeitete er am Spanischen Nationalen Zentrum für Biotechnologie, wo er in einer Kerngruppe arbeitete, während er seine Promotion in Bioinformatik abschloss. Später arbeitete er bei PerkinElmer als leitender KI-Ingenieur.

Über IDBSKontakt