AI-Driven Compound Optimization in the Large Molecule Space

Ein Experteninterview über die KI-gestützte Optimierung von Wirkstoffen im Bereich großer Moleküle.

von

Vendela Jagdt

Dr. Gillian Hertlein arbeitet als Projektmanagerin bei Merantix Momentum und spezialisiert sich auf KI-Strategien, besonders für Projekte in den Lebenswissenschaften und der Pharmazie. Als ausgebildete Molekularbiologin, die sowohl in der akademischen Forschung als auch in der Industrieforschung und -entwicklung gearbeitet hat, überbrückt sie seit über vier Jahren die Lücke zwischen KI und den Lebenswissenschaften.

Dr. Jelena Ivanovska, hat einen Doktortitel in Biochemie und Molekularbiologie von der FAU Erlangen-Nürnberg und dem Max-Delbrück-Institut. Sie ist auf Onkologie spezialisiert und arbeitet an Proteinen und Signalkaskaden, die an Krebs beteiligt sind. Nach mehreren Stationen in der Akademie und der Industrie trat sie Exazyme als CSO und Mitbegründerin bei - einem Unternehmen an der Spitze des durch KI unterstützten Protein-Designs.

Dr. Harry Sevi erwarb einen Doktortitel in maschinellem Lernen und angewandter Mathematik von der École normale supérieure de Lyon. Als Leiter der Technikabteilung bei Exazyme überbrückt er die Lücke zwischen maschinellem Lernen und Protein-Engineering.

‍

Vendela: Lasst uns starten. Vielen Dank, dass ihr euch die Zeit für dieses Interview genommen habt. Um etwas Kontext zu geben, dieses Interview ist Teil unserer Serie über praktische Anwendungen von maschinellem Lernen in der pharmazeutischen Industrie. Heute wollen wir in die Komplexitäten großer Moleküle eintauchen und erforschen, wie KI dieses Feld revolutioniert.

Um zu beginnen, für diejenigen, die vielleicht nicht vertraut sind, könnte einer von euch eine kurze Erklärung darüber geben, was große Moleküle sind, insbesondere im Kontext der Arzneimittelentwicklung, und ihre Verwendung?

Jelena: Große Moleküle, auch bekannt als Makromoleküle, spielen eine bedeutende Rolle in der Biopharmazie. Sie sind oft therapeutische Ziele aufgrund ihrer Komplexität. Im Falle von Exazyme konzentrieren wir uns auf Proteine, die anspruchsvolle Makromoleküle sind. Proteine bestehen aus Sequenzen, die aus 20 verschiedenen Aminosäuren zusammengesetzt sind, und diese Sequenzen definieren sowohl ihre Struktur als auch ihre Funktion. Große Moleküle wie Proteine sind entscheidend in verschiedenen Anwendungen, einschließlich Enzymen, Antikörpern, Zytokinen und Signalmolekülen, die weit verbreitet in Therapien sind und für z.B. Krebs und Autoimmunerkrankungen eingesetzt werden.

Vendela: Vielen Dank für diese Erklärung. Es ist klar, dass große Moleküle vielfältig sind und bedeutende Rollen in der Arzneimittelentwicklung spielen. Sie können als Ziele dienen, aber auch selbst als Medikamente wirken. Wenn wir über die Optimierung von Medikamenten sprechen, was sind die drei Hauptziele bei der Optimierung großer Moleküle, insbesondere im Fall von Enzymen?

Jelena: Die Hauptziele bei der Optimierung großer Moleküle, speziell bei Enzymen, umfassen die Verbesserung ihrer Wirksamkeit, die Gewährleistung ihrer Sicherheit und die Steigerung ihrer Stabilität. Diese sind wesentliche Faktoren, die bei der Entwicklung therapeutischer Behandlungen mit großen Molekülen berücksichtigt werden müssen.

Vendela: Ein großer Fortschritt in der Optimierung großer Moleküle ohne Experimente war AlphaFold. Könnte einer von euch erklären, was AlphaFold ist und seine Einzigartigkeit im Bereich der Proteinstrukturvorhersage hervorheben?

Gillian: AlphaFold ist ein bahnbrechendes Modell, das von Google DeepMind entwickelt wurde, um die dreidimensionale Struktur von Proteinen vorherzusagen. Die Herausforderung bei Proteinen liegt darin, dass sie hochkomplexe Moleküle sind, und das Verständnis ihrer 3D-Struktur ist entscheidend für verschiedene Anwendungen, einschließlich der Arzneimittelentwicklung. Traditionell erforderte die Ermittlung der Struktur eines Proteins dessen Kristallisierung und die Verwendung von Röntgenkristallographie, ein Prozess, der herausfordernd und zeitaufwendig sein kann. AlphaFold revolutionierte dieses Feld, indem es verfügbare Proteinstrukturdaten integrierte und ein tiefes neuronales Netzwerk schuf, das die 3D-Struktur von Proteinen mit bemerkenswerter Genauigkeit vorhersagen kann. Was AlphaFold einzigartig macht, ist seine Fähigkeit, Proteinstrukturen mit hoher Präzision vorherzusagen, was es zu einem wertvollen Werkzeug für Wissenschaftler und Forscher im Feld macht. Früher wurden solche 3D-Modelle von führenden Experten im Feld handgefertigt; jetzt können sie von einem viel breiteren Publikum modelliert werden.

Vendela: Harry, könntest du deine Perspektive auf die Herausforderungen und potenziellen KI-basierten Modellierungslösungen nach der Einführung von AlphaFold teilen?

Harry: Absolut. Aus der Perspektive des maschinellen Lernens war AlphaFold ein Wendepunkt bei der Vorhersage von Proteinstrukturen. Es ist jedoch wichtig zu beachten, dass das Modell auf bekannten Proteinstrukturen basiert, was seine Genauigkeit bei der Behandlung völlig neuer Proteine einschränken kann. Herausforderungen liegen in der Verbesserung der Darstellung von Proteinsequenzen und in der Erforschung von Wegen, die strukturellen Vorhersagen von AlphaFold mit anderen auf Sequenzen fokussierten maschinellen Lernmodellen zu kombinieren. Modelle wie ESM (Evolutionary Scale Modeling) haben Aufmerksamkeit erregt, indem sie Sequenzen allein verwenden, um Proteine zu repräsentieren und verschiedene Eigenschaften vorherzusagen, ihnen fehlt jedoch strukturelle Informationen. Die Zukunft wird wahrscheinlich die Stärken beider struktureller und sequenzbasierter Modelle kombinieren, um Vorhersagen zu verbessern, besonders in funktionalen Aspekten wie Thermostabilität, Löslichkeit und enzymatische Aktivität.

Vendela: Vielen Dank, Harry. Wir machen einen Sprung zur Optimierung großer Moleküle. Jelena, könntest du weitere Einblicke in die Herausforderungen und Strategien geben, die bei der Optimierung großer Moleküle, insbesondere Enzyme, beteiligt sind?

Jelena: Die Optimierung großer Moleküle, insbesondere von Enzymen, ist ein vielschichtiger Prozess. Eine der Schlüsselherausforderungen besteht darin, das komplexe Zusammenspiel zwischen verschiedenen Domänen innerhalb eines Proteins zu verstehen und wie Änderungen in der Sequenz seine Funktion beeinflussen können. Zusätzlich ist es herausfordernd vorherzusagen, wie Mutationen oder Modifikationen Eigenschaften wie katalytische Aktivität, Löslichkeit, Stabilität und Sicherheit beeinflussen werden. Um diese Herausforderungen anzugehen, verlassen wir uns oft auf Hochdurchsatzdaten, wie z.B. Deep Mutation Scanning, um Informationen darüber zu sammeln, wie verschiedene Sequenzvariationen die Protein Funktion beeinflussen. Maschinelle Lernmodelle, wie Harry zuvor erwähnte, können eingesetzt werden, um diese Daten zu analysieren und die Optimierungsbemühungen zu leiten. Das ultimative Ziel ist es, große Moleküle fein abzustimmen, um die gewünschten Eigenschaften für spezifische Anwendungen zu erreichen.

Vendela: Vielen Dank, Jelena. Könnest du uns einen kurzen Überblick über die aktuellen Schlüsselherausforderungen bei traditionellen Methoden zur Optimierung großer Moleküle als Verbindungen geben?

Jelena: Traditionelle Methoden zur Optimierung großer Moleküle, insbesondere Enzyme, beinhalten hauptsächlich zwei Ansätze. Der erste ist die gerichtete Evolution, die einen Nobelpreis gewonnen hat. Bei diesem Ansatz werden zufällige Mutationen in die Aminosäuresequenz des Enzyms eingeführt, wodurch eine große Bibliothek von Varianten entsteht. Diese Methode ist jedoch nicht nur teuer, sondern auch zeitaufwendig, da eine große Anzahl von Kandidaten getestet werden muss. Der zweite Ansatz ist das rationale Design, bei dem spezifische Mutationen basierend auf der Sequenz des Proteins und, falls bekannt, seiner Struktur eingeführt werden. Diese Methode erfordert Fachwissen und beinhaltet oft Experimente. Zusätzlich können computergestützte Werkzeuge wie in silico Modellierung verwendet werden, um die Auswirkungen spezifischer Mutationen vorherzusagen. Beide Methoden beinhalten typischerweise das Screening von Variantenreihen, um verbesserte Eigenschaften zu identifizieren.

Vendela: Könntest du erklären, wie sich der Ansatz von Exazyme von diesen traditionellen Methoden unterscheidet und welche Vorteile er bietet?

Jelena: Der Ansatz von Exazyme bietet mehrere Vorteile gegenüber traditionellen Methoden. Unsere Methode ist weniger teuer und zeitaufwendig, da wir vorhandene Sequenzen und Messungen nutzen. Wir konzentrieren uns darauf, den Sequenzraum effizienter zu erkunden, was bedeutet, dass wir nicht Tausende von Sequenzen zur Arbeit benötigen. Tatsächlich streben wir danach, mit weniger Sequenzen zu arbeiten, was es kosteneffektiver macht. Bemerkenswert ist, dass wir sowohl positive als auch negative Daten nutzen können, einschließlich nicht-funktionaler Sequenzen, um unsere Modelle zu trainieren. Traditionelle Methoden verwerfen oft negative Ergebnisse, aber für maschinelles Lernen zählt jedes Stück Daten. Dieser Ansatz ermöglicht es uns, mehrere Eigenschaften gleichzeitig zu optimieren, was ihn vielseitiger und effizienter macht.

Harry: Zusätzlich reduziert unser Ansatz den Bedarf an spezialisierten Geräten, was ihn für eine breitere Forschungsgemeinschaft zugänglicher macht. Wir streben auch danach, die Einbeziehung von Proteindynamiken in unsere Modelle zu verbessern, da dies entscheidend für das Verständnis des Verhaltens großer Moleküle ist.

Vendela: Das ist faszinierend, und es ist großartig zu sehen, wie Exazyme die Herausforderungen traditioneller Methoden mit einem effizienteren und datengesteuerten Ansatz angeht. Wir wechseln die Richtung ein wenig und sprechen über Protein- und Antikörperdesign. Bereiche, in die erheblich investiert wurde, einschließlich in generative KI-Anwendungen. Gillian, welche Aspekte des Protein- und Antikörperdesigns machen sie besonders interessant für generative KI, und warum ziehen diese Bereiche erhebliche Investitionen an?

Gillian: Protein- und Antikörperdesign sind aus mehreren Gründen hochattraktiv für generative KI-Anwendungen. Erstens spielen diese Moleküle eine entscheidende Rolle bei der Entwicklung von Therapien, insbesondere bei der Behandlung von Krankheiten wie Krebs und Autoimmunerkrankungen. Zweitens werden sie oft nicht entworfen, sondern als Immunantwort auf das jeweilige Ziel generiert – was das Ergebnis begrenzt. Drittens sind ihre komplexen Strukturen schwer in traditionellen regelbasierten Algorithmen zu projizieren, und zu guter Letzt sind riesige Antikörperbibliotheken verfügbar, um ein Foundation Model zu trainieren.

Vendela: Harry, möchtest du Einsichten aus der Perspektive des maschinellen Lernens zu den Herausforderungen und zukünftigen Richtungen in generativer KI für Protein- und Antikörperdesign hinzufügen?

Harry: Aus der Sicht des maschinellen Lernens gibt es ein enormes Versprechen in generativer KI für das Design von Proteinen und Antikörpern. Wir sollten jedoch vorsichtig bleiben. Die Komplexität dieser Moleküle, insbesondere von Proteinen, erfordert ein tiefes Verständnis der Fitnesslandschaft. Wir benötigen Benchmark-Daten, um diese komplexe Landschaft effizient zu navigieren. Während generative KI komplexe Proteinstrukturen produzieren kann, bleibt die Funktionalität eine Herausforderung. Es ist ein aktives Forschungsgebiet, aber wir sind noch nicht so weit, dass wir konsistent funktionale Proteine erstellen können.

Vendela: Lasst uns das Interview abschließen, indem wir nach vorne schauen. Wenn wir uns ein Jahr voraus, im Januar 2025, vorstellen, was sind eure Hoffnungen oder Erwartungen für Fortschritte in diesem Feld?

Jelena: Aus meiner Sicht hoffe ich auf mehr Datenintegration, insbesondere Multi-Omics-Daten, um unser Verständnis von Proteindynamiken und -strukturen zu verbessern. Die Einbeziehung verschiedener Datenquellen kann die Genauigkeit unserer Vorhersagen verbessern und uns helfen, den Sequenzraum effektiver zu erkunden.

Harry: Persönlich würde ich gerne Fortschritte im Verständnis von Epistasis und der Fitnesslandschaft von Proteinen sehen. Benchmark-Daten zu haben, um diese komplexe Landschaft effizient zu navigieren, wäre ein bedeutender Schritt nach vorne.

Gillian: Ich teile die Hoffnung auf mehr Daten, insbesondere freue ich mich auf Fortschritte in der Kryo-Elektronenmikroskopie, die mehr Daten über Proteinstrukturen liefern könnte, insbesondere über Dynamiken. Dies würde Programme wie AlphaFold und ähnliche Werkzeuge enorm begünstigen.

Vendela: Vielen Dank, dass ihr alle eure Gedanken über die Zukunft dieses spannenden Feldes geteilt haben!

Jetzt beim Merantix Momentum Newsletter anmelden.

Wie macht man 30 Jahre an Daten zugänglich?

Im Gespräch mit Jonas Münch, der bei Bayer einen RAG-Chatbot entwickelt hat, der 30 Jahre interne Daten und klinische Ergebnisse an einem Ort vereint.

Von Datenchaos zu Durchbrüchen

Ein Experteninterview mit Dr. Stephan Hegge, VP of Corporate Strategy at HotSpot Therapeutics und Dr. Thomas Wollmann, CTO at Merantix Momentum

Artikel

Building Better Medicines: Exploring AI-Driven Compound Optimization

Ein Experteninterview zur Forschung von KI-gesteuerter Wirkstoffoptimierung.

Artikel

Unsere Veröffentlichungen

Entdecken Sie die neuesten Veröffentlichungen unseres Forschungsteams und mehr

Artikel

Verlässliche und krisenresistente Bestandsoptimierung

Revolutionierung der Lieferkettenoptimierung.

AI-Driven Compound Optimization in the Large Molecule Space

‍

Vendela: Harry, könntest du deine Perspektive auf die Herausforderungen und potenziellen KI-basierten Modellierungslösungen nach der Einführung von AlphaFold teilen?

Vendela: Könntest du erklären, wie sich der Ansatz von Exazyme von diesen traditionellen Methoden unterscheidet und welche Vorteile er bietet?