KKC-Kolumne Eine KI erobert die Proteinforschung

Zugehörige Themenseiten:
KKC

Seit Sommer 2021 stellt Google dem Europäischen Labor für Molekular­biologie (EMBL) in Heidelberg eine ­Datenbank kosten­frei zur Verfügung, die nun auch kommer­ziell genutzt werden darf: Die dreidi­men­­sionalen Strukturen von 200 Millionen Proteinen, und zwar die des Menschen und 20 weiterer Spezies ­(https://alphafold.ebi.ac.uk).

Neuronale Netze wurden mittels Deep-Learning-Methoden mit hunderttausenden Proteinstrukturen trainiert. – © lassedesignen (stock.adobe.com)

Die Software Alphafold 2 mit dem veröffentlichten Quellcode löste in der Biotechnik-Welt ein Erdbeben aus, denn die Eiweißmoleküle sind als komplexe Nanomaschinen praktisch an allen Funktionen des Lebens beteiligt.

Fehler in ihrer 3-D-Faltung können Krankheiten wie Alzheimer, Parkinson und Diabetes auslösen. Kürzlich wurde ein Protein namens Clusterin entdeckt, welches fehlerhafte Eiweiße zum Ab­bau ins Zellinnere transportiert. Dort kümmern sich Proteasomen und ­Lysosomen um die Müllentsorgung. Hitze­stabile Proteine schützen andere Pro­teine vor Temperaturschocks, Aus­trocknung, Verklumpungen und diversen Chemikalien.

Wenn Forschende ein neues Pro­tein entdecken, schalten sie es zunächst ab, um herauszufinden, welche Funktion es in der Zelle ausübt. Bislang konnten sie die Proteinfaltung nur in monatelanger Arbeit mit aufwändigen Methoden wie der Röntgenkristallo­grafie oder der Kernspinresonanz-­Spektroskopie entschlüsseln. Hinzu kommt, dass Proteine etwa sechs andere Nachbarn kontaktieren und so ein kompliziertes Interaktions­netzwerk bilden.

Nun kann jeder Interessierte online herausfinden, wie ein Protein an Vorgängen im Körper beteiligt ist und wie man es mit welchen Wirkstoffen beeinflussen kann. Neue Arzneimittel können durch gezielte Eingriffe in die Bindungstaschen der Antikörper eingebracht werden, um krankmachende Strukturen von Erregern zu hemmen oder sogar zu zerstören. Synthetische Eiweiße mit vorgege­bener Gestalt können sich wesentlich stärker an Krankheitserreger heften als natür­liche Anti­körper.

Im Labor gibt es bereits einen ­neuen Covid-19-­Impfstoff als 3-D-­Modell eines künstlichen Protein-­Nanopartikels, speziell bestückt mit Sars-CoV-2-­Bruchteilen, um die ­Immunabwehr maximal auf die Virusstruktur aufmerksam zu machen. Intensiv wird auch an Nasensprays mit künstlichen Antikörpern ge­-forscht, die sich mit ihren Eiweißen besser an Viren heften als jedes an-dere bekannte Molekül der Welt.

Neuartige Materialien aus Pro­teinen analog von Seide und Spinnweben mit fein justierbaren Eigenschaften werden entwickelt. In der Biotechnologie Forschende haben bereits Nanomaschinen für den ge­zielten Transport von Medikamenten konstruiert, künstliche Enzyme für die Produktion von nützlichen ­Chemikalien oder plastikfressende Bakterien entwickelt. Schließlich verkürzt die Natur mit ihren Enzymen chemische Reaktionszeiten auf Minuten und Tage, die ohne Katalysatoren ­Millionen von Jahren dauern würden.

Wie funktioniert AlphaFold?

Die Programmierer nutzten für die Prognosen der Proteinstrukturen eine Technik aus der automatisierten Übersetzung von Sprachen. Denn auch dort sind lineare Ketten von Bausteinen zu finden, die sich für sinnvolle Aussagen ständig auf sich selbst zurückfalten. Neuronale Netze wurden mittels Deep-­Learning­-Methoden mit hunderttausenden Proteinstrukturen trainiert, um bekannte Beispiele in Datenbanken zu finden und daraus die wahrscheinlichste 3­D­Form der Aminosäuren zu berechnen. Bislang kann die KI nur eine einzige Gestalt von mehreren Möglichkeiten und auch keine Proteinkomplexe vorhersagen. Das Ziel ist aber die Berechnung aller physikalischen Kräfte im Molekül.

Kontakt zum Autor:

Manfred Kindler, Präsident des Krankenhaus-Kommunikations-Centrums e.V. (KKC), m.kindler@kkc.info