SNI INSight: Ist Alphafold frei zugänglich? zierungsprojekten zwar Millionen von Proteinsequenzen von den unterschiedlichsten Organismen gibt, aber nur Timm Maier: Der Quellcode für die neuesten AlphaFold- Hunderttausende von experimentell ermittelten Prote- Versionen wurde erst mit einer Verzögerung nach der instrukturen, da jede Struktur Jahre komplexer Studien wissenschaftlichen Publikation freigegeben, ist aber benötigen kann, um gelöst zu werden. letztendlich seit November verfügbar. Wie auch bei AlphaFold lernt aus diesen Strukturen und Se- vielen anderen KI-Produkten basiert AlphaFold auf frei quenzen, um nun hochpräzise Vorhersagen für viele verfügbaren Daten, die grösstenteils durch akademische Millionen von Sequenzen zu ermöglichen, was uns der Institutionen generiert wurden. Die Nutzung der trai- Schliessung dieser Lücke sehr viel näher bringt. nierten Modelle ist im Gegensatz zu den zum Training verwendeten Daten nun auf nicht-kommerzielle Anwen- dungen limitiert, was die Gefahr einer Monopolisierung SNI INSight: Wie lange dauert die Analyse mit Alpha- neuer Methoden mit sich bringt. Allerdings ist die wissen- Fold? schaftliche Gemeinschaft schon in zahlreichen Projekten daran, gleichwertige Methoden auch frei zur Verfügung Janani Durairaj: Das DeepMind-Team hat in Zusammen- zu stellen. arbeit mit dem European Bioinformatics Institute des European Molecular Biology Laboratory (EMBL-EBI) die AlphaFold-Datenbank eingerichtet, in der Vorhersagen SNI INSight: Welche Au昀氀ösung haben die vorherge- für mehr als 200 Millionen Proteinsequenzen enthalten sagten dreidimensionalen Strukturen? sind. Innerhalb von Sekunden erhält man bei Nennung des Proteinnamens die Strukturvorhersage. Janani Durairaj: Die Au昀氀ösung von Proteinstruk- Die Zeit für eine Strukturvorhersage für eine be- turen wird in der Regel in der Grössenordnung von stimmte Sequenz, die nicht in der Datenbank enthalten -10 Angström (10 m) gemessen – was dem Bereich der ist, hängt von der Länge des Proteins und den zur Verfü- interatomaren Abstände entspricht. Experimentelle gung stehenden Rechenressourcen ab. Sie liegt zwischen Strukturbestimmungsmethoden wie die Röntgenkristal- Minuten und Stunden – was sich deutlich unterschiedet lographie erreichen Genauigkeiten von bis zu 1 Angst- von den Monaten und Jahren, die für die experimentelle röm. Bei monomeren Proteinen (Proteine mit nur einer Strukturaufklärung benötigt werden. Aminosäurenkette) kann AlphaFold diese Genauigkeit Eine sehr nützliche Community-Ressource ist Co- ebenfalls erreichen und liegt damit innerhalb des Fehler- labFold, eine interaktive webbasierte Plattform, auf der bereichs experimenteller Methoden. man eine Proteinsequenz eingibt und eine von AlphaFold vorhergesagte Struktur erhält, ohne dass ein Installati- Timm Maier: Wir sollten dabei beachten, dass ein Gross- onsprozess oder Rechenressourcen erforderlich sind. teil der Proteine aus mehreren Aminosäureketten besteht und dass in vielen Fällen eine «durchschnittliche» Genau- igkeit nicht sehr aussagekräftig ist. So können beispiels- SNI INSight: Wie zuverlässig sind die Vorhersagen von weise einzelne Mutationen in einem reaktiven Zentrum AlphaFold? eines Enzyms die Substratspezi昀椀tät komplett verändern, die Gesamtstruktur ändert sich im Durchschnitt aller Janani Durairaj: Mit jeder Strukturvorhersage liefert Aminosäuren dann jedoch nur um den Bruchteil eines AlphaFold eine Qualitätseinschätzung, die uns hilft die Angströms. SNI INSight: Es ist die Rede von riesigen Datenmen- gen, in welchen Bereichen bewegen wir uns da? Janani Durairaj: Wenn wir an alle möglichen 3D-Kon- formationen denken, die ein Protein annehmen kann, sprechen wir von einer astronomischen Anzahl mög- licher Konformationen. So könnte beispielsweise ein Protein mit 100 Aminosäuren theoretisch zu mehr als 198 3 verschiedenen Konformationen führen, selbst wenn man konservativ schätzt. Dies schliesst die Aufzählung dieser Konformationen als algorithmische Lösung für die Vorhersage von Proteinstrukturen sofort aus. Aus einem anderen Blickwinkel betrachtet, gibt Janani Durairaj, die als Ambizione-Stipendiatin ihre eigene Forschungs- es die sogenannte «Sequenz-Struktur»-Lücke. Diese be- gruppe aufbaut, hat intensiv an der Erstellung des «Protein Universe At- sagt, dass es aufgrund von weltweit laufenden Sequen- las» mitgearbeitet. Dies ist ein Webdienst, mit dem Nutzer:innen durch ein Universum aus Millionen bekannter Proteine navigieren können. SNI INSight Dezember 2024 6

SNI INSight Dezember 2024 - Page 6 SNI INSight Dezember 2024 Page 5 Page 7