Chai-1 ist ein multimodales Biomolekül-Strukturvorhersagemodell von Chai Discovery (San Francisco), das Proteine, Nukleinsäuren, kleine Liganden und kovalente Modifikationen gemeinsam modelliert. Die Leistung ist auf wichtigen Benchmarks mit AlphaFold 3 vergleichbar; das Modell läuft optional ohne Multiple Sequence Alignments (MSA-frei) und ist Apache-2.0-lizenziert, damit ein klarer Vorteil für die kommerzielle Drug-Discovery-Forschung.
Kosten: Modellgewichte und Inferenz-Code unter Apache-2.0-Lizenz kostenlos. Web-Interface auf chaidiscovery.com nach Account-Registrierung nutzbar. Lokale Ausführung erfordert eigene GPU oder Cloud-Compute (Modal, Lambda Labs, RunPod, typischerweise 1 bis 4 USD pro Strukturvorhersage).
Kategorien
Stärken
- Apache-2.0-Lizenz für Code und Modellgewichte, kommerziell nutzbar ohne Einschränkungen, im Gegensatz zu AlphaFold 3
- MSA-freier Modus für schnelle Vorhersagen ohne aufwändige Sequenz-Datenbanksuche
- Integrierte Vorhersage von Protein-Ligand-Komplexen mit pLDDT- und ipTM-Konfidenz-Scores
- Kostenloser Web-Zugang über chaidiscovery.com für erste Experimente und Validierung
- Vergleichbare Performance zu AlphaFold 3 auf etablierten Protein-Ligand-Benchmarks
- Aktiv weiterentwickelt: Chai-2 (2025) erweitert die Familie um spezialisierte Antikörper-Design-Modelle
Einschränkungen
- Web-Interface in den USA gehostet, für IP-sensitive industrielle Forschung problematisch
- Wie alle Strukturvorhersage-Modelle: intrinsisch ungeordnete Proteine (IDPs) und flexible Loops wenig zuverlässig
- Lokale GPU-Ausführung erfordert A100/H100 80 GB oder L40S 48 GB für volle Komplexität; RTX 4090 nur für kleinere Komplexe
- Jüngere Community als AlphaFold 2/3, weniger validierte Fallbeispiele in der Literatur
- Kein integrierter Analyse-Workflow, Docking, MD-Simulation, Visualisierung müssen separat angeschlossen werden
- Keine deutsche Dokumentation oder Support, Forschungssoftware mit englischsprachiger Community
Passt gut zu
Wann ja, wann nein
Wann ja
- Du brauchst kommerziell nutzbare Strukturvorhersagen ohne Lizenzhürden
- Du arbeitest an Protein-Ligand-Komplexen in frühen Drug-Discovery-Phasen
- Du hast Zugriff auf eine A100/H100-GPU oder bist bereit, Cloud-Compute zu nutzen
- Du willst eine Alternative zu AlphaFold 3 evaluieren oder als zweite Meinung einsetzen
Wann nein
- Du verarbeitest hochsensible IP über das Web-Interface (US-Hosting)
- Du erwartest ein Plug-and-Play-Tool mit fertigem Analyse-Workflow
- Du brauchst zuverlässige Vorhersagen für intrinsisch ungeordnete Proteine
- Du hast weder lokale GPU-Ressourcen noch Cloud-Budget für Inferenz
Kurzfazit
Chai-1 ist die ernstzunehmende Open-Source-Alternative zu AlphaFold 3 für die Vorhersage von Biomolekül-Strukturen, und für viele kommerzielle Anwender die einzig praktikable Wahl. Wo AlphaFold 3 trotz Veröffentlichung 2024 mit Lizenzbeschränkungen für kommerzielle Nutzung kämpft, liefert Chai Discovery Code und Modellgewichte unter Apache 2.0. Die Vorhersagequalität ist auf gängigen Protein-Ligand-Benchmarks vergleichbar, der MSA-freie Modus macht erste Screening-Iterationen schneller. Wer keinen Plug-and-Play-Workflow erwartet und mit Forschungssoftware umgehen kann, bekommt hier ein leistungsfähiges Werkzeug ohne lizenzielle Hintertüren.
Für wen ist Chai-1?
Industrielle Drug-Discovery-Teams: Pharmaunternehmen und Biotech-Startups, die AlphaFold 3 aus Lizenzgründen meiden müssen, finden in Chai-1 eine kommerziell saubere Alternative. Die Apache-2.0-Lizenz erlaubt Integration in proprietäre Pipelines, Modifikation der Modellgewichte und Weiterverteilung, ein juristischer Vorteil, der in vielen R&D-Abteilungen über Stuhl-oder-nicht entscheidet.
Akademische Strukturbiologen: Forschungsgruppen ohne großes Compute-Budget profitieren vom MSA-freien Modus und der schnellen Inferenz. Erste Hypothesen über Bindungstaschen oder Komplex-Geometrien lassen sich in Minuten statt Stunden generieren, ideal für iteratives Hypothesengetriebenes Arbeiten.
Computational-Chemistry-Teams: Wer ohnehin AutoDock Vina, Glide oder Schrödinger im Stack hat, kann Chai-1 vorschalten, um Strukturen für Targets ohne Kristallstruktur bereitzustellen. Die vorhergesagten Komplexe sind direkt als Ausgangspunkt für Docking-Studien nutzbar.
Bioinformatik-Plattformen und SaaS-Anbieter: Die offene Lizenz erlaubt, Chai-1 in eigene Produkte einzubetten, etwa als Strukturvorhersage-Modul in einer SaaS-Plattform für Antikörper-Engineering oder Enzym-Design. Bei AlphaFold 3 ist dieser Weg lizenzrechtlich problematisch.
Weniger geeignet für: Anwender ohne GPU-Zugriff und ohne Cloud-Budget, Teams, die ein vollständig validiertes Tool mit kommerziellem Support brauchen, sowie Projekte, in denen intrinsisch ungeordnete Proteine oder hochflexible Systeme im Fokus stehen, dort sind alle aktuellen Vorhersagemodelle (auch AlphaFold 3) limitiert.
Preise im Detail
| Variante | Preis | Was du bekommst |
|---|---|---|
GitHub chai-lab | 0 EUR | Vollständiger Inferenz-Code, Modellgewichte, Beispielskripte, Apache-2.0-lizenziert |
| Web-Interface (chaidiscovery.com) | 0 EUR mit Account | Browser-basierte Strukturvorhersage, FASTA/SMILES-Input, Ergebnis-Download (PDB/CIF) |
| Cloud-Inferenz (Modal/Lambda/RunPod) | ca. 1 bis 4 USD pro Lauf | Selbst orchestriert; Kosten richten sich nach GPU-Typ und Laufzeit |
| Lokale Ausführung | Hardware-Investment | Einmalige Kosten für A100/H100/L40S-GPU oder Workstation mit RTX 4090 |
| Kommerzielle Lizenz | Nicht erforderlich | Apache 2.0 deckt auch kommerzielle Nutzung ab |
Einordnung: Chai-1 ist eines der wenigen Foundation-Modelle in der Lebenswissenschaft mit echter Open-Source-Lizenz für Modellgewichte. Die Gesamtkosten hängen fast ausschließlich von der Compute-Strategie ab. Für gelegentliche Vorhersagen reicht das kostenlose Web-Interface. Wer regelmäßig hunderte Strukturen vorhersagt, fährt mit Cloud-Inferenz (Modal, Lambda Labs, RunPod) am günstigsten, die einzelne Vorhersage kostet je nach Komplexität 1 bis 4 USD. Lokale GPU-Investitionen rechnen sich erst bei Dauerlast oder strikten IP-Anforderungen, dann allerdings deutlich. Im Vergleich zu kommerziellen Pendants wie Schrödinger oder OpenEye sind die Software-Kosten praktisch null.
Stärken im Detail
Apache 2.0 als juristischer Befreiungsschlag. AlphaFold 3 wurde von Google DeepMind 2024 veröffentlicht, aber die Modellgewichte unterliegen restriktiveren Bedingungen, die kommerzielle Drug-Discovery-Anwendungen erschweren. Chai Discovery hat von Anfang an auf Apache 2.0 gesetzt, sowohl für Code als auch für Modellgewichte. Damit ist Chai-1 in proprietären Pharma-Pipelines, in Biotech-SaaS-Produkten und in patentierten Workflows ohne lizenzielle Hintertüren einsetzbar. Für Compliance-Abteilungen ist das oft das entscheidende Argument.
MSA-freier Modus für schnelle Iteration. Klassische Strukturvorhersage erfordert eine aufwändige Multiple-Sequence-Alignment-Suche (MSA) gegen Datenbanken wie BFD oder MGnify, das kostet Minuten bis Stunden pro Sequenz. Chai-1 kann auch ohne MSA arbeiten und liefert dann Vorhersagen in einem Bruchteil der Zeit, mit nur moderatem Qualitätsverlust für viele Anwendungen. Das ist besonders wertvoll für High-Throughput-Screening neuer Targets oder Schleifen-Iterationen während des Designs.
Multimodalität in einem Modell. Chai-1 modelliert in einem Durchgang Proteine, Nukleinsäuren (DNA/RNA), kleine Liganden mit SMILES-Input und kovalente Modifikationen. Das entspricht dem Konzept von AlphaFold 3, aber in einem offen verfügbaren Modell. Für die Drug Discovery, wo der Komplex Protein + Substrat + Cofaktor das eigentliche Ziel ist, ist das die wichtige Disziplin, in der ältere AlphaFold-2-Pipelines an Grenzen stießen.
Aktive Weiterentwicklung. Mit Chai-2 hat das Unternehmen 2025 ein spezialisiertes Modell für De-novo-Antikörper-Design vorgestellt, fokussiert auf hohe Bindungsraten (“24-well plate”-Erfolg). Das zeigt, dass Chai Discovery die Plattform aktiv weiterbaut und nicht bei einem Release stehen bleibt. Im Dezember 2025 wurde eine Series-B-Runde über 130 Mio. USD bei einer Bewertung von 1,3 Mrd. USD bekannt gegeben, was die mittelfristige Stabilität des Anbieters absichert.
Niedrige Einstiegsschwelle via Web-Interface. Wer keine GPU besitzt und das Modell zunächst nur ausprobieren will, kann auf chaidiscovery.com einen Account anlegen und direkt im Browser Strukturen vorhersagen. Das senkt die Einstiegshürde deutlich, kein Pip-Install, kein CUDA-Setup, keine Konfiguration. Das eignet sich besonders für Validierungsläufe oder Lehre.
Schwächen ehrlich betrachtet
Web-Interface bedeutet US-Hosting. Wer die Web-Variante nutzt, sendet seine Sequenzen und Liganden an Server in den USA. Für Pharmaunternehmen oder Biotechs mit strenger IP-Politik ist das ein Showstopper, gerade bei neuartigen Targets oder proprietären Strukturen. Der saubere Weg ist die lokale Ausführung über das GitHub-Repository, was aber eine Hardware-Investition oder Cloud-Konfiguration verlangt.
Intrinsisch ungeordnete Bereiche bleiben schwierig. Wie alle aktuellen Strukturvorhersage-Modelle (auch AlphaFold 3) liefert Chai-1 bei intrinsisch ungeordneten Proteinen, flexiblen Loops oder konformationell variablen Regionen unzuverlässige Ergebnisse. Niedrige pLDDT-Werte (< 60) in diesen Bereichen sind ein wichtiges Warnsignal, werden aber von unerfahrenen Anwendern leicht übersehen.
Hardware-Anforderungen sind beträchtlich. Die empfohlene Hardware (A100/H100 80 GB oder L40S 48 GB) ist nicht trivial, eine A100 kostet auf dem Gebrauchtmarkt mehrere tausend Euro, neu deutlich mehr. Cloud-Inferenz auf Modal oder Lambda Labs ist eine sinnvolle Alternative, verlangt aber technische Einrichtung. Auf einer RTX 4090 (24 GB) laufen nur kleinere Komplexe; größere Systeme fallen out-of-memory.
Kein Plug-and-Play-Workflow. Chai-1 ist ein Inferenz-Tool, kein Discovery-Workflow. Vor- und Nachverarbeitung (FASTA-Pflege, Docking, MD-Simulation, Visualisierung in PyMOL) müssen selbst orchestriert werden. Im Vergleich zu kommerziellen Plattformen wie Schrödinger Maestro oder OpenEye bekommst du das Modell, aber nicht die Pipeline drumherum. Das ist für erfahrene Computational-Teams kein Problem, für Einzelforscher mit wenig Bioinformatik-Erfahrung dagegen eine echte Hürde.
Validierte Fallbeispiele in der Literatur noch dünn. AlphaFold 2 wird seit 2021 in tausenden Publikationen zitiert; die Community-Validierung ist überwältigend. Chai-1 ist Mitte 2024 veröffentlicht worden und hat noch nicht die gleiche Tiefe an unabhängigen Validierungsstudien. Wer eine konservative Forschungspraxis verfolgt, wird Chai-1-Vorhersagen daher häufiger gegen AlphaFold-2- oder experimentelle Strukturen verifizieren wollen.
Kein deutscher Support, keine kommerzielle Garantie. Als Open-Source-Forschungssoftware gibt es keinen klassischen Support, Issues laufen über GitHub, die Community ist überwiegend englischsprachig. Wer kommerzielle SLAs, Schulungen oder Compliance-Dokumentation braucht, muss die Lücke selbst schließen oder einen Dienstleister einschalten.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Den De-facto-Standard für reine Protein-Vorhersage brauchst | AlphaFold 2 (DeepMind) |
| Multimodale Vorhersage und bist nicht-kommerziell tätig | AlphaFold 3 (über AlphaFold Server) |
| Eine etablierte kommerzielle Plattform mit Docking-Pipeline brauchst | Schrödinger Maestro |
| Speziell Antikörper de novo designen willst | Chai-2 (vom selben Anbieter, 2025) |
| Eine zweite Open-Source-Meinung zu Strukturen willst | Boltz-1 (MIT) oder RoseTTAFold All-Atom |
Erwähnenswert ohne eigene Tool-Seite: Boltz-1 (MIT-lizenziert, ähnliche Architektur, ebenfalls multimodal), ESMFold von Meta (rein protein, sehr schnell), RoseTTAFold All-Atom vom Baker Lab (ähnliche Multimodalität, MIT-Lizenz) und OpenFold (PyTorch-Reimplementierung von AlphaFold 2 unter Apache 2.0). Der Open-Source-Strukturvorhersage-Markt ist 2024/25 deutlich diversifiziert, wer ernsthaft kommerziell arbeitet, sollte mindestens zwei Modelle parallel evaluieren und Vorhersagen gegeneinander prüfen.
So steigst du ein
Schritt 1: Web-Interface zum Kennenlernen. Für einen ersten Blick nutze den Web-Zugang auf chaidiscovery.com (Account-Registrierung erforderlich, kostenlos). Gib eine Protein-Sequenz (FASTA) und einen optionalen Liganden (SMILES) ein, die Vorhersage läuft typischerweise in 5 bis 15 Minuten. Wichtig: Über das Web-Interface gehen Daten an US-Server. Für IP-sensible Strukturen wechsle direkt auf die lokale Variante.
Schritt 2: Lokale Installation für Produktion. Klone das GitHub-Repository (github.com/chaidiscovery/chai-lab), installiere via pip install chai_lab (Python 3.10+, CUDA-fähige GPU, Linux). Die Modellgewichte werden beim ersten Lauf automatisch heruntergeladen. Erstelle eine FASTA-Eingabedatei mit Protein- und optionalen Liganden-Sequenzen. Starte mit einem Skript wie in den examples/-Ordnern. Cloud-Alternative: Modal oder Lambda Labs bieten vorgefertigte Container, bequem, wenn keine lokale GPU vorhanden ist.
Schritt 3: Konfidenz-Scores validieren. Schaue dir nach jedem Lauf die Scores genau an: ipTM > 0,8 signalisiert eine zuverlässige Komplex-Vorhersage; pLDDT-Werte < 60 in der Bindungsregion sind ein Warnsignal für flexible oder ungeordnete Bereiche. Nutze die vorhergesagte Struktur als Ausgangspunkt für Docking-Software (AutoDock Vina, Glide, Schrödinger), nicht als abschließende Antwort. Bei wichtigen Hypothesen vergleiche das Ergebnis mit einer AlphaFold-2- oder AlphaFold-3-Vorhersage als zweite Meinung.
Ein konkretes Beispiel
Eine Forschungsgruppe an der Universität Freiburg entwickelt potenzielle Inhibitoren gegen ein virales Protease-Target, für das keine experimentelle Struktur existiert. Chai-1 liefert im Web-Interface in 12 Minuten eine Komplex-Vorhersage mit dem bekannten Substrat-Peptid (ipTM 0,87). Die Struktur wird im CIF-Format heruntergeladen, die Substrat-Bindungstasche mit dem Substrat als Referenz für AutoDock-Vina-Docking konfiguriert. Aus 30.000 gescreenten Verbindungen entstehen 23 Kandidaten für die biochemische Primärvalidierung. Parallel läuft eine zweite Vorhersage über die lokale chai-lab-Installation auf einer A100-GPU des Rechenzentrums, als Vergleichsmaßstab und für die spätere Publikation, weil die IP-Politik der Universität für Drittmittelprojekte keine externen Web-Services erlaubt. Gesamtkosten für die In-silico-Phase: null Euro Software, zwei Wochen Arbeit eines Doktoranden, ein Tag GPU-Zeit.
DSGVO & Datenschutz
- Web-Interface (chaidiscovery.com): US-Hosting, Anbieter ist Chai Discovery Inc., San Francisco. Sequenz- und Liganden-Daten verlassen die EU. Für proprietäre Forschungs-IP nicht geeignet.
- Lokale Ausführung: Keine Datenübertragung, alle Berechnungen laufen auf der eigenen Hardware. Damit ist Chai-1 lokal vollständig DSGVO-konform einsetzbar, auch in regulierten Branchen.
- Datennutzung: Die Terms of Service des Web-Interface erlauben Chai Discovery die Nutzung anonymisierter Eingaben zur Produktverbesserung. Wer das nicht möchte, muss die lokale Variante verwenden.
- Auftragsverarbeitung (AVV): Für das Web-Interface aktuell nicht standardmäßig verfügbar. Für Enterprise-Kooperationen ist ein direkter Kontakt mit Chai Discovery erforderlich.
- Empfehlung für Unternehmen: Für jegliche kommerzielle Forschung mit IP-Relevanz ausschließlich lokal oder über kontrollierte EU-Cloud-Anbieter (z. B. eigene Modal-Region in der EU, eigene Kubernetes-Cluster auf Hetzner GPU oder STACKIT) betreiben. Das Web-Interface ist für Lehre, Validierung und nicht-IP-relevante Tests gut, für produktive Drug Discovery in regulierten Branchen nicht.
Gut kombiniert mit
- AutoDock Vina / Schrödinger Glide, Chai-1 liefert die Komplex-Struktur, klassische Docking-Software führt die Verfeinerung und das eigentliche Screening durch. Das ist das Standard-Tandem in der Drug Discovery.
- PyMOL oder ChimeraX, für die Visualisierung und manuelle Analyse der vorhergesagten Strukturen. Die Konfidenz-Scores lassen sich farbcodiert darstellen, was die Interpretation deutlich erleichtert.
- Claude oder ChatGPT, als Coding-Assistent für die Inferenz-Skripte, FASTA-Aufbereitung und Auswertungs-Pipelines. Chai-1 ist Forschungssoftware ohne UI, die meiste Produktivität entsteht durch eigene Wrapper-Skripte, und LLMs beschleunigen das Scripting erheblich.
Unser Testurteil
Chai-1 verdient 4 von 5 Sternen. Das Modell liefert auf den wichtigen Protein-Ligand-Benchmarks Vorhersagen, die mit AlphaFold 3 mithalten, und kommt dabei mit einer kommerziell sauberen Apache-2.0-Lizenz für Code und Modellgewichte, was im Foundation-Model-Markt 2024/25 eine Seltenheit ist. Die Multimodalität (Proteine, Nukleinsäuren, kleine Moleküle, kovalente Modifikationen) und der MSA-freie Modus machen Chai-1 zu einem ernsthaften Werkzeug für industrielle Drug Discovery. Den fünften Stern kostet die fehlende Plug-and-Play-Pipeline, die noch dünne Literatur-Validierung, das US-Hosting des Web-Interface und die Hardware-Anforderungen für die lokale Ausführung. Wer mit Forschungssoftware umgehen kann und kommerzielle Lizenzfreiheit braucht, hat hier eines der besten verfügbaren Werkzeuge.
Was wir bemerkt haben
- September 2024, Chai Discovery hat Chai-1 veröffentlicht und damit unmittelbar nach AlphaFold 3 eine Open-Source-Alternative auf vergleichbarem Niveau bereitgestellt. Die Apache-2.0-Lizenz für Code und Gewichte war eine bewusste strategische Differenzierung gegenüber AlphaFold 3.
- März 2025, Mit Version 0.6.1 wurde der
chai-lab-Stack als stabile Inferenz-Bibliothek auf PyPI etabliert. Die Installation perpip install chai_labist seitdem reproduzierbar und CI-tauglich. - 2025, Chai Discovery hat Chai-2 vorgestellt, ein spezialisiertes Modell für De-novo-Antikörper-Design. Das zeigt, dass das Team über die reine Strukturvorhersage hinaus eine Produktfamilie aufbaut, und nicht bei einem einmaligen Release stehen bleibt.
- Dezember 2025, Series-B-Finanzierung über 130 Mio. USD bei einer Bewertung von 1,3 Mrd. USD bekannt gegeben (OpenAI gehört zu den Investoren). Das stabilisiert den Anbieter mittelfristig und macht die Open-Source-Strategie ökonomisch tragfähig, Chai monetarisiert primär über Enterprise-Services, nicht über das Modell selbst.
- Januar 2026, Chai Discovery gab eine Forschungskooperation mit Eli Lilly zur Beschleunigung der Biologika-Entwicklung bekannt, ein Beleg für die wachsende industrielle Akzeptanz der Plattform.
- Juni 2026, Eine EU-gehostete Variante des Web-Interface ist weiterhin nicht verfügbar. Für IP-kritische Pharma- und Biotech-Anwendungen bleibt die lokale Ausführung der einzige saubere Weg. Diese Lücke ist seit dem Release unverändert.
Quellen
- Chai Discovery - chai-lab (GitHub). https://github.com/chaidiscovery/chai-lab (abgerufen am 2026-06-13). Apache-2.0-Lizenz fuer Code und Modellgewichte, Installation via pip install chai_lab==0.6.1, multimodale Vorhersage (Proteine, kleine Molekuele, DNA, RNA, Glykosylierungen), MSA-freier Standardmodus, empfohlene GPU A100/H100 80 GB oder L40S 48 GB.
- TechCrunch - Chai Discovery raises $130M Series B at $1.3B valuation. https://techcrunch.com/2025/12/15/openai-backed-biotech-firm-chai-discovery-raises-130m-series-b-at-1-3b-valuation/ (abgerufen am 2026-06-13). Series-B-Finanzierung ueber 130 Mio. USD bei 1,3 Mrd. USD Bewertung im Dezember 2025, OpenAI als Investor.
Diesen Inhalt teilen:
Empfohlen in 1 Use Cases
Empfohlen für diese Branchen
Arthur Atlas
KI-Analyst
So entsteht diese Bewertung
Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.
Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.
Preise geändert, Feature veraltet oder etwas fehlt?
Wir freuen uns über Hinweise und Ergänzungen.
Du arbeitest bei Chai Discovery?
Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.
Nicht sicher, ob Chai-1 zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.
KI-Tools und Trends
KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools
Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.