Zum Inhalt springen
⚠️ Hybrid Zuletzt geprüft: Juni 2026

Weaviate

Weaviate B.V.

4/5
Tool öffnen

Open-Source-Vektordatenbank mit eingebauten Vectorizer-Modulen für RAG-Systeme. Als Unternehmen niederländischer Rechtsform (Weaviate B.V.) mit Self-Hosting- und EU-Hosting-Option eine starke Wahl für DSGVO-konforme KI-Anwendungen auf eigenen Dokumenten.

Kosten: Open Source selbst gehostet kostenlos, Weaviate Cloud: kostenloser Free-Tier, Flex ab 45 USD/Monat, Plus ab 280 USD/Monat, Premium ab 400 USD/Monat

Kategorien

Stärken

  • Open Source, selbst hostbar auf Hetzner, Azure EU oder any on-premise Server
  • Eingebaute Vectorizer-Module für OpenAI, Cohere, HuggingFace, kein separates Embedding-Service nötig
  • Hybrid-Suche kombiniert semantische Vektorsuche und BM25-Keyword-Suche in einem Query
  • Native Multi-Tenancy für strikte Mandantentrennung in SaaS-Produkten
  • GraphQL und REST API, saubere Integration in beliebige Tech-Stacks
  • SOC-2-konform und HIPAA-konform, Compliance-Dokumente über Trust Portal abrufbar

Einschränkungen

  • Erfordert Entwicklerressourcen für Setup, Betrieb und Skalierung
  • Kein visuelles Interface, alles über API und CLI
  • Bezahlte Cloud-Pläne (Flex ab 45 USD/Monat) für produktive Workloads spürbar teurer als ein eigener Server
  • Kleineres Ökosystem als Elasticsearch für klassische Suchaufgaben
  • Lernkurve bei Schema-Design, Vectorizer-Konfiguration und Performance-Tuning

Passt gut zu

Entwicklerteams DSGVO-sensible Anwendungen RAG-Systeme Self-Hosting Enterprise-KI

Wann ja, wann nein

Wann ja

  • Du baust eine RAG-Pipeline auf eigenen Dokumenten und willst volle Datenkontrolle
  • Dein Unternehmen hat DSGVO-Anforderungen, Self-Hosting auf EU-Infrastruktur ist Pflicht
  • Du brauchst Hybrid-Suche (semantisch + Volltextsuche) in einem System
  • Du willst nicht vendor-locked in eine proprietäre Cloud-Lösung sein

Wann nein

  • Du suchst eine No-Code-Lösung ohne Entwicklerressourcen
  • Du brauchst sofort einsatzbereite Managed Services ohne DevOps-Aufwand
  • Dein Projekt ist ein einfacher Prototyp, Chroma reicht völlig aus
  • Du hast wenig Erfahrung mit Docker, Kubernetes oder Datenbankoperationen

Kurzfazit

Weaviate ist die stärkste Wahl für Teams, die RAG-Systeme mit vollständiger Datenkontrolle aufbauen wollen. Als Open-Source-Vektordatenbank eines Unternehmens niederländischer Rechtsform (Weaviate B.V.) lässt sie sich auf eigener EU-Infrastruktur betreiben, ohne dass auch nur ein Dokument das eigene Rechenzentrum verlässt. Die eingebauten Vectorizer-Module (OpenAI, Cohere, HuggingFace) nehmen einem viel Integrationsarbeit ab, und die native Hybrid-Suche kombiniert semantisches Verständnis mit klassischer Keyword-Suche. Schwäche: Weaviate ist kein Tool für Nicht-Entwickler. Wer keinen Engineer im Team hat, ist mit einem verwalteten Cloud-Service besser bedient.

Für wen ist Weaviate?

ML-Engineers und Backend-Entwickler: Weaviate ist explizit für Entwickler gebaut. Wer RAG-Pipelines, semantische Suche oder KI-Assistenten auf eigenen Daten aufbaut, findet hier eine ausgereifte, API-first Lösung mit GraphQL und REST. Die Python-, JavaScript- und Go-Clients sind gut dokumentiert.

Datenschutzbeauftragte und DSGVO-sensible Branchen: Für Kanzleien, Krankenhäuser, Behörden und Finanzinstitute ist Self-Hosting auf eigener Hardware oder EU-Cloud die einzige akzeptable Option. Weaviate ist dafür gebaut, kein anderes major Vector-DB-Produkt macht das so konsequent möglich.

SaaS-Anbieter mit Multi-Mandanten-Anforderungen: Native Multi-Tenancy erlaubt es, Tausende von Kundenmandanten in einer Instanz mit strikter Datentrennung zu betreiben. Das spart Infrastrukturkosten gegenüber einer Instanz-pro-Kunde-Architektur erheblich.

Unternehmen, die Vendor Lock-in vermeiden wollen: Weaviate ist Open Source (Apache 2.0). Kein Vendor kann Preise ändern, Funktionen sperren oder den Dienst einstellen, ohne dass du einen Ausweg hast. Für kritische KI-Infrastruktur ist das ein strategisches Argument.

Weniger geeignet für: Prototypen-Entwickler ohne Production-Anforderungen (Chroma ist einfacher), Teams ohne DevOps-Kapazität, und alle, die eine vollständig verwaltete Lösung ohne Betriebsaufwand suchen.

Preise im Detail

PlanPreisWas du bekommst
Open SourceKostenlosSelbst gehostete Instanz, vollständiger Funktionsumfang, Community-Support über Forum und GitHub
Cloud Free0 USD/MonatDauerhaft kostenloser Cloud-Tier: 100.000 Objekte, 1 GB Memory, 10 GB Disk, eine Collection, Support über Community-Slack, keine Kreditkarte nötig
Flexab 45 USD/MonatGeteilter Cloud-Cluster mit Replikation, 99,5 % Uptime-SLA, E-Mail-Support (nächster Werktag bei kritischen Problemen), nutzungsbasierte Abrechnung
Plusab 280 USD/MonatGeteilter Cluster, SSO/SAML-Anmeldung, 99,9 % Uptime-SLA, 30 Tage Backup-Aufbewahrung, 8-Stunden-Response bei kritischen Problemen (Jahresvertrag)
Premiumab 400 USD/MonatGeteilter oder dedizierter Cluster, bis zu 99,95 % Uptime, 1-Stunden-Response für kritische Probleme, globale Cloud-Abdeckung (AWS, GCP, Azure), technisches Account-Team (Jahresvertrag)

Die Flex-Kosten setzen sich aus mehreren Dimensionen zusammen: Vektor-Dimensionen (ab 0,00465 USD pro Million), Storage (ab 0,12 USD pro GiB) und optionale Embeddings-Services (0,025–0,065 USD pro Million Tokens, je nach Modell). Bei den höheren Plänen sinken die Stückkosten (Premium: ab 0,002718 USD pro Million Dimensionen, ab 0,10 USD/GiB).

Einordnung: Open Source Self-Hosting ist für produktionsreife Setups wirtschaftlich unschlagbar, wer einen Hetzner-Server für 30 EUR/Monat mietet, bekommt volle Funktionalität. Der kostenlose Cloud-Free-Tier (100.000 Objekte) reicht für Prototypen und kleine Experimente ohne eigene Infrastruktur. Flex lohnt sich, wenn du DevOps-Aufwand vermeiden willst, aber noch keine 280 USD/Monat Budget hast. Plus bringt SSO/SAML und höhere SLAs für Teams, Premium ist für Enterprise-Setups mit dedizierter Infrastruktur und Account-Management.

Stärken im Detail

Open Source mit echter Produktionsreife. Weaviate ist nicht nur “auch Open Source”, das Projekt zählt zu den populärsten Vektordatenbanken auf GitHub, ist Apache 2.0 lizenziert und wird aktiv von einem kommerziellen Anbieter entwickelt. Version 1.30 brachte BlockMax WAND-Algorithmus mit bis zu 10-fachem Speedup bei Keyword-Suchen. Du bekommst eine ausgereifte Produktionsdatenbank ohne Lizenzkosten.

Eingebaute Vectorizer-Module nehmen Komplexität heraus. Andere Vektordatenbanken erwarten, dass du Embeddings extern berechnest und dann übergibst. Weaviate kann das direkt, über 20 ML-Modelle und Frameworks sind integriert, darunter OpenAI text-embedding, Cohere embed und lokale HuggingFace-Modelle. Das reduziert die Anzahl der Systemkomponenten erheblich.

Hybrid-Suche in einem Query. Die Kombination aus semantischer Vektorsuche und klassischer BM25-Keyword-Suche ist in Weaviate nativ, kein zweites System, kein Extra-Aufwand. Das ist wichtig, weil reine Vektorsuche bei exakten Begriffen (Produktnummern, Namen, Codes) oft schlechter abschneidet als Keyword-Suche. Hybrid gibt dir das Beste aus beiden Welten.

Native Multi-Tenancy für skalierbare SaaS-Produkte. Jeder Mandant bekommt isolierten Speicher innerhalb einer Instanz. Das ermöglicht Systeme mit Tausenden von Kunden auf gemeinsamer Infrastruktur, ohne Sicherheitskompromisse. Tenant-Aktivierung und -Deaktivierung (“cold” Tenants) spart Ressourcen bei inaktiven Accounts.

GraphQL und REST API für maximale Flexibilität. Weaviate bietet beide Schnittstellen, GraphQL für komplexe Abfragen mit Filterlogik, REST für CRUD-Operationen. Clients für Python, JavaScript/TypeScript und Go sind offiziell unterstützt und gut gepflegt.

Schwächen ehrlich betrachtet

Kein visuelles Interface, alles Terminal. Weaviate hat keine Web-UI für Nicht-Entwickler. Es gibt Community-Projekte für einfache Visualisierungen, aber produktionsreife dashboards musst du selbst bauen. Für Teams, die Datenbankoperationen durch einen Datenanalysten (ohne Coding-Kenntnisse) durchführen lassen wollen, ist das ein echtes Problem.

Betriebsaufwand bei Self-Hosting unterschätzt. Docker-Setup ist einfach, aber Produktions-Betrieb bedeutet: Backups konfigurieren, Monitoring einrichten, Updates testen, Speicher managen. Wer das nicht intern abdecken kann, sollte realistisch die Cloud-Preise gegen DevOps-Zeit gegenrechnen.

Bezahlte Cloud-Pläne für echte Workloads spürbar teuer. Inzwischen gibt es zwar einen kostenlosen Dauertier (100.000 Objekte, 1 GB Memory), der für Prototypen reicht. Sobald du aber über diese Grenzen hinaus produktiv wirst, startet die nutzungsbasierte Abrechnung bei Flex (ab 45 USD/Monat) und kann bei wachsenden Datenmengen schnell steigen. Wer ohnehin DevOps-Kapazität hat, fährt mit einem selbst gehosteten Server fast immer günstiger. Wer reine Cloud-Convenience will, sollte die laufenden Kosten gegen Pinecone gegenrechnen.

Schema-Design-Lernkurve. Weaviate ist schema-basiert: Du definierst Klassen, Properties und Vectorizer-Konfiguration vorab. Änderungen am Schema in Production sind eingeschränkt möglich. Für Entwickler, die schnell iterieren wollen, ist das anfangs mühsam, Chroma ist hier wesentlich flexibler.

Kleineres Ökosystem als Elasticsearch. Für Teams, die aus der klassischen Suche kommen, fehlen viele Elasticsearch-Ökosystem-Tools. Log-Aggregation, Analytics-Dashboards und fertige Konnektoren gibt es bei Weaviate nicht in dieser Breite.

Alternativen im Vergleich

Wenn du……nimm stattdessen
Eine vollständig verwaltete Cloud-Lösung ohne Betriebsaufwand willstPinecone
Einen einfachen lokalen Prototyp bauen willst (kein Production-Setup)Chroma
Klassische Volltextsuche mit optionaler Vektor-Erweiterung brauchstOpenSearch
Bestehende Elasticsearch-Infrastruktur um Vektorsuche erweitern willstElasticsearch

Weaviate ist die richtige Wahl, wenn du DSGVO-Konformität, Open-Source-Freiheit und Produktionsreife gleichzeitig brauchst. Für reine Cloud-Convenience ohne Datenschutzanforderungen ist Pinecone oft einfacher zu starten.

So steigst du ein

Schritt 1: Starte Weaviate lokal mit Docker: docker run -p 8080:8080 cr.weaviate.io/semitechnologies/weaviate:latest. Das reicht für erste Entwicklung und Tests. Für DSGVO-sensible Produktionsdaten empfiehlt sich Self-Hosting auf Hetzner Cloud (Frankfurt), Azure Germany North oder einer anderen zertifizierten EU-Cloud. Für den schnellen Einstieg ohne Setup: der kostenlose Weaviate-Cloud-Free-Tier (100.000 Objekte, dauerhaft kostenlos).

Schritt 2: Definiere ein Schema für deine Daten und wähle einen Vectorizer. Für die meisten RAG-Anwendungen empfiehlt sich text2vec-openai (OpenAI Ada) oder ein lokales text2vec-transformers-Modell für maximale Datenkontrolle. Lade deine Dokumente mit dem Python-Client hoch, Weaviate vektorisiert automatisch: client.collections.get("Dokument").data.insert({"inhalt": "...", "quelle": "..."}).

Schritt 3: Baue die RAG-Pipeline: Weaviate findet per Hybrid-Suche die relevantesten Textpassagen, diese landen als Kontext in deinem LLM-Prompt. Mit LangChain oder LlamaIndex ist Weaviate in wenigen Zeilen integriert: WeaviateVectorStore als Retriever, dann RetrievalQA Chain drüber. Ergänze Metadaten-Filter (Autor, Datum, Abteilung), um Antworten auf bestimmte Dokumentbereiche einzugrenzen.

Ein konkretes Beispiel

Eine Berliner Rechtsanwaltskanzlei mit 500.000 internen Dokumenten, Verträge, Urteile, Gutachten der letzten 20 Jahre, baut mit Weaviate einen internen Recherche-Assistenten. Weaviate läuft on-premises auf einem dedizierten Server in der Kanzlei, kein einziges Dokument verlässt das interne Netzwerk. Die Anwälte können in natürlicher Sprache suchen: “Urteile zu Mietminderung bei Schimmel in Altbauten ab 2020, nur BGH und OLG Hamburg.” Die Hybrid-Suche kombiniert semantisches Verständnis (“Mietminderung Schimmel”) mit exakten Filtern (Gericht, Datum). Was früher 45 Minuten manuelle Datenbankrecherche kostete, dauert jetzt 8 Sekunden, mit direkten Textausschnitten aus den relevantesten drei Dokumenten.

DSGVO & Datenschutz

  • Rechtsform und Standort: Weaviate B.V. ist eine niederländische Rechtsform; das Unternehmen beschreibt sich selbst als global verteiltes, remote-first Startup. Eine einzelne offizielle Firmenadresse wird nicht prominent ausgewiesen.
  • Datenhosting Self-Hosting: Vollständige Kontrolle, du bestimmst, auf welchem Server in welchem Land deine Daten liegen. On-Premises oder EU-Cloud möglich.
  • Datenhosting Weaviate Cloud: Läuft auf AWS, GCP und Azure. Region und Provider wählst du beim Cluster-Setup, prüfe die jeweils verfügbaren EU-Regionen direkt in der Konsole.
  • Sicherheitsstandards: Laut Hersteller SOC-2- und HIPAA-konform, rollenbasierte Zugriffskontrolle, native Multi-Tenancy, automatische tägliche Backups und Multi-Availability-Zone-Deployment. Spezifische Zertifikatsstufen (SOC 2 Type 1/Type 2, ISO 27001) sind über das Trust Portal abrufbar, aber nicht öffentlich auf der Webseite ausgewiesen.
  • Datenverschlüsselung: In Transit und At Rest verschlüsselt
  • Trust Portal und AVV: Compliance-Dokumente und ein Datenverarbeitungsvertrag (DPA/AVV) sind über das Trust Portal (trust.weaviate.io) abrufbar
  • Datenkontrolle: Bei selbst gehosteten Instanzen verlassen die Inhalte deine Infrastruktur nicht. Bei Weaviate Cloud gelten die Vertrags- und Datenschutzbedingungen des gewählten Plans.
  • Empfehlung für Unternehmen mit hohen DSGVO-Anforderungen: Self-Hosting auf EU-Infrastruktur ist die sicherste Option. Für alle, die Cloud nutzen: EU-Region explizit beim Cluster-Setup wählen und den DPA/AVV über das Trust Portal abschließen.

Gut kombiniert mit

  • OpenSearch, OpenSearch übernimmt klassische Log-Aggregation und Analytics, Weaviate liefert die semantische Suche. Beide Systeme parallel eingesetzt decken Volltext- und Vektorsuchbedürfnisse ab, ohne Kompromisse in einem der Bereiche.
  • Pinecone, In Multi-Cloud-Architekturen nutzen manche Teams Weaviate für DSGVO-sensitive EU-Daten und Pinecone für globale, weniger sensible Workloads, gleiche RAG-API, verschiedene Datenkategorien.
  • Chroma, Chroma als lokale Entwicklungs- und Testdatenbank, Weaviate für Production. Same API-Pattern, einfacher Wechsel: Entwickler iterieren lokal schnell, ohne Produktionsdaten zu riskieren.

Unser Testurteil

Weaviate verdient 4 von 5 Sternen. Die Kombination aus Open-Source-Freiheit, eingebauten Vectorizer-Modulen, nativer Hybrid-Suche und der klaren EU-DSGVO-Story macht es zur besten Wahl für ernst gemeinte RAG-Infrastruktur in datenschutzbewussten Organisationen. Den fünften Stern kostet der fehlende DevOps-freie Einstieg: Wer nicht bereit ist, mindestens einen Engineer für Setup und Betrieb einzuplanen, wird frustriert sein. Für Entwicklerteams mit klaren DSGVO-Anforderungen gibt es aber keine bessere Open-Source-Alternative.

Was wir bemerkt haben

  • April 2023 — Weaviate sammelte eine 50-Millionen-Dollar-Series-B-Finanzierungsrunde ein (Index Ventures, Battery Ventures, NEA, ING Ventures u. a.). Das Unternehmen ist finanziell gut aufgestellt und investiert stark in das managed Cloud-Angebot.
  • 2024/2025 — Version 1.30 brachte den BlockMax-WAND-Algorithmus mit bis zu 10-fachem Speedup bei Keyword-Suchen, eine erhebliche Performance-Verbesserung für Hybrid-Search-Anwendungsfälle.
  • Juni 2026 — Korrektur einer früheren Annahme: Weaviate Cloud bietet inzwischen wieder einen dauerhaft kostenlosen Free-Tier (100.000 Objekte, 1 GB Memory, 10 GB Disk) statt nur eines 14-tägigen Trials. Außerdem gibt es einen neuen Plus-Plan (ab 280 USD/Monat) mit SSO/SAML zwischen Flex und Premium. Die Stückpreise für Vektor-Dimensionen und Storage sind niedriger als in unserer früheren Angabe.

Quellen

  1. Weaviate – Cloud Pricing. https://weaviate.io/pricing (abgerufen am 2026-06-14). Free-Tier (0 USD, 100.000 Objekte, 1 GB Memory, 10 GB Disk), Flex ab 45 USD/Monat (99,5 % Uptime), Plus ab 280 USD/Monat (99,9 % Uptime, SSO/SAML), Premium ab 400 USD/Monat (bis 99,95 % Uptime, dediziert moeglich); Vektor-Dimensionen ab 0,00465 USD/Mio. (Flex), Storage ab 0,12 USD/GiB (Flex).
  2. Weaviate – Security & Compliance. https://weaviate.io/security (abgerufen am 2026-06-14). SOC 2 und HIPAA konform, Verschlüsselung in Transit und at Rest, rollenbasierte Zugriffskontrolle, native Multi-Tenancy, automatische tägliche Backups, Multi-AZ-Deployment, Trust Portal unter trust.weaviate.io.
  3. Weaviate – About Us. https://weaviate.io/company/about-us (abgerufen am 2026-06-14). Global remote-first Startup, 50 Mio. USD Series B (April 2023), Investoren u. a. Index Ventures, Battery Ventures, NEA, ING Ventures.

Diesen Inhalt teilen:

Empfohlen in 8 Use Cases

Empfohlen für diese Branchen

Arthur Atlas

KI-Analyst

So entsteht diese Bewertung

Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.

Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.

Preise geändert, Feature veraltet oder etwas fehlt?

Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Du arbeitest bei Weaviate B.V.?

Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.

Testzugang anbieten

Nicht sicher, ob Weaviate zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen

KI-Tools und Trends

KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools

Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar