Zum Inhalt springen
Freemium 🇩🇪 Deutschsprachig ⚠️ Hybrid Zuletzt geprüft: Juni 2026

Picovoice

Picovoice Inc.

4/5
Tool öffnen

On-Device-Plattform für Sprach-, Sprach- und Bild-KI auf eingebetteten Geräten (IoT, Mikrofone, ARM-Prozessoren, Mobilgeräte). Verarbeitet Audio vollständig lokal, kein Cloud-Backend, keine Netzwerk-Latenz, keine Daten verlassen das Gerät. Umfasst Wake-Word-Erkennung (Porcupine), Streaming- und Batch-STT (Cheetah/Leopard), Speech-to-Intent (Rhino), Text-to-Speech (Orca), Sprecher-Erkennung (Eagle), Rauschunterdrückung (Koala) sowie on-device LLMs (picoLLM). Modelle sind kompakt genug für ressourcenbeschränkte Embedded-Hardware.

Kosten: Kostenloser Entwickler-Account mit Test-Kontingent (keine Kreditkarte nötig); kommerzielle und Produktions-/IoT-Lizenzen über Sales (Contact Sales). Öffentliche Preisliste wurde 2024/25 durch ein vertriebsgeführtes Modell ersetzt.

Kategorien

Stärken

  • Vollständig on-device, kein Audio verlässt das Gerät, kein Cloud-Backend nötig
  • Kompakte Modelle laufen auf ARM-Prozessoren, Raspberry Pi und Mobilgeräten
  • Integrierter Stack: Wake Word, STT, TTS, Intent, Sprecher-Erkennung in einer Plattform
  • Deutsch wird produktiv unterstützt, Leopard-STT erreicht 14,5 % WER (für ein On-Device-Modell stark)
  • Privacy-by-Design: keine Audioübertragung, dadurch DSGVO-Risiko stark reduziert
  • Über ein Dutzend SDKs (Python, C, Java, .NET, Web, Flutter, React Native)

Einschränkungen

  • Reines Entwickler-Werkzeug, kein No-Code-Zugang, Firmware-/App-Entwicklung erforderlich
  • Öffentliche Preise abgeschafft, Produktions- und IoT-Lizenzen nur über Sales, intransparent
  • Kommerzielle Lizenzen für Hardware-Deployments sind teuer und stückzahlabhängig
  • Offline-only: keine Cloud-Fallback-Option für sehr komplexe Anfragen
  • Custom Wake-Words/Modelle in der freien Stufe limitiert, produktiv kostenpflichtig

Passt gut zu

Sprachgesteuerte Geräte ohne Cloud-Anbindung (IoT, Spielzeug, Wearables) Datenschutzkritische Anwendungen ohne Mikrofon-Streaming Industrielle und Offline-Szenarien mit Sprachbedienung ohne Internet Mobile Apps, die Sprache lokal verarbeiten sollen (kein API-Roundtrip)

Wann ja, wann nein

Wann ja

  • Audio darf das Gerät aus Datenschutz- oder Latenzgründen nicht verlassen
  • Du baust ein eingebettetes Produkt mit Sprachsteuerung (IoT, Wearable, Automotive)
  • Du brauchst Sprachverarbeitung offline, ohne stabile Internetverbindung
  • Du hast Entwickler-Ressourcen und willst volle Kontrolle über die Pipeline

Wann nein

  • Du suchst eine fertige No-Code- oder Plug-and-Play-Lösung
  • Du brauchst absolute Spitzen-Genauigkeit großer Cloud-Modelle (z. B. Diktat in Medizin)
  • Dein Use Case erlaubt Cloud-Verarbeitung und du willst minimalen Entwicklungsaufwand
  • Du brauchst transparente, planbare Listenpreise ohne Vertriebsgespräch

Kurzfazit

Picovoice ist die führende Plattform, wenn Sprach-KI vollständig auf dem Gerät laufen muss, ohne dass auch nur eine Audioaufnahme das Mikrofon verlässt. Während Deepgram, Whisper-APIs oder Cloud-Assistenten jeden Sprachschnipsel an einen Server schicken, verarbeitet Picovoice Wake Words, Spracherkennung, Intent-Klassifikation und sogar kompakte LLMs lokal auf ARM-Prozessoren, Mobilgeräten oder im Browser. Das ist für Datenschutz, Latenz und Offline-Betrieb ein echter struktureller Vorteil, und Picovoice macht es technisch sauber, mit über 75 Fortune-500-Kunden (Meta, LG, Netflix, NASA, Ferrari) als Referenz. Die Kehrseite: Es ist ein reines Entwickler-Werkzeug, die einst öffentliche Preisliste wurde durch ein vertriebsgeführtes Modell ersetzt, und für produktive Hardware-Deployments wird es schnell teuer. Wer kein Embedded- oder App-Team hat, ist hier falsch.

Für wen ist Picovoice?

Hardware- und IoT-Hersteller: Wer Sprachsteuerung in ein physisches Produkt einbaut, Smart-Home-Geräte, Wearables, Industrieterminals, Spielzeug, bekommt mit Picovoice einen kompletten On-Device-Stack. Wake Word weckt das Gerät, Rhino oder Leopard verstehen den Befehl, alles ohne Internet. Das ist genau der Markt, in dem Picovoice am stärksten ist.

App-Entwickler mit Datenschutz-Anforderung: Mobile Apps, die Sprache lokal verarbeiten sollen (Notiz-Apps, Diktierfunktionen, barrierefreie Bedienung), profitieren davon, dass kein Audio an einen Server geht. Für Gesundheits-, Finanz- oder Behörden-Apps ist das oft der entscheidende Compliance-Hebel.

Automotive & Industrie: In Fahrzeugen, Lagern oder Produktionsumgebungen ist eine stabile Internetverbindung nicht garantiert, und Latenz ist kritisch. On-Device-Verarbeitung reagiert in Millisekunden und funktioniert auch im Funkloch. Voice-Picking im Lager oder Sprachbedienung im Cockpit sind typische Szenarien.

Datenschutzgetriebene Produkte allgemein: Sobald „kein Mikrofon-Streaming in die Cloud” ein Verkaufsargument oder eine regulatorische Pflicht ist, spielt Picovoice seine Stärke aus. Die Privacy-by-Design-Architektur ist hier kein Marketing, sondern technische Realität.

Weniger geeignet für: Nicht-Entwickler (es gibt keinen No-Code-Zugang), Teams, die eine fertige Diktier- oder Callcenter-Lösung suchen (dafür sind Dragon Medical One oder Cloud-Voice-Agenten wie passender), und alle, die maximale Genauigkeit großer Cloud-Modelle ohne eigenen Entwicklungsaufwand brauchen.

Preise im Detail

PlanPreisWas du bekommst
Free / Entwickler0 USD (keine Kreditkarte)Picovoice Console, Zugriff auf alle Engines mit Test-Kontingent, persönliche/Prototyp-Nutzung, eingeschränkte Custom-Modelle
KommerziellAuf Anfrage (Contact Sales)Produktive Nutzung in Apps und Software, höhere Limits, Support
Produktion / IoTAuf Anfrage, stückzahlabhängigLizenz für Hardware-Deployments, Custom Wake Words/Modelle, On-Premise-Training, dedizierter Support
EnterpriseAuf AnfrageVolle Plattform, SLA, Custom-Modelltraining (picoGym), Account-Management

Einordnung: Bis etwa 2023 hatte Picovoice öffentliche Stufen mit konkreten Beträgen (etwa eine „Foundation”-Stufe um 250 USD/Monat mit Startup-Rabatt sowie Enterprise-Pakete im niedrigen fünfstelligen Jahresbereich). Dieses transparente Modell wurde inzwischen durch einen vertriebsgeführten „Contact Sales”-Ansatz ersetzt, die Pricing-Seite leitet heute direkt auf das Kontaktformular. Für den Einstieg ist das unproblematisch: Der kostenlose Entwickler-Account erlaubt es, alle Engines ausgiebig zu testen und Prototypen zu bauen, ohne Kreditkarte. Teuer und intransparent wird es erst bei der Produktionslizenz, gerade für Hardware-Deployments mit hohen Stückzahlen solltest du früh ein Vertriebsgespräch einplanen und die Lizenzstruktur (pro Gerät, pro Jahr, Custom-Modelle) genau klären. Wer planbare Listenpreise braucht, wird hier enttäuscht.

Stärken im Detail

Echtes On-Device, nicht „Edge mit Cloud-Fallback”. Picovoice meint es ernst: „No cloud API calls, no network latency, no data leaving the device.” Die gesamte Pipeline läuft lokal, vom Wake Word über Spracherkennung bis zum LLM. Das ist nicht nur ein Datenschutz-Versprechen, sondern eine technische Architektur, die Picovoice mit eigenen Technologien (picoCompression zur Modellkompression, picoInference als Laufzeit) umsetzt. Genau das unterscheidet es von Anbietern, die „Edge” sagen, aber bei komplexen Anfragen doch in die Cloud routen.

Kompakte Modelle für reale Hardware. Die Modelle sind klein und effizient genug, um auf ARM-Prozessoren, Raspberry Pi, Mobilgeräten und im Browser zu laufen. Beim Batch-STT Leopard nennt Picovoice in seinem offenen Benchmark eine Core-Hour von 2,6 pro 100 Audiostunden, das vergleichsweise sparsamste Modell im Test. Whisper Tiny braucht dafür laut Picovoice das Sechsfache an Rechenzeit, Whisper Medium liegt mit 152 Core-Hours um Größenordnungen darüber. Diese Effizienz ist auf ressourcenbeschränkter Embedded-Hardware der eigentliche Knackpunkt: Ein großes Cloud-Modell ist genau genug, läuft aber nicht auf einem Microcontroller.

Ein integrierter Stack statt Einzelteile. Picovoice deckt die komplette Sprach-Pipeline ab: Voice Activity Detection (Cobra), Wake Word (Porcupine), Speech-to-Intent (Rhino), Streaming-STT (Cheetah), Batch-STT (Leopard), Text-to-Speech (Orca), Sprecher-Erkennung (Eagle), Sprecher-Diarisierung (Falcon), Sprach-Identifikation (Bat) und Rauschunterdrückung (Koala), dazu Übersetzung (Zebra), on-device LLMs (picoLLM) und sogar OCR und Vision-Language-Modelle. Alles aus einer Hand, mit konsistenten SDKs, statt fünf Anbieter zu integrieren.

Deutsch wird produktiv unterstützt. Anders als viele englisch-zentrierte Tools liefert Picovoice messbare deutsche Qualität. Leopard erreicht im offenen Picovoice-Benchmark 14,5 % Word Error Rate auf Deutsch. Große Cloud-Modelle sind genauer (Whisper Large und Amazon Transcribe liegen dort bei rund 7,4 bzw. 7,6 %), für ein vollständig on-device laufendes Modell ist 14,5 % aber ein bemerkenswert guter Wert. Der STT-Benchmark deckt sechs Sprachen ab: Englisch, Französisch, Deutsch, Spanisch, Italienisch und Portugiesisch.

Breite Plattform- und SDK-Abdeckung. Die Engines laufen auf Android, iOS, Web, Windows, macOS, Linux und Raspberry Pi, mit nativen SDKs für Python, NodeJS, Java, C, .NET, React, Flutter und React Native. Damit ist Picovoice sowohl für tiefe Firmware-Integration (C) als auch für schnelle App-Prototypen (Python, Flutter) brauchbar.

Glaubwürdige Referenzliste. Über 75 Fortune-500-Unternehmen setzen Picovoice ein, darunter Meta, LG, Netflix, NASA, Adobe, Ferrari und Motorola. In einem Markt voller Vaporware ist eine solche Kundenbasis ein starkes Signal für technische Reife und Verlässlichkeit.

Schwächen ehrlich betrachtet

Reines Entwickler-Werkzeug, keine fertige Lösung. Picovoice gibt dir SDKs und Engines, keinen fertigen Sprachassistenten. Wer eine Sprachsteuerung bauen will, braucht ein Embedded- oder App-Entwicklungsteam. Es gibt keinen No-Code-Editor, keine Plug-and-Play-Hardware. Wer das nicht hat, sollte gar nicht erst anfangen, der Aufwand ist substanziell. Workaround: Mit dem kostenlosen Account und dem Python-SDK lässt sich in wenigen Stunden ein funktionierender Prototyp auf dem Laptop bauen, bevor man in Hardware investiert.

Intransparente, vertriebsgeführte Preise. Die früher öffentliche Preisliste wurde abgeschafft, heute leitet die Pricing-Seite direkt auf „Contact Sales”. Für die Kalkulation eines Produkts ist das ein echtes Hindernis: Du musst ein Verkaufsgespräch führen, bevor du weißt, was eine Produktionslizenz kostet. Gerade Startups und kleinere Teams, die schnell planen wollen, stört das. Workaround: Früh Kontakt aufnehmen und die Lizenzstruktur (pro Gerät vs. pro Jahr, Custom-Modelle) konkret abfragen, bevor die Architektur festgezurrt wird.

Teuer bei Hardware-Deployments. Sobald es um Produktion mit relevanten Stückzahlen geht, wird die Lizenzierung kostspielig und stückzahlabhängig. Für ein Massenprodukt mit Sprachsteuerung kann das einen spürbaren Posten in der Stückkostenrechnung bedeuten. Das ist branchenüblich für Embedded-IP, aber man sollte es früh einkalkulieren.

Offline-only ist Stärke und Limit zugleich. Weil alles lokal läuft, gibt es keinen Cloud-Fallback für sehr komplexe oder offene Anfragen. Ein großes Cloud-LLM kann Dinge, die ein on-device picoLLM nicht leistet. Wer eine offene, generative Konversation braucht, stößt an Grenzen. Workaround: Hybrid bauen, on-device für Wake Word, Intent und einfache Befehle, Cloud nur für explizit nicht-sensible, komplexe Anfragen.

Custom-Modelle kosten extra. Eigene Wake Words und auf spezielle Vokabulare oder Stimmen (z. B. Kindersprache) trainierte Modelle sind in der freien Stufe limitiert. Produktiv brauchst du dafür eine kommerzielle Lizenz und ggf. Picovoice-Unterstützung beim Training (picoGym). Für Nischenanwendungen wie Spielzeug für Kleinkinder gibt es kein fertiges Standard-Modell, die Genauigkeit bei Lispeln und Fantasiewörtern bleibt begrenzt.

Alternativen im Vergleich

Wenn du……nimm stattdessen
On-Device-STT kostenlos und open-source willst
Hochgenaue Cloud-Spracherkennung per API brauchst
Natürliche Sprachausgabe (TTS) in Top-Qualität willst
Komplette Cloud-Sprachassistenten/Telefon-Agenten bauen willst
Medizinisches Diktat mit Fachvokabular brauchstDragon Medical One

Erwähnenswert ohne eigene Tool-Seite: Sensory und Cyberon (etablierte On-Device-Wake-Word-Anbieter im Embedded-Markt), Vosk (Open-Source-Offline-STT, kostenlos, aber weniger ausgereift als Picovoice), sowie die On-Device-APIs von Apple und Google für Mobilgeräte (kostenlos im Betriebssystem, aber plattformgebunden). Picovoice ist kein Allrounder, seine Stärke ist die On-Device-Verarbeitung über die gesamte Sprach-Pipeline. Wer Cloud-Verarbeitung akzeptiert, findet bei Deepgram oder Whisper oft günstigere oder einfachere Wege.

So steigst du ein

Schritt 1: Kostenlosen Account und Prototyp auf dem Laptop. Registriere dich in der Picovoice Console (keine Kreditkarte nötig) und lade das SDK für Python, das ist der schnellste Weg zum ersten Test. Mit Porcupine baust du in wenigen Stunden ein „Hey Lumi”-Wake-Word auf deinem Entwicklungsrechner, ganz ohne Zielhardware. So validierst du das Konzept, bevor du in Embedded-Entwicklung investierst.

Schritt 2: Intent statt Volltext-STT testen. Probiere Rhino (Speech-to-Intent) mit einem klar abgegrenzten Befehlssatz aus („Sing ein Lied”, „Erzähl eine Geschichte”). Rhino klassifiziert Sprache direkt in strukturierte Intents, ohne vollständige Transkription, was auf ressourcenbeschränkten Microcontrollern entscheidend ist. Für offene Diktate nutzt du stattdessen Cheetah (Streaming) oder Leopard (Batch).

Schritt 3: Zielplattform und Lizenz klären. Wechsle das SDK auf deine echte Zielplattform (z. B. C für einen ARM-Microcontroller, Flutter für eine Mobile-App) und miss Latenz, Speicher und Genauigkeit unter realen Bedingungen. Parallel sprich früh mit dem Picovoice-Vertrieb über die Produktionslizenz: Kläre die stückzahlbasierte Struktur, Custom-Wake-Word-Support und ob ein spezialisiertes Modelltraining (z. B. für Kindersprache) machbar ist.

Ein konkretes Beispiel

Ein süddeutscher Spielzeughersteller integriert Picovoice Porcupine als Wake-Word-Engine und Rhino als Intent-Klassifikator in ein interaktives Lernspielzeug für 4- bis 6-Jährige. Das Spielzeug reagiert auf „Hey Lumi” und versteht 18 kindgerechte Befehle (Zahlen-Quiz, Lied, Geschichte, Farbe des Tages). Weil die gesamte Sprachverarbeitung on-device auf einem STM32H7-Microcontroller läuft, werden keine Audiodaten übertragen, für diese Verarbeitungsstufe entfällt damit ein erheblicher Teil des DSGVO-Risikos, das bei Cloud-Streaming von Kinderstimmen sonst entstünde. Die Erkennungsrate bei Kindern zwischen 4 und 6 Jahren liegt nach Feinabstimmung der Phonem-Toleranzen bei rund 78–85 %, ausreichend für einfache Befehle, aber spürbar unter der Leistung bei Erwachsenensprache. Der entscheidende Vorteil für das Produktmarketing: „Funktioniert komplett offline, kein Mikrofon-Streaming in die Cloud” ist ein hartes Verkaufsargument gegenüber datenschutzbewussten Eltern, und technisch durch die Architektur gedeckt, nicht nur behauptet.

DSGVO & Datenschutz

  • Verarbeitung: Vollständig on-device. Die Datenschutzerklärung formuliert es explizit: „Picovoice runs 100% on-device”, Endnutzerdaten werden „not transmitted to, stored by, or accessible by Picovoice or any third party”. Für die Sprachverarbeitung selbst entsteht damit kaum DSGVO-Risiko, da keine personenbezogenen Audiodaten an Dritte fließen.
  • Anbieter & Sitz: Picovoice Inc. ist ein nordamerikanisches Unternehmen. Kein EU-Anbieter, relevant nur für die Vertrags- und Konsolen-Ebene, nicht für die Audioverarbeitung auf dem Gerät.
  • Picovoice Console: Die Entwickler- und Lizenzverwaltung (Account, License Keys, Custom-Modell-Training via picoGym) ist cloud-basiert und läuft über Picovoice-Infrastruktur (US/Kanada). Hier werden Konto- und Nutzungsdaten verarbeitet, keine Audioinhalte der Endnutzer.
  • AVV: Da bei der Laufzeit keine Endnutzer-Audiodaten an Picovoice übertragen werden, ist für die On-Device-Verarbeitung in der Regel kein klassischer Auftragsverarbeitungsvertrag über Audioinhalte nötig. Für die Console-Nutzung (Konto-/Metadaten) sollte ein AVV im Enterprise-Kontext geprüft werden.
  • Empfehlung für Unternehmen: Das On-Device-Modell ist für datenschutzkritische Produkte (Gesundheit, Kinder, Behörden) ein starker Vorteil. Dokumentiere dennoch sauber in der Datenschutz-Folgenabschätzung, dass und warum keine Audiodaten das Gerät verlassen, und behandle die Console-/Lizenz-Ebene als separaten Datenverarbeitungsvorgang.

Gut kombiniert mit

  • , Wer eine hybride Pipeline baut, kann Picovoice on-device für Wake Word und Intent nutzen und Whisper (lokal oder als API) für komplexe Volltext-Transkriptionen einsetzen, wenn der Kontext Cloud-Verarbeitung erlaubt. So bleibt der datenschutzkritische Always-on-Teil lokal.
  • , Für Szenarien mit Internetverbindung und höherem Genauigkeitsbedarf lässt sich Picovoice (Wake Word, Offline-Befehle) mit Deepgram (Cloud-STT für lange, offene Diktate) kombinieren, der lokale Teil schützt die Privatsphäre, die Cloud liefert Spitzenqualität auf Abruf.
  • , Während Picovoice Orca eine on-device Sprachausgabe liefert, kann ElevenLabs für hochwertige, ausdrucksstarke Stimmen genutzt werden, wenn das Produkt eine Internetverbindung hat und Sprachqualität ein zentrales Feature ist.

Unser Testurteil

Picovoice verdient 4 von 5 Sternen. In seiner Disziplin, Sprach-KI vollständig auf dem Gerät, über die komplette Pipeline hinweg, ist es die stärkste und ausgereifteste Plattform am Markt. Die On-Device-Architektur ist kein Marketing, sondern technisch sauber umgesetzt, die deutsche Sprachqualität ist messbar gut, und die Referenzliste mit über 75 Fortune-500-Kunden belegt die Reife. Den fünften Stern verliert Picovoice aus drei Gründen: Es ist ausschließlich ein Entwickler-Werkzeug ohne jeden No-Code-Zugang, die einst transparente Preisliste wurde durch ein intransparentes „Contact Sales”-Modell ersetzt, und produktive Hardware-Lizenzen werden schnell teuer. Für Teams mit Embedded- oder App-Kompetenz, die Datenschutz und Offline-Fähigkeit als harte Anforderung haben, gibt es kaum eine bessere Wahl. Für alle anderen ist es das falsche Werkzeug.

Was wir bemerkt haben

  • 2024/2025, Picovoice hat seine öffentliche Preisliste abgeschafft. Wo es früher konkrete Stufen mit Beträgen gab (etwa eine „Foundation”-Stufe um 250 USD/Monat mit Startup-Rabatt und Enterprise-Pakete im fünfstelligen Jahresbereich), leitet die Pricing-Seite heute direkt auf das „Contact Sales”-Kontaktformular. Der kostenlose Entwickler-Einstieg bleibt erhalten, aber Produktionspreise sind nicht mehr öffentlich kalkulierbar.
  • 2024–2026, Die Plattform hat sich deutlich über Sprache hinaus erweitert: Neben den klassischen Engines (Porcupine, Cheetah, Leopard, Rhino) gibt es inzwischen on-device LLMs (picoLLM), Übersetzung, Text-to-Speech (Orca), Sprecher-Diarisierung sowie OCR und Vision-Language-Modelle. Picovoice positioniert sich damit als breite On-Device-KI-Plattform, nicht mehr nur als Spracherkennungs-Anbieter.
  • Juni 2026, Die Kundenliste umfasst nach eigenen Angaben über 75 Fortune-500-Unternehmen. Die Logo-Wand auf der Kontaktseite nennt unter anderem NASA, Adobe, Meta, LG, Netflix, Ferrari, Motorola, Analog Devices, Accenture, Stanford, Cox Automotive und Woven by Toyota. Für einen spezialisierten Embedded-Anbieter ist das eine bemerkenswert breite Marktdurchdringung und ein starkes Reife-Signal.
  • Juni 2026, Wir haben zwei Benchmark-Zahlen korrigiert. Die deutsche WER von Leopard (14,5 %) ist im offenen Picovoice-Benchmark bestätigt, der früher genannte Direktvergleich mit Whisper Base (23,6 %) und Google STT (13,4 %) steht dort für Deutsch aber nicht, große Cloud-Modelle wie Whisper Large und Amazon Transcribe sind sogar genauer (rund 7,4 bzw. 7,6 %). Die Effizienzangabe haben wir auf den belegten Wert umgestellt: Core-Hour 2,6 pro 100 Audiostunden, Whisper Tiny braucht das Sechsfache.
  • Mai 2026, Die ältere Charakterisierung des Datenhostings als „EU” war irreführend: Picovoice ist ein nordamerikanisches Unternehmen, und die eigentliche Sprachverarbeitung findet on-device statt, es gibt also gar kein zentrales Audio-Hosting. Wir haben die Einordnung entsprechend korrigiert: Der Datenschutz-Vorteil liegt in der lokalen Verarbeitung, nicht in einem EU-Serverstandort.

Quellen

  1. Picovoice – Pricing (leitet auf Contact Sales). https://picovoice.ai/pricing/ (abgerufen am 2026-06-14). Die Pricing-Seite leitet auf das Contact-Sales-Formular um, kostenloser Free Trial ohne Kreditkarte, über 75 Fortune-500-Kunden (NASA, Adobe, Meta, LG, Netflix, Ferrari, Motorola u. a.).
  2. Picovoice – Speech-to-Text Benchmark. https://picovoice.ai/docs/benchmark/stt/ (abgerufen am 2026-06-14). Leopard erreicht 14,5 % WER auf Deutsch; Core-Hour 2,6 pro 100 Audiostunden, Whisper Tiny benötigt 6x mehr Ressourcen; STT-Sprachen Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch.
  3. Picovoice – Privacy Policy. https://picovoice.ai/docs/privacy-policy/ (abgerufen am 2026-06-14). Picovoice läuft 100 % on-device, Endnutzerdaten werden nicht an Picovoice übertragen, gespeichert oder zugänglich gemacht.

Diesen Inhalt teilen:

Empfohlen in 1 Use Cases

Empfohlen für diese Branchen

Arthur Atlas

KI-Analyst

So entsteht diese Bewertung

Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.

Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.

Preise geändert, Feature veraltet oder etwas fehlt?

Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Du arbeitest bei Picovoice Inc.?

Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.

Testzugang anbieten

Nicht sicher, ob Picovoice zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen

KI-Tools und Trends

KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools

Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar