Audio in Text. In Deutschland.

DSGVO-konforme Speech-to-Text-API. 99 Sprachen. Server ausschließlich in Deutschland. Audiodaten werden nach Verarbeitung sofort und unwiderruflich gelöscht.

99 Sprachen DSGVO nativ DE-Server REST-API 0 Datenspeicherung

Tarife

Kein Vertriebsgespräch. Kein Vendor-Lock-in. Sofort loslegen.

Free

€0

30 Minuten / Monat

Alle 99 Sprachen
JSON mit Timestamps
Zum Testen

Starter

€79 /Monat

6 Stunden inklusive

Effektiv €13,17 pro Stunde

Alle 99 Sprachen
JSON mit Timestamps
E-Mail-Support
Ideal für Podcaster

Pro

€199 /Monat

15 Stunden inklusive

Effektiv €13,27 pro Stunde

Alle 99 Sprachen
JSON mit Timestamps
Prioritäts-Support
Ideal für Redaktionen

Pay-as-you-go

€12,99

pro Stunde, kein Abo

Flexibel, keine Bindung

Alle 99 Sprachen
JSON mit Timestamps
Einzelstunden kaufen
Ideal zum Einstieg

Preisvergleich: DSGVO-konforme Transkription

Nicht jeder Anbieter darf Ihre Daten verarbeiten. Wir schon — und günstiger als die meisten EU-Konkurrenten.

DSGVO-konform (EU/DE) US-Anbieter (Daten verlassen die EU) Babelfish (wir)

Warum DSGVO-Konformität entscheidend ist

Wer Audio mit personenbezogenen Inhalten transkribieren lässt — Interviews, Patientengespräche, Mandantengespräche, interne Meetings — muss die Daten gemäß DSGVO Art. 28 bei einem Auftragsverarbeiter innerhalb der EU verarbeiten. US-Anbieter wie OpenAI, AWS oder Google unterliegen dem US-CLOUD-Act und können zur Datenherausgabe verpflichtet werden. Unsere Server stehen ausschließlich in Deutschland (Hetzner, Falkenstein/Nürnberg). Audiodaten werden unmittelbar nach der Transkription gelöscht. Kein Training, keine Speicherung, keine Weitergabe an Dritte. Auftragsverarbeitungsvertrag (AV-Vertrag) auf Anfrage.

API-Zugang in 30 Sekunden

REST-API. Multipart-Upload. JSON-Antwort mit Text und Wort-Zeitstempeln.

Anfrage

curl -X POST https://babelfish.kreislauftechnik.de/v1/speech-to-text \
  -H "Authorization: Bearer IHR_API_KEY" \
  -F "file=@interview.mp3" \
  -F "language=de"

Antwort

{
  "transcription": {
    "text": "Guten Tag, willkommen zum Interview...",
    "duration_sec": 1847.3,
    "language": "de",
    "segments": [
      {"start": 0.0, "end": 2.8, "text": "Guten Tag,"},
      {"start": 2.8, "end": 5.1, "text": "willkommen zum Interview..."}
    ]
  },
  "billing": {
    "minutes_used": 30.8,
    "remaining_minutes": 329.2,
    "plan": "starter"
  }
}

Technische Details

Alles was Sie für die Integration brauchen.

Unterstützte Formate

WAV, MP3, M4A, OGG, FLAC, MP4, AAC, WebM — alles was ffmpeg lesen kann. Maximal 100 MB pro Datei.

Endpunkte

POST /v1/speech-to-text — Transkription
GET /v1/health — Status
GET /v1/plans — Tarife
GET /v1/account — Verbrauch
POST /v1/checkout — Abo abschließen

Authentifizierung

API-Key im Header:
Authorization: Bearer IHR_KEY

Key bekommen Sie nach Kauf oder über den Free-Plan.

Datenschutz

Server: Hetzner, Deutschland (Falkenstein/Nürnberg). Audiodateien werden nach Transkription unwiderruflich gelöscht. Kein Training. AV-Vertrag auf Anfrage.