Audio in Text. In Deutschland.

DSGVO-konforme Speech-to-Text-API. 99 Sprachen. Server ausschließlich in Deutschland. Audiodaten werden nach Verarbeitung sofort und unwiderruflich gelöscht.

99 Sprachen DSGVO nativ DE-Server REST-API 0 Datenspeicherung

Tarife

Kein Vertriebsgespräch. Kein Vendor-Lock-in. Sofort loslegen.

Free
€0
30 Minuten / Monat
 
  • Alle 99 Sprachen
  • JSON mit Timestamps
  • Zum Testen
Pro
€199 /Monat
15 Stunden inklusive
Effektiv €13,27 pro Stunde
  • Alle 99 Sprachen
  • JSON mit Timestamps
  • Prioritäts-Support
  • Ideal für Redaktionen
Pay-as-you-go
€12,99
pro Stunde, kein Abo
Flexibel, keine Bindung
  • Alle 99 Sprachen
  • JSON mit Timestamps
  • Einzelstunden kaufen
  • Ideal zum Einstieg

Preisvergleich: DSGVO-konforme Transkription

Nicht jeder Anbieter darf Ihre Daten verarbeiten. Wir schon — und günstiger als die meisten EU-Konkurrenten.

DSGVO-konform (EU/DE) US-Anbieter (Daten verlassen die EU) Babelfish (wir)

Warum DSGVO-Konformität entscheidend ist

Wer Audio mit personenbezogenen Inhalten transkribieren lässt — Interviews, Patientengespräche, Mandantengespräche, interne Meetings — muss die Daten gemäß DSGVO Art. 28 bei einem Auftragsverarbeiter innerhalb der EU verarbeiten. US-Anbieter wie OpenAI, AWS oder Google unterliegen dem US-CLOUD-Act und können zur Datenherausgabe verpflichtet werden. Unsere Server stehen ausschließlich in Deutschland (Hetzner, Falkenstein/Nürnberg). Audiodaten werden unmittelbar nach der Transkription gelöscht. Kein Training, keine Speicherung, keine Weitergabe an Dritte. Auftragsverarbeitungsvertrag (AV-Vertrag) auf Anfrage.

API-Zugang in 30 Sekunden

REST-API. Multipart-Upload. JSON-Antwort mit Text und Wort-Zeitstempeln.

Anfrage

curl -X POST https://babelfish.kreislauftechnik.de/v1/speech-to-text \
  -H "Authorization: Bearer IHR_API_KEY" \
  -F "file=@interview.mp3" \
  -F "language=de"

Antwort

{
  "transcription": {
    "text": "Guten Tag, willkommen zum Interview...",
    "duration_sec": 1847.3,
    "language": "de",
    "segments": [
      {"start": 0.0, "end": 2.8, "text": "Guten Tag,"},
      {"start": 2.8, "end": 5.1, "text": "willkommen zum Interview..."}
    ]
  },
  "billing": {
    "minutes_used": 30.8,
    "remaining_minutes": 329.2,
    "plan": "starter"
  }
}

Technische Details

Alles was Sie für die Integration brauchen.

Unterstützte Formate

WAV, MP3, M4A, OGG, FLAC, MP4, AAC, WebM — alles was ffmpeg lesen kann. Maximal 100 MB pro Datei.

Endpunkte

POST /v1/speech-to-text — Transkription
GET /v1/health — Status
GET /v1/plans — Tarife
GET /v1/account — Verbrauch
POST /v1/checkout — Abo abschließen

Authentifizierung

API-Key im Header:
Authorization: Bearer IHR_KEY

Key bekommen Sie nach Kauf oder über den Free-Plan.

Datenschutz

Server: Hetzner, Deutschland (Falkenstein/Nürnberg). Audiodateien werden nach Transkription unwiderruflich gelöscht. Kein Training. AV-Vertrag auf Anfrage.