Zum Hauptinhalt springen
Mit den Synthesizer-Einstellungen kannst du steuern, wie deine KI-Stimme klingt. Es gibt drei zentrale Regler:
  • Stimmstabilität
  • Stimmähnlichkeit
  • Sprechgeschwindigkeit

1. Stimmstabilität

Die Stimmstabilität bestimmt, wie monoton oder emotional die Stimme wirkt.
  • Weiter rechts: stabiler, seriöser, gleichmäßiger.
  • Weiter links: emotionaler, freundlicher, lebendiger.
Ein oft genutzter Startwert liegt bei etwa 0,30 - je nach Use Case kann das aber klar abweichen.

2. Stimmähnlichkeit

Die Stimmähnlichkeit ist ein Feintuning-Regler zur Stabilität und zur Nähe zur gewählten Basisstimme. Wenn du willst, dass eine emotional betonte Stimme diesen Stil konsequenter hält oder näher an der Referenzstimme bleibt, kannst du den Regler weiter nach rechts setzen.

3. Sprechgeschwindigkeit

Die Sprechgeschwindigkeit hängt stark von der gewählten Stimme ab.
  • 1,0 funktioniert in vielen Fällen gut als Ausgangspunkt.
  • Manche Stimmen sprechen von Natur aus langsamer oder schneller - dann entsprechend nachjustieren.

Empfohlene Vorgehensweise

  1. Stimme auswählen.
  2. Mit moderaten Standardwerten starten.
  3. Pro Test nur einen Regler verändern.
  4. Kurzhören, vergleichen, dann den nächsten Schritt machen.
So kommst du schneller zu einem stimmigen Ergebnis für deinen konkreten Einsatzfall.
Die Wirkung ist immer stimmabhängig. Teste Einstellungen direkt mit typischen Sätzen aus deinem realen Use Case, statt nur mit kurzen Beispielsätzen.Weiterführend: TTS-Anbieter, Stimmenauswahl und Tests.