1. Endpunkttyp
Beim Endpunkttyp wählst du, wie das Ende einer Nutzeraussage erkannt wird:- Spracherkennung (Standard): in der Regel schneller, gut für geringe Latenz.
- KI-Erkennung: oft besser bei längeren Erzählungen und Denkpausen.
2. Endpunktempfindlichkeit
Die Endpunktempfindlichkeit bestimmt, wie lange die KI wartet, bevor sie davon ausgeht, dass der User fertig ist.- Schneller eingestellt: weniger Wartezeit, oft bessere Reaktionsgeschwindigkeit.
- Höher eingestellt: mehr Sprechspielraum für langsamere Sprecher.
3. Unterbrechungsempfindlichkeit
Die Unterbrechungsempfindlichkeit steuert, wie leicht die KI beim Sprechen unterbrochen werden kann.- Ein häufiger Ausgangswert ist 0,50.
- Outbound: meist schneller unterbrechbar sinnvoll.
- Rezeption / Empfang: oft etwas mehr Stabilität sinnvoll.
4. VAD-Empfindlichkeit (bei Speech-to-Speech)
Bei Sprache-zu-Sprache-Modellen gibt es zusätzlich die VAD-Empfindlichkeit. Wenn aktiviert, hilft eine weitere Logik dabei, Sprachpausen und Sprecherwechsel besser zu erkennen - ähnlich zum Verhalten aus modernen Voice-Modi.Empfohlene Vorgehensweise
- Mit Standardwerten starten (Spracherkennung, moderate Regler).
- Auf echten Testdialogen prüfen.
- Immer nur einen Regler pro Test ändern.
- Dann schrittweise auf deinen Use Case optimieren.

