Respuesta por Audio con IA (ElevenLabs)
La respuesta por audio permite que la IA responda al cliente con mensajes de voz generados automáticamente, creando una experiencia de conversación más natural y cercana.
Proveedor
El servicio de generación de voz utiliza ElevenLabs, un proveedor de text-to-speech de alta calidad. Es necesario contar con una API Key de ElevenLabs para activar esta funcionalidad.
Modos de Funcionamiento
Modo Continuo
En este modo, todas las respuestas de la IA se envían como audio. Cada mensaje generado por la IA se convierte en un mensaje de voz antes de enviarse al cliente.
Este modo es útil para casos donde la comunicación por voz es prioritaria, pero puede resultar excesivo para conversaciones largas.
Modo Inteligente (Recomendado)
En el modo inteligente, el sistema decide automáticamente cuándo enviar audio y cuándo enviar texto, logrando una conversación más natural. Se configura con los siguientes parámetros:
| Parámetro | Descripción |
|---|---|
| Responder con audio cuando el cliente envía audio | Si el cliente manda un mensaje de voz, la IA responde también con audio |
| Frecuencia | Enviar audio cada X mensajes del bot (por ejemplo, cada 5 mensajes) |
| Umbral mínimo de mensajes | Cantidad mínima de mensajes en la conversación antes de activar respuestas por audio |
| Probabilidad de envío | Porcentaje de probabilidad de que una respuesta se envíe como audio (por ejemplo, 30%) |
| Extensión mínima de caracteres | Largo mínimo que debe tener la respuesta para convertirla en audio (mensajes muy cortos se envían como texto) |
Recomendación
Usá el modo inteligente para lograr conversaciones más naturales. Al combinar texto y audio de forma equilibrada, el cliente percibe la interacción como más humana y menos robotizada.
Consejo
Configurá una probabilidad moderada (entre 20% y 40%) y un umbral mínimo de mensajes (por ejemplo, 3) para que el audio se active una vez que la conversación ya esté en marcha, no desde el primer mensaje.
Funcionalidades Relacionadas
- Recepción Inteligente — Módulo principal de IA donde se activa la respuesta por audio
- Transcripción de Audio — Para que la IA entienda los audios que envía el cliente