Respuesta por Audio con IA (ElevenLabs)

La respuesta por audio permite que la IA responda al cliente con mensajes de voz generados automáticamente, creando una experiencia de conversación más natural y cercana.

Proveedor

El servicio de generación de voz utiliza ElevenLabs, un proveedor de text-to-speech de alta calidad. Es necesario contar con una API Key de ElevenLabs para activar esta funcionalidad.

Modos de Funcionamiento

Modo Continuo

En este modo, todas las respuestas de la IA se envían como audio. Cada mensaje generado por la IA se convierte en un mensaje de voz antes de enviarse al cliente.

Este modo es útil para casos donde la comunicación por voz es prioritaria, pero puede resultar excesivo para conversaciones largas.

Modo Inteligente (Recomendado)

En el modo inteligente, el sistema decide automáticamente cuándo enviar audio y cuándo enviar texto, logrando una conversación más natural. Se configura con los siguientes parámetros:

Parámetro	Descripción
Responder con audio cuando el cliente envía audio	Si el cliente manda un mensaje de voz, la IA responde también con audio
Frecuencia	Enviar audio cada X mensajes del bot (por ejemplo, cada 5 mensajes)
Umbral mínimo de mensajes	Cantidad mínima de mensajes en la conversación antes de activar respuestas por audio
Probabilidad de envío	Porcentaje de probabilidad de que una respuesta se envíe como audio (por ejemplo, 30%)
Extensión mínima de caracteres	Largo mínimo que debe tener la respuesta para convertirla en audio (mensajes muy cortos se envían como texto)

Recomendación

Usá el modo inteligente para lograr conversaciones más naturales. Al combinar texto y audio de forma equilibrada, el cliente percibe la interacción como más humana y menos robotizada.

Consejo

Configurá una probabilidad moderada (entre 20% y 40%) y un umbral mínimo de mensajes (por ejemplo, 3) para que el audio se active una vez que la conversación ya esté en marcha, no desde el primer mensaje.

Funcionalidades Relacionadas

Recepción Inteligente — Módulo principal de IA donde se activa la respuesta por audio
Transcripción de Audio — Para que la IA entienda los audios que envía el cliente