Artistas de voz o software TTS [¿Por cuál deberías decantarte en 2022?]
En palabras de Sir Arthur C. Clarke, "Cualquier tecnología suficientemente avanzada es indistinguible de la magia".
Si eso es cierto, ¡el año 2022 está lleno de magia!
¿Por qué lo digo? Mira a tu alrededor.
La automatización hoy en día se cuela ingeniosamente en todos nuestros asuntos cotidianos, ¡sin que a veces nos demos cuenta! Desde una simple cafetera hasta algo tan avanzado como Alexa de Amazon, ¡estamos rodeados de una tecnología alucinante!
Y lo mejor es que estos desarrollos están en constante aumento, haciendo nuestra vida mucho más fácil.
Uno de estos grandes fenómenos se ha observado en el campo de la síntesis de voz.
El mundo de la tecnología ha avanzado mucho desde 1975, cuando se desarrolló "MUSA", uno de los primeros sistemas de síntesis de voz del mundo. En aquel entonces consistía en un hardware informático autónomo y un software especializado que le permitía leer italiano.
Estos sistemas TTS se desarrollaron por primera vez para ayudar a los discapacitados visuales, ofreciéndoles una voz hablada generada por ordenador que les "leía" el texto.
¿Y recuerda la icónica voz del profesor Stephen Hawking?
Al dar voz a una de las mentes más brillantes del planeta, el TTS demostró de lo que es capaz. Y la tecnología no ha dejado de evolucionar desde entonces.
Tanto es así que, hasta hace algún tiempo, la única forma de poner voz a nuestros guiones de vídeo de forma profesional era recurrir a un locutor o a un actor de doblaje. Y ahora, tenemos softwares TTS avanzados como "Animaker Voice" como alternativas potenciales.
Pero la pregunta importante aquí es: "¿Puede considerarse un sustituto perfecto de la voz humana?".
Veamos lo que un TTS moderno y sofisticado es capaz de ofrecer por encima de un locutor.
1. Múltiples idiomas
La mayoría de las empresas actuales operan a nivel mundial o aspiran a convertirse en multinacionales.
Naturalmente, desean publicar sus contenidos de vídeo en varios idiomas para adaptarse a las diferentes audiencias nativas.
Pero el proceso de búsqueda de locutores para todos los idiomas es tedioso. La empresa tiene que asegurarse de que contrata a un locutor cuya voz se adapte a la marca y a la región a la que se va a dirigir el vídeo.
Sin duda, los locutores son excelentes en lo que hacen, pero es humanamente imposible dominar muchos idiomas y dialectos a la vez.
Por lo general, los 3 elementos cruciales para cualquier locución perfecta son:
- Acento/dialecto correcto
- Coherencia en la pronunciación
- Un ritmo constante
Aquí es donde un buen software TTS puede ser útil. Una voz generada por ordenador, a diferencia de la voz humana, es consistente en su discurso en todo momento.
Hoy en día, estos programas también son compatibles con más de 20 idiomas. Así que, naturalmente, se convierte en una solución única para todas sus necesidades de locución y no tiene que salir a buscar montones de locutores de diferentes nacionalidades.
2. Menor tiempo de producción
El proceso tradicional de grabación de locuciones humanas es largo. Implica:
- PASO 1: Ponerse en contacto con agencias o actores de doblaje individuales para que envíen muestras de voz
- PASO 2: Preseleccionar y finalizar la voz más adecuada
- PASO 3: Programar el trabajo de locución
- PASO 4: Revisar el resultado y pedir que se vuelva a trabajar en él (en caso de que haya que editarlo).
En nuestra opinión, el paso más tedioso es el último. Contactar con el locutor una y otra vez para que edite el resultado de la voz, a veces resulta muy molesto.
Pero todo esto se puede evitar.
Hoy en día, la tecnología de síntesis de voz y de texto a voz ha avanzado lo suficiente como para que cualquiera pueda disponer de ella y utilizarla en cualquier momento sin mucha complicación.
Ni siquiera hay que tener grandes conocimientos técnicos para manejarse con estos programas. Las aplicaciones TTS del mercado actual tienen interfaces tan fáciles de usar que resulta divertido trabajar con ellas.
Además, permiten editar y descargar fácilmente. No es necesario salir o reservar otra cita para rehacer ese largo trabajo de locución. Todo se puede hacer en casa.
3. Rentabilidad
Contratar a un actor de doblaje puede costar entre 100 y 1.000 dólares, o incluso más, en función de las necesidades, como la longitud del guión o el tamaño del proyecto.
El objetivo de la locución también influye mucho en los honorarios del actor de doblaje. Por ejemplo, una locución para una emisión nacional te costará mucho más que una emisión local.
Aquí tienes un ejemplo de Fiverr.com. Esto debería darte una idea de cuánto puede costar una locución:
Pero si optas por un software TTS para crear y añadir voces en off a tu vídeo, no tendrás que preocuparte por un precio tan elevado. De hecho, muchas de las buenas aplicaciones que existen tienen pruebas mensuales gratuitas.
Sí. Es una razón más para probarlas antes de decidirse.
¡Aprecie todas las posibilidades creativas!
Hasta hace algún tiempo, una voz generada por ordenador solía sonar muy aburrida, sin emoción y mundana. Hoy en día, la tecnología ha avanzado lo suficiente como para asemejarse a las voces humanas gracias a efectos avanzados como la modulación de la voz, el tono y la altura, el énfasis en determinadas palabras, los sonidos de la respiración, etc.
De hecho, ha habido ocasiones en las que ha resultado difícil identificar qué voz es real y cuál es la salida de un motor TTS. Un gran ejemplo es el Asistente de Inteligencia Artificial de Google, que puede hacer llamadas en tu nombre, sonando completamente natural al teléfono. Aquí tienes un vídeo que muestra cómo podría ser nuestro futuro con los asistentes de IA.
Pero aceptamos el hecho de que incluso hoy en día hay algunas cosas que sólo un actor de voz puede hacer mejor. Sin embargo, los notables avances en el campo de la síntesis de voz merecen una mención.
Por eso Animaker ha creado su propia herramienta de creación de voz en off, llamada Animaker Voice.
¿Cómo crees que será el futuro? Háznoslo saber en los comentarios de abajo.