Inicio Informática Mimic 3, un motor neuronal de texto a voz disponible en Ubuntu

Mimic 3, un motor neuronal de texto a voz disponible en Ubuntu

Habla más de 25 idiomas con más de 100 voces preentrenadas

Publicado por entreunosyceros

AVISO: Esta entrada tiene más de dos años desde su publicación. Es posible que el contenido esté desactualizado.

Una vez más aquí. Hoy vengo a dejar un pequeño artículo sobre algo que me comentó un conocido esta misma semana. El caso es que este usuario me decía que no encontraba ningún programa que lea texto de una forma más bien natural. Además buscaba un programa gratuito. Bueno, pues buscando un poco por la red, encontré Mimic 3. Este programa es un motor neuronal de texto a voz que se puede instalar de forma más o menos sencilla en Ubuntu.

El software habla más de 25 idiomas con más de 100 voces preentrenadas. Mimic 3 utiliza VITS, un ‘Codificador automático variacional condicional con aprendizaje para texto a voz de extremo a extremo‘. Como decía, Mimic 3 es un software gratuito y de código abierto, que puede ejecutarse localmente, incluso en hardware de gama baja, como Raspberry Pi 4.

Para este ejemplo lo voy a probar en local, por lo que lo primero que haremos será instalar el software, antes de ver cómo ejecutarlo. El programa lo voy a probar en Ubuntu 22.04. Aun que hay paquetes disponibles para Ubuntu, en las siguientes líneas vamos a utilizar el código fuente.

Instalar Mimic 3 en Ubuntu 22.04

Antes de nada, lo primero que haremos será instalar el paquete python3.10-venv, en caso de que todavía no lo tengas instalado. El módulo venv admite la creación de ‘entornos virtuales’ livianos, cada uno con su propio conjunto independiente de paquetes de Python. Para instalar el programa, solo es necesario abrir una terminal (Ctrl+Alt+T) y ejecutar el comando:

sudo apt install python3.10-venv

Una vez instalado el anterior paquete, vamos a clonar el repositorio en GitHub de la aplicación. Para ello, en la misma terminal basta con utilizar este otro comando:

clonar repositorio de Mimic 3
git clone https://github.com/MycroftAI/mimic3

El siguiente paso será cambiar al directorio mimic3 que se acaba de crear en nuestro equipo.

cd mimic3

Dentro de este directorio, vamos a ejecutar el el script install.sh para comenzar con la instalación:

instalación
./install.sh

Este script va a descargar e instalar todas las dependencias de Python necesarias en un entorno virtual.

mensaje de finalización con éxito

Iniciar el servidor

Ahora podemos acceder a nuestro entorno virtual recién creado. Para ello utilizaremos el comando:

source .venv/bin/activate
iniciar servidor de mimic 3

Ahora iniciaremos el servidor Mimic 3, utilizando el comando:

mimic3-server

La URL desde la que podremos acceder a la interfaz de Mimic 3, parecerá al ejecutar el anterior comando (aparece resultada en la anterior captura de pantalla). Si accedemos a esta URL desde nuestro navegador web, veremos en pantalla la interfaz desde la que podremos interactuar con el programa.

Mimic 3 funcionando

La imagen de arriba muestra que el clip de 19.140 segundos que he generado para este ejemplo. El programa nos permitirá acelerar el procesamiento del texto si tienes una GPU compatible con CUDA. También podremos escuchar la salida o descargarla como archivo WAV. Hay más de 25 idiomas disponibles, entre los que se incluyen el español, el inglés (EE. UU. y Reino Unido), alemán, italiano, holandés y chino, entre otros.

Además, el software es compatible con el lenguaje de marcado de síntesis de voz. Este es un lenguaje de marcado basado en XML, para asistir en la generación de voz sintética en la Web y otras aplicaciones. Esto nos permitirá insertar pausas, cambiar el volumen, la velocidad del habla y la voz.

Si lo que buscas es un motor de texto a voz que funcione completamente fuera de línea, con una voz bastante natura, y que no requiera de un hardware potente, Mimic 3 puede ser una buena opción. En este ejemplo, solo hemos mostrado el software ejecutándose como un servidor web. Aun que también es posible utilizar Mimic 3 desde la línea de comandos.

Se puede obtener más información sobre este programa en su repositorio de GitHub o en la documentación oficial.

También te puede interesar ...

Deja un comentario

* Al utilizar este formulario, aceptas que este sitio web almacene y maneje tus datos.

Adblock Detectado!!

Ayúdanos deshabilitando la extensión AdBlocker de tu navegador para visitar esta web.
Si no sabes hacerlo en Chrome, consulta el siguiente enlace. Si utilizas Firefox, puedes consultar este otro enlace.
Esto mejorará tu experiencia en este sitio web.