Inicio Informática Mimic 3, un motor neuronal de texto a voz disponible en Ubuntu

Mimic 3, un motor neuronal de texto a voz disponible en Ubuntu

Habla más de 25 idiomas con más de 100 voces preentrenadas

Publicado por entreunosyceros

AVISO: Esta entrada tiene más de dos años desde su publicación. Es posible que el contenido esté desactualizado.

Una vez más aquí. Hoy vengo a dejar un pequeño artículo sobre algo que me comentó un conocido esta misma semana. El caso es que este usuario me decía que no encontraba ningún programa que lea texto de una forma más bien natural. Además buscaba un programa gratuito. Bueno, pues buscando un poco por la red, encontré Mimic 3. Este programa es un motor neuronal de texto a voz que se puede instalar de forma más o menos sencilla en Ubuntu.

El software habla más de 25 idiomas con más de 100 voces preentrenadas. Mimic 3 utiliza VITS, un ‘Codificador automático variacional condicional con aprendizaje para texto a voz de extremo a extremo‘. Como decía, Mimic 3 es un software gratuito y de código abierto, que puede ejecutarse localmente, incluso en hardware de gama baja, como Raspberry Pi 4.

Para este ejemplo lo voy a probar en local, por lo que lo primero que haremos será instalar el software, antes de ver cómo ejecutarlo. El programa lo voy a probar en Ubuntu 22.04. Aun que hay paquetes disponibles para Ubuntu, en las siguientes líneas vamos a utilizar el código fuente.

Instalar Mimic 3 en Ubuntu 22.04

Antes de nada, lo primero que haremos será instalar el paquete python3.10-venv, en caso de que todavía no lo tengas instalado. El módulo venv admite la creación de ‘entornos virtuales’ livianos, cada uno con su propio conjunto independiente de paquetes de Python. Para instalar el programa, solo es necesario abrir una terminal (Ctrl+Alt+T) y ejecutar el comando:

sudo apt install python3.10-venv

Una vez instalado el anterior paquete, vamos a clonar el repositorio en GitHub de la aplicación. Para ello, en la misma terminal basta con utilizar este otro comando:

clonar repositorio de Mimic 3
git clone https://github.com/MycroftAI/mimic3

El siguiente paso será cambiar al directorio mimic3 que se acaba de crear en nuestro equipo.

cd mimic3

Dentro de este directorio, vamos a ejecutar el el script install.sh para comenzar con la instalación:

instalación
./install.sh

Este script va a descargar e instalar todas las dependencias de Python necesarias en un entorno virtual.

mensaje de finalización con éxito

Iniciar el servidor

Ahora podemos acceder a nuestro entorno virtual recién creado. Para ello utilizaremos el comando:

source .venv/bin/activate
iniciar servidor de mimic 3

Ahora iniciaremos el servidor Mimic 3, utilizando el comando:

mimic3-server

La URL desde la que podremos acceder a la interfaz de Mimic 3, parecerá al ejecutar el anterior comando (aparece resultada en la anterior captura de pantalla). Si accedemos a esta URL desde nuestro navegador web, veremos en pantalla la interfaz desde la que podremos interactuar con el programa.

Mimic 3 funcionando

La imagen de arriba muestra que el clip de 19.140 segundos que he generado para este ejemplo. El programa nos permitirá acelerar el procesamiento del texto si tienes una GPU compatible con CUDA. También podremos escuchar la salida o descargarla como archivo WAV. Hay más de 25 idiomas disponibles, entre los que se incluyen el español, el inglés (EE. UU. y Reino Unido), alemán, italiano, holandés y chino, entre otros.

Además, el software es compatible con el lenguaje de marcado de síntesis de voz. Este es un lenguaje de marcado basado en XML, para asistir en la generación de voz sintética en la Web y otras aplicaciones. Esto nos permitirá insertar pausas, cambiar el volumen, la velocidad del habla y la voz.

Si lo que buscas es un motor de texto a voz que funcione completamente fuera de línea, con una voz bastante natura, y que no requiera de un hardware potente, Mimic 3 puede ser una buena opción. En este ejemplo, solo hemos mostrado el software ejecutándose como un servidor web. Aun que también es posible utilizar Mimic 3 desde la línea de comandos.

Se puede obtener más información sobre este programa en su repositorio de GitHub o en la documentación oficial.

También te puede interesar ...

Deja un comentario

* Al utilizar este formulario, aceptas que este sitio web almacene y maneje tus datos.

Resumen de privacidad
cookies entreunosyceros

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible.

La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudarnos a comprender qué secciones de la web encuentras más interesantes y útiles.

Nunca almacenamos información personal de ningún tipo.

Tienes toda la información sobre privacidad, derechos legales y cookies en nuestra página sobre la política de privacidad o en la página sobre nuestra política de cookies.

Cookies necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Si desactivas esta cookie no podremos guardar tus preferencias. Esto significa que cada vez que visites esta web tendrás que activar o desactivar las cookies de nuevo.

Cookies de terceros

Esta web utiliza las siguientes cookies adicionales:

- Mailchimp: Recordar si ya estás suscrito al boletín de noticias y sino ofrecértelo al salir.

- Accesibilidad: Para saber tus ajustes de accesibilidad en cada visita.

- Comentarios: Saber si has leído y aceptado nuestra política de privacidad a la hora de dejar un comentario en la web.

- Google Analytics: Localización para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

- Goggle Adsense: Anuncios personalizados según tu geolocalización y preferencias.

Dejar estas cookies activadas nos permite mejorar nuestra web.

Adblock Detectado!!

Ayúdanos deshabilitando la extensión AdBlocker de tu navegador para visitar esta web.
Si no sabes hacerlo en Chrome, consulta el siguiente enlace. Si utilizas Firefox, puedes consultar este otro enlace.
Esto mejorará tu experiencia en este sitio web.