Social Proof

Microsoft texto a voz

Speechify es el lector de audio número 1 del mundo. Lee libros, documentos, artículos, PDFs, correos electrónicos - cualquier cosa que leas - más rápido.

Destacado en

forbes logocbs logotime magazine logonew york times logowall street logo
¡Escucha este artículo con Speechify!
Speechify

Microsoft domina en negocios, videojuegos y computación diaria, pero ¿puede el TTS de Microsoft estar a la altura de las expectativas?

Las soluciones de texto a voz (TTS) se han convertido en una pieza indispensable de la tecnología asistiva, ayudando a innumerables usuarios de PC a interactuar con la palabra escrita, ya sea por placer, estudio o trabajo. 

Como puedes imaginar, el mercado de TTS está algo saturado, con docenas de aplicaciones y extensiones de navegador para elegir. La mayoría son bastante útiles y harán maravillas por tu productividad, ofreciéndote una experiencia más amigable. Hoy, nos centraremos en la solución TTS de Microsoft: Azure.

¿Qué es Microsoft texto a voz?

¿Qué es entonces Azure? Para responder a esa pregunta, podemos plantear otra: ¿Quieres el poder de crear contenido con voces en off que suenan naturales o escuchar tus páginas favoritas narradas para ti, con un montón de parámetros personalizables que te permitirán ajustar la velocidad del habla, tonos, pronunciación y todo lo demás? Microsoft Azure te permite hacer todo eso — y más.

Azure es una plataforma en la nube llena de potencial. Además de los servicios cognitivos de Azure que proporcionan fantásticas soluciones de texto a voz y de voz a texto, puedes utilizar el almacenamiento en la nube de Azure y análisis para llevar tu productividad aún más lejos sin necesidad de dominar ningún aprendizaje automático complicado.

Siendo compatible con varias soluciones de código abierto, Azure también es bastante flexible. Incorporar voces en off en aplicaciones personalizadas y permitir que tu público objetivo aproveche los beneficios del aprendizaje profundo nunca ha sido más fácil, especialmente con más de cien idiomas y variantes de idioma que Azure pondrá a tu disposición.

Cómo usar la aplicación de texto a voz de Microsoft en tu iPhone o computadora

Configurar Microsoft Azure en tu dispositivo es bastante sencillo, y solo se necesitan unos pocos clics para registrarse en el sitio web oficial de Azure. Sin embargo, si tu uso de la computadora no va más allá de programas como Outlook, Word, PowerPoint, Docs y OneNote, no tendrás que descargar nada porque esos programas vienen con una solución de síntesis de voz integrada llamada Speak.

Aunque puede que no sea un servicio de voz de alta calidad, Speak es útil en un apuro y es muy fácil de configurar:

  • Haz clic en la opción Personalizar barra de herramientas, haz clic
  • Selecciona la opción Más comandos
  • Haz clic en Todos los comandos
  • Encuentra Speak, haz clic en él y luego haz clic en Agregar

Alternativas a la aplicación de texto a voz de Microsoft

Como mencionamos en la introducción, hay muchos lectores de texto, que van desde aplicaciones profesionales que te sorprenderán solo con sus precios hasta SDKs de reconocimiento de voz apenas terminados en GitHub. Si el asistente de voz de texto a voz de Microsoft no es lo que buscas, o si estás buscando algo de variedad, tenemos algunas alternativas que seguramente te interesarán.

Speechify

En el puesto #1 está Speechify, la herramienta TTS mejor valorada que convertirá prácticamente cualquier cosa en un archivo de audio. Funciona con todas las aplicaciones de Microsoft, y sus modelos de voz te dejarán sin palabras. Combina eso con grandes capacidades de API de voz, y tienes una solución versátil que se adaptará a todas tus necesidades y casos de uso.

Amazon Polly

En el puesto #2, tenemos a Amazon Polly, una solución fantástica famosa por sus voces que suenan naturales y una gran variedad de estilos de habla. Soporta múltiples idiomas, y su tecnología de texto a voz neuronal te ofrecerá muchas configuraciones personalizables para jugar cada vez que quieras añadir un toque especial a tus reproducciones ya auténticas.

Google Cloud Text to Speech

En el puesto #3, está Google Cloud Text to Speech. Naturalmente, donde haya progreso tecnológico por hacer, Google estará allí, y el ámbito TTS no es una excepción. La solución de Google se centra en el lenguaje de marcado de síntesis de voz (SSML), y funciona en base a pago por carácter, por lo que es una opción útil y asequible si estás trabajando en un proyecto único.

IBM Watson Text to Speech

IBM Watson ocupa el puesto #4. Lo que distingue a Watson de la competencia es su versatilidad en entornos corporativos. Es decir, puedes usarlo como asistente virtual o herramienta de soporte al cliente y como solución de texto a voz. Además, es muy asequible, por lo que no encontrarás una mejor oferta en otro lugar si buscas algo flexible.

Readspeaker 

En el puesto #5, tenemos a uno de los veteranos: Readspeaker. Con cerca de un cuarto de siglo de experiencia, Readspeaker ha perfeccionado el TTS. Soporta más de cien idiomas y es fantástico para estudios de locución y aprendizaje en línea, ya que puede funcionar tanto en línea como fuera de línea.

NaturalReader 

El #6 es NaturalReader. Esta aplicación hace un gran trabajo con la síntesis de voz en tiempo real y funciona con prácticamente todas las aplicaciones que usarás en tu PC. Pero lo que le ha ganado un lugar en nuestra lista es su modo lector, que elimina todo el contenido innecesario de tu texto, como los anuncios.

VoiceDream Reader

En el puesto #7, tenemos a VoiceDream Reader, nuestra última alternativa a Microsoft Azure para texto a voz de hoy. Desafortunadamente, aunque VoiceDream Reader es bueno para algunas tareas simples, muchos usuarios se quejan de la falta de accesibilidad y de las pobres opciones de sincronización. Pero, si necesitas una solución rápida y no te importa la tecnología TTS neural más avanzada, VoiceDream hará un trabajo suficientemente decente.

Preguntas Frecuentes

¿Es gratuito el TTS de Windows 10?

Hay muchas soluciones TTS para Windows 10. Algunas son gratuitas, mientras que otras no lo son. La opción integrada de Speak que viene con Windows 10 y funciona en aplicaciones como Outlook y Word es gratuita, pero las soluciones más sofisticadas con opciones de voz neural personalizadas y otras características, como Microsoft Azure, requieren una suscripción.

¿Cuál es la voz TTS más realista?

Las voces TTS más realistas son típicas de herramientas TTS más avanzadas como Amazon Polly y Speechify. Los niveles de realismo dependerán del idioma, el modelo de voz y los parámetros que elijas.

¿Cuál es la diferencia entre Texto a Voz y Reconocimiento de Voz?

Aunque muchos programas TTS ofrecen opciones tanto de texto a voz como de reconocimiento de voz, es importante no confundirlos. Las opciones de texto a voz convierten la entrada de texto en formato de audio, ayudándote a interactuar con el texto mientras realizas otras tareas. El reconocimiento de voz, por otro lado, se refiere al análisis de la voz humana, ya sea con el propósito de interpretarla o identificarla.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman es un defensor de la dislexia y el CEO y fundador de Speechify, la aplicación de texto a voz número uno en el mundo, con más de 100,000 reseñas de 5 estrellas y ocupando el primer lugar en la categoría de Noticias y Revistas de la App Store. En 2017, Weitzman fue incluido en la lista de Forbes 30 menores de 30 por su trabajo haciendo que internet sea más accesible para personas con discapacidades de aprendizaje. Cliff Weitzman ha sido destacado en EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre otros medios líderes.