El fundador de Speechify discute el futuro de la IA en el podcast Everyday AI
Destacado en
Únete a la cautivadora conversación mientras el fundador de Speechify explora los ámbitos de la IA en el podcast Everyday AI.
El fundador de Speechify discute el futuro de la IA en el podcast Everyday AI
¿Son las voces de celebridades el futuro de la IA generativa? ¿Es segura la IA? El fundador y CEO de Speechify, Cliff Weitzman, se sentó con Jordan Wilson para el Episodio 152 del Podcast Everyday AI para abordar estas preguntas y más.
Podcast Everyday AI
El podcast Everyday AI es un popular livestream diario gratuito, podcast y boletín que ayuda a las personas a avanzar en sus carreras con la IA. El podcast no solo mantiene a los oyentes al día con los últimos consejos y tendencias relacionadas con el espacio de rápido crecimiento de la IA generativa, sino que también asegura que sepan cómo aprovechar la IA para tener éxito. Desde su lanzamiento en abril de 2023, El podcast Everyday AI ha atraído a 22,000 oyentes y 7,800 suscriptores diarios del boletín por correo electrónico que desean aprender sobre la IA y estrategias para trabajar de manera más inteligente, no más dura, y llevar su éxito a nuevas alturas con la ayuda de la inteligencia artificial.
La historia de Speechify
Cliff Weitzman desarrolló originalmente Speechify después de luchar en la universidad con dislexia y descubrir que la mayoría de los libros de texto no tienen audiolibros. Hoy en día, es la aplicación de texto a voz número 1 en el mundo, con más de 150,000 reseñas de cinco estrellas y más de 25 millones de usuarios. ¿Cómo se volvió tan popular que incluso Snoop Dogg quiso asociarse con la empresa? Weitzman cubrió esto y mucho más en el Episodio 152 del podcast Everyday AI que se transmitió en vivo el lunes 27 de noviembre.
Cómo funciona Speechify
Weitzman explicó cómo Speechify se basa en el mejor motor de texto a voz (TTS) con el generador de voz de IA de la más alta calidad en el mundo para transformar cualquier texto en voz, de manera instantánea y asequible. Con una aplicación para Android, Mac y iOS, y versión web, así como extensiones de Chrome de Google y Microsoft Edge, Speechify no se limita solo a leer texto digital, como PDFs, artículos de noticias, Google Docs y correos electrónicos, en voz alta. Usando tecnología avanzada de OCR e IA, los usuarios pueden tomar fotos rápidamente de libros de texto, guías de estudio, notas escritas a mano y otros documentos físicos y convertirlos en archivos de audio realistas en tiempo real.
Casos de uso y objetivo de Speechify
Permitiendo a los usuarios escuchar texto en lugar de leerlo o mientras lo leen usando la función de resaltado de texto de Speechify, los usuarios pueden absorber información más rápido, más fácil y de manera más eficiente. Esto ha hecho de Speechify una herramienta de IA imprescindible para estudiantes e individuos que tienen dificultades con diferencias o discapacidades de aprendizaje, como dislexia, TDAH, baja visión, ceguera, autismo, conmociones cerebrales y ansiedad.
Sin embargo, aunque Speechify se utilizó predominantemente como una tecnología de asistencia para aquellos con diferencias de aprendizaje en sus primeros años, ahora todo tipo de personas la usan, incluidos, según Weitzman, médicos, abogados, contadores, personas en el ejército, ejecutivos, personas en finanzas, estudiantes de idiomas y multitareas que desean aumentar su productividad y velocidad de lectura, gracias a sus voces de sonido natural de alta calidad y tecnología OCR.
De hecho, Weitzman compartió que el objetivo de Speechify es asegurar que "la lectura nunca sea una barrera para el aprendizaje de nadie, sin importar cuál sea tu origen.”
Voces de celebridades
A medida que Speechify ha crecido, ha tenido la oportunidad de asociarse con algunas celebridades de renombre. En el episodio, Weitzman y Wilson discutieron cómo Speechify llegó a asociarse con Snoop Dogg, quien presta su propia voz a la amplia gama de opciones de voz de Speechify.
Weitzman explicó que muchas de las asociaciones de Speechify surgen cuando personas que usan el producto se acercan. Continúa describiendo cómo el agente de Snoop Dogg se acercó a Speechify, explicando cómo Snoop quería usar su voz para ayudar a su audiencia a consumir información. Esto llevó a Weitzman a volar al estudio personal de Snoop Dogg para grabar y replicar su voz a través de clonación de voz y tecnología de síntesis de voz.
Entre las más de 200 voces de IA de Speechify en varios idiomas, incluidos inglés, chino, español, portugués y más, la voz de la actriz e inversora a largo plazo de Speechify, Gwyneth Paltrow, también es una opción de narrador de texto a voz.
Pero con estas opciones de voces de celebridades que pueden leer desde publicaciones en redes sociales hasta trabajos de investigación, también vienen las salvaguardas que Speechify implementa para evitar el mal uso.
Seguridad de la IA y clonación de voz
Aunque Speechify reconoce los beneficios de las herramientas de texto a voz de IA y la tecnología de clonación de voz, Weitzman también explicó que una de las principales preocupaciones de Speechify es proteger a los creadores de contenido y a las personas porque “la seguridad de la IA es extremadamente importante.”
Implementar políticas de seguridad se ha vuelto aún más importante a medida que Speechify ha expandido su funcionalidad de texto a voz para lanzar nuevos productos como Speechify Studio, un conjunto de herramientas impulsadas por IA que permite a los creadores de contenido crear locuciones de IA, voces personalizadas, traducir locuciones, transcribir automáticamente su trabajo, editar videos y usar avatares de IA.
Por ejemplo, Weitzman explica que Speechify solo permite a los usuarios clonar su propia voz o la de alguien que esté justo a su lado, como un amigo que ha dado su consentimiento, no cualquier voz de internet, para proteger contra el mal uso así como la infracción de identidad o derechos de autor.
“Nuestra filosofía en general en Speechify pone a los propietarios de derechos en el asiento del conductor," dijo Weitzman. También afirmó que la tecnología de IA de Speechify no está destinada a reemplazar a los creadores de contenido como los actores de voz de audiolibros, sino a “aumentar [su] capacidad de crear,” como ayudarlos a producir más contenido de manera más eficiente.
Además, Weitzman reveló que Speechify está trabajando actualmente en un producto que permitirá a los usuarios distinguir fácilmente si una voz es humana o generada por IA y, si la voz es falsa, dónde fue creada originalmente, una protección que ayudará a prevenir que las personas sean víctimas de estafas de voz en las que actores malintencionados usan un cambiador de voz para imitar la voz de un ser querido con fines nefastos.
Escucha a Cliff Weitzman en el podcast Everyday AI
Para saber más sobre cómo la IA de texto a voz de Speechify está moldeando el futuro del aprendizaje y la creación de contenido, escucha este episodio especial del podcast Everyday AI en las principales plataformas de podcast como Apple Podcasts y Spotify o escucha a continuación:
Tiempos del Podcast:
[00:12:50] Seguridad en el espacio de texto a voz
[00:18:12] Casos de uso para texto a voz
[00:21:05] Preguntas de la audiencia
[00:24:10] Futuro del texto a voz
[00:27:28] ¿Está perdiendo impacto la palabra escrita?
[00:31:30] Usando texto a voz como profesionales
Cliff Weitzman
Cliff Weitzman es un defensor de la dislexia y el CEO y fundador de Speechify, la aplicación de texto a voz número uno en el mundo, con más de 100,000 reseñas de 5 estrellas y ocupando el primer lugar en la categoría de Noticias y Revistas de la App Store. En 2017, Weitzman fue incluido en la lista de Forbes 30 menores de 30 por su trabajo haciendo que internet sea más accesible para personas con discapacidades de aprendizaje. Cliff Weitzman ha sido destacado en EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre otros medios líderes.