Fundador da Speechify discute o futuro da IA no podcast Everyday AI
Destaques em
Participe da conversa envolvente enquanto o fundador da Speechify explora os domínios da IA com o podcast Everyday AI.
Fundador da Speechify discute o futuro da IA no podcast Everyday AI
Serão as vozes de celebridades o futuro da IA generativa? A IA é segura? O fundador e CEO da Speechify, Cliff Weitzman, conversou com Jordan Wilson no Episódio 152 do Podcast Everyday AI para abordar essas questões e muito mais.
Podcast Everyday AI
O podcast Everyday AI é um popular livestream diário gratuito, podcast e newsletter que ajuda pessoas comuns a impulsionarem suas carreiras com IA. O podcast não só mantém os ouvintes atualizados sobre as últimas dicas e tendências relacionadas ao espaço em rápido crescimento da IA generativa, mas também garante que saibam como aproveitar a IA para ter sucesso. Desde seu lançamento em abril de 2023, o podcast Everyday AI conquistou 22.000 ouvintes e 7.800 assinantes diários da newsletter por e-mail que desejam aprender insights e estratégias de IA para trabalhar de forma mais inteligente, não mais difícil, e levar seu sucesso a novos patamares com a ajuda da inteligência artificial.
A história da Speechify
Cliff Weitzman desenvolveu originalmente a Speechify após enfrentar dificuldades na faculdade com dislexia e descobrir que a maioria dos livros didáticos não tem audiolivros. Hoje, é o aplicativo de texto para fala número 1 no mundo, com mais de 150.000 avaliações de cinco estrelas e mais de 25 milhões de usuários. Como se tornou tão popular que até Snoop Dogg quis fazer parceria com a empresa? Weitzman abordou isso e muito mais no Episódio 152 do podcast Everyday AI, que foi ao ar na segunda-feira, 27 de novembro.
Como a Speechify funciona
Weitzman explicou como a Speechify é construída sobre o melhor mecanismo de texto para fala (TTS) com o gerador de voz AI de mais alta qualidade do mundo para transformar qualquer texto em fala, instantaneamente e de forma acessível. Com um aplicativo para Android, Mac e iOS, e versão para site, além de extensões para Microsoft Edge e Google Chrome, a Speechify não se limita apenas a ler textos digitais, como PDFs, artigos de notícias, Google Docs e e-mails, em voz alta. Usando tecnologia avançada de OCR e IA, os usuários podem rapidamente tirar fotos de livros didáticos, guias de estudo, anotações manuscritas e outros documentos físicos e convertê-los em arquivos de áudio realistas em tempo real.
Casos de uso e objetivo da Speechify
Permitindo que os usuários ouçam o texto em vez de lê-lo ou enquanto o leem usando o recurso de destaque de texto da Speechify, os usuários podem absorver informações de forma mais rápida, fácil e eficiente. Isso fez da Speechify uma ferramenta de IA indispensável para estudantes e indivíduos que enfrentam dificuldades de aprendizagem ou deficiências, como dislexia, TDAH, baixa visão, cegueira, autismo, concussões e ansiedade.
No entanto, enquanto a Speechify era predominantemente usada como uma tecnologia assistiva para aqueles com dificuldades de aprendizagem em seus primeiros anos, agora todos os tipos de pessoas a utilizam, incluindo, segundo Weitzman, médicos, advogados, contadores, pessoas nas forças armadas, executivos, pessoas no setor financeiro, estudantes de idiomas e multitarefas que desejam aumentar sua produtividade e velocidade de leitura, graças às suas vozes naturais de alta qualidade e tecnologia OCR.
De fato, Weitzman compartilhou que o objetivo da Speechify é garantir que "a leitura nunca seja uma barreira para o aprendizado de ninguém, não importa qual seja o seu histórico.”
Vozes de celebridades
À medida que a Speechify cresceu, teve a oportunidade de fazer parcerias com algumas celebridades de renome. No episódio, Weitzman e Wilson discutiram como a Speechify fez parceria com Snoop Dogg, que empresta sua própria voz para a ampla gama de opções de voz da Speechify.
Weitzman explicou que muitas das parcerias da Speechify surgem quando pessoas que usam o produto entram em contato. Ele descreve como o agente de Snoop Dogg entrou em contato com a Speechify, explicando como Snoop queria usar sua voz para ajudar seu público a consumir informações. Isso levou Weitzman a voar para o estúdio particular de Snoop Dogg para gravar e replicar sua voz através de clonagem de voz e tecnologia de síntese de fala.
Entre as mais de 200 vozes de IA da Speechify em vários idiomas, incluindo inglês, chinês, espanhol, português e mais, a atriz e investidora de longa data da Speechify, Gwyneth Paltrow, também é uma opção de narradora de texto para fala.
Mas com essas opções de vozes de celebridades que podem ler qualquer coisa, desde postagens em redes sociais até artigos de pesquisa, também vêm as salvaguardas que a Speechify implementa para evitar o uso indevido.
Segurança da IA e clonagem de voz
Embora a Speechify reconheça os benefícios das ferramentas de texto para fala com IA e da tecnologia de clonagem de voz, Weitzman também explicou que uma das maiores preocupações da Speechify é proteger criadores de conteúdo e pessoas porque “a segurança da IA é extremamente importante.”
Implementar políticas de segurança tornou-se ainda mais importante à medida que a Speechify expandiu sua funcionalidade de texto para fala para lançar novos produtos como o Speechify Studio, um conjunto de ferramentas com tecnologia de IA que permite aos criadores de conteúdo criar locuções de IA, vozes personalizadas, traduzir locuções, transcrever automaticamente seu trabalho, editar vídeos e usar avatares de IA.
Por exemplo, Weitzman explica que o Speechify só permite que os usuários clonem sua própria voz ou a voz de alguém próximo, como um amigo que deu consentimento, e não qualquer voz da internet, para proteger contra uso indevido, bem como infração de identidade ou direitos autorais.
“Nossa filosofia geral no Speechify coloca os proprietários dos direitos no controle," disse Weitzman. Ele também afirmou que a tecnologia de IA do Speechify não é para substituir criadores de conteúdo como narradores de audiolivros, mas para “aumentar [sua] capacidade de criar”, ajudando-os a produzir mais conteúdo de forma mais eficiente.
Além disso, Weitzman revelou que o Speechify está atualmente trabalhando em um produto que permitirá aos usuários distinguir facilmente se uma voz é humana ou gerada por IA e, se a voz for falsa, onde exatamente foi criada originalmente - uma proteção que ajudará a evitar que indivíduos sejam vítimas de golpes de voz em que pessoas mal-intencionadas usam um modificador de voz para imitar a voz de um ente querido por razões nefastas.
Ouça Cliff Weitzman no podcast Everyday AI
Para saber mais sobre como a IA de texto para fala do Speechify está moldando o futuro do aprendizado e da criação de conteúdo, ouça este episódio especial do podcast Everyday AI nas principais plataformas de podcast, como Apple Podcasts e Spotify, ou ouça abaixo:
Marcos do Podcast:
[00:12:50] Segurança no espaço de texto para voz
[00:18:12] Casos de uso para texto para fala
[00:21:05] Perguntas do público
[00:24:10] Futuro do texto para fala
[00:27:28] A palavra escrita está se tornando menos impactante?
[00:31:30] Usando texto para fala como profissionais
Cliff Weitzman
Cliff Weitzman é um defensor da dislexia e o CEO e fundador da Speechify, o aplicativo de leitura em voz alta número 1 do mundo, com mais de 100.000 avaliações de 5 estrelas e ocupando o primeiro lugar na App Store na categoria Notícias e Revistas. Em 2017, Weitzman foi incluído na lista Forbes 30 Under 30 por seu trabalho em tornar a internet mais acessível para pessoas com dificuldades de aprendizagem. Cliff Weitzman já foi destaque em EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre outros meios de comunicação de destaque.