1. Início
  2. Acessibilidade
  3. Texto para fala a partir de foto—Como tirar uma foto de uma página e ouvi-la em voz alta
Social Proof

Texto para fala a partir de foto—Como tirar uma foto de uma página e ouvi-la em voz alta

Speechify é o leitor de áudio número 1 do mundo. Acelere sua leitura de livros, documentos, artigos, PDFs, e-mails - qualquer coisa que você lê.

Destaques em

forbes logocbs logotime magazine logonew york times logowall street logo
Ouça este artigo com o Speechify!
Speechify

Aprenda o básico sobre texto para fala a partir de foto - Como tirar uma foto de uma página e ouvi-la em voz alta em qualquer dispositivo móvel ou desktop e sistema operacional.

Leitores TTS estão em alta demanda e ampla oferta. Mas isso significa que toda a tecnologia de texto para fala oferece o mesmo desempenho? Muitos leitores de tela TTS podem processar texto digital de documentos do Microsoft Word, páginas da web em HTML ou palavras copiadas de outros arquivos de texto. Mas poucos conseguem converter texto digital bloqueado e físico de imagens em narração com som natural. Aqueles que conseguem usam reconhecimento óptico de caracteres (OCR).

O que é OCR?

OCR, conhecido como reconhecimento óptico de caracteres ou reconhecimento de texto, é uma tecnologia projetada para extração de dados especializada. Tem inúmeras aplicações empresariais e muito uso em lazer e entretenimento. Este tipo de tecnologia geralmente possui dois componentes. Tem um elemento de hardware para escanear imagens e um elemento de software para extrair e reutilizar dados. Mas o componente de software é a parte mais empolgante e complexa. O software OCR pode identificar letras individuais e palavras inteiras e organizá-las em frases. Além disso, permite que os usuários editem o conteúdo original bloqueado, semelhante à edição de um arquivo PDF com texto bloqueado.

Como o OCR Funciona

O reconhecimento óptico de caracteres (OCR) é uma tecnologia que converte diferentes tipos de documentos, como documentos em papel escaneados, arquivos PDF ou imagens capturadas por uma câmera digital, em dados editáveis e pesquisáveis. O processo começa com o software OCR analisando a estrutura da imagem do documento, detectando áreas que contêm texto. Em seguida, segmenta essas áreas em linhas, palavras e caracteres. Cada caractere é comparado com um conjunto de padrões predefinidos ou treinado com modelos de aprendizado de máquina para identificá-los e convertê-los em texto codificado por máquina. Essa conversão permite que o texto na imagem seja editado, pesquisado e processado digitalmente.

Combinando Texto para Fala e OCR

Combinar reconhecimento óptico de caracteres com tecnologia de texto para fala cria uma ferramenta poderosa que melhora a acessibilidade e a eficiência. O OCR extrai texto de documentos escaneados, imagens ou materiais impressos e o converte em texto legível por máquina. Este texto pode então ser inserido em um sistema TTS, que converte as palavras escritas em áudio falado. Essa sinergia permite uma ampla gama de aplicações, como ajudar pessoas com deficiência visual a "ler" materiais impressos, converter livros e documentos em audiolivros ou fornecer traduções de áudio em tempo real de textos impressos em idiomas estrangeiros. Ao integrar OCR com TTS, os usuários podem interagir com o conteúdo textual de forma mais dinâmica, tornando a informação mais acessível a todos, independentemente de sua habilidade de leitura ou deficiência visual.

Usos para Texto para Fala OCR

Combinar as tecnologias de OCR e TTS abre inúmeras possibilidades para tornar a informação mais acessível e consumível em vários cenários. Aqui estão alguns usos para texto para fala OCR:

  • Tecnologia assistiva para deficientes visuais: Converte conteúdo escrito de livros, documentos ou telas em palavras faladas, ajudando pessoas com deficiência visual ou cegas a "ler" o conteúdo.
  • Aprendizado e educação:
    • Ajuda para estudantes disléxicos: Ajuda estudantes com dislexia ou outros desafios de leitura convertendo texto escrito em áudio.
    • Aprendizado multimodal: Permite que os alunos leiam e ouçam o conteúdo, melhorando a compreensão e retenção.
  • Tradução e aprendizado de idiomas: Converte texto escrito em língua estrangeira em palavras faladas, auxiliando na pronúncia e compreensão.
  • Consumo de conteúdo digital: Converte livros, artigos de notícias e outros conteúdos de texto impresso em audiolivros ou podcasts para consumo em movimento.
  • Acessibilidade de documentos: Torna PDFs, documentos escaneados e outros formatos não editáveis acessíveis para pessoas que preferem ou precisam de conteúdo em áudio.
  • Análise de documentos históricos: Converte manuscritos antigos ou documentos de arquivo em conteúdo de áudio para pesquisadores ou entusiastas que desejam ouvir textos históricos.
  • Negócios e produtividade: Converte relatórios impressos não digitais em conteúdo falado para profissionais ocupados.
  • Revisão de texto: Ajuda escritores ou editores a identificar erros em conteúdo escrito no papel ao ouvi-lo.
  • Entretenimento: Converte histórias em quadrinhos, romances gráficos ou outros meios principalmente visuais em uma experiência auditiva.

Como Ler Texto em Voz Alta a partir de uma Imagem

Nem todo usuário de dispositivos móveis Apple e Android sabe que seus aplicativos podem ter tecnologia OCR e um leitor TTS capaz de realizar tarefas simples de conversão de texto em fala. Considere os recursos TTS integrados como aplicativos que leem para você gratuitamente ou como um aplicativo gratuito que lê texto de câmeras, no entanto, sua qualidade não é tão boa quanto a de softwares de texto para fala mais avançados. Veja como acessar o leitor de texto a partir de imagens em dispositivos Android e Apple:

Android

Dispositivos Android, pelo menos aqueles com sistema operacional Android 12 e superior, vêm com um leitor TTS embutido. É uma ferramenta útil para navegação, leitura de fontes pequenas, etc. Mas você também pode usá-lo para ler texto de imagens. Veja como configurar seu dispositivo:

  • Vá para o menu “Acessibilidade” através do aplicativo “Configurações”.
  • Ative a opção “Selecionar para Falar”.
  • Vá para a aba “Configurações” do leitor TTS e ative a opção “Ler texto em imagens”.
  • Volte para a tela inicial e abra o aplicativo “Câmera”.
  • Aponte a câmera para um livro, jornal ou outra tela com texto digital.
  • Toque no botão “Selecionar para Falar” antes de tocar em uma palavra no aplicativo “Câmera”.

O leitor TTS do Android começará a narrar a partir da palavra destacada. Você pode selecionar trechos de texto arrastando o dedo pela tela para fazer uma seleção, como faria ao usar um processador de texto.

Apple

Ler texto físico em voz alta usando um iPhone requer uma câmera funcional, iOS 15 ou superior, e ativar o leitor TTS embutido.

  • Navegue até a aba “Acessibilidade” no menu “Configurações”.
  • Toque na funcionalidade “Conteúdo Falado”.
  • Ative as opções “Falar Seleção” e “Falar Tela”.
  • Volte para a tela inicial e ligue a câmera.
  • Aponte a câmera para uma página e aguarde o botão “Texto ao Vivo” aparecer na barra de ferramentas inferior.
  • Toque no botão para ativar a leitura de tela OCR.
  • Deslize para baixo usando dois dedos para começar a ler do topo da página.
  • Toque em uma palavra ou faça uma seleção na tela para ler em voz alta uma palavra, frase ou parágrafo específico.

Assim como os dispositivos Android, iPads e iPhones têm capacidades limitadas de OCR e TTS. Embora a precisão do processamento de palavras seja acima da média, a qualidade da voz é decepcionante devido à sua natureza robótica.

Speechify—O Melhor TTS com Tecnologia OCR

Embora leitores TTS embutidos e softwares OCR sejam ótimos para ter em dispositivos móveis, sua qualidade e desempenho são menos impressionantes. Felizmente, você tem uma alternativa de aplicativo de leitura de texto. O Speechify é um leitor de texto para fala que combina tecnologia OCR e vozes de alta qualidade geradas por IA. Sua funcionalidade supera a dos leitores de texto móveis padrão e pode escanear livros inteiros e documentos físicos para processar o texto físico em texto digital. A partir daí, os algoritmos complexos geram vozes naturais que você pode controlar e ajustar à sua velocidade de leitura desejada. O software de texto para fala Speechify está disponível nas seguintes plataformas:

Seja obtendo-o na Apple App Store ou Google Play Store ou baixando a versão para desktop Mac ou a extensão do navegador Chrome, uma licença é suficiente para usar o Speechify em todos os seus dispositivos desktop e móveis. A interface amigável atrai todos os grupos etários e perfis técnicos. As digitalizações OCR do Speechify estão disponíveis para leitura online em tempo real.

Projetado para usuários com dislexia, dificuldades de leitura, deficiência visual e multitarefas, a tecnologia assistiva do Speechify faz mais do que um leitor de tela típico. É o aplicativo que você deseja para transformar qualquer texto digital e físico em um audiolivro, criar podcasts e melhorar suas habilidades de leitura com menos esforço e maior foco. Experimente o Speechify gratuito aplicativo de texto para fala e personalize uma experiência de leitura imersiva.

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman é um defensor da dislexia e o CEO e fundador da Speechify, o aplicativo de leitura em voz alta número 1 do mundo, com mais de 100.000 avaliações de 5 estrelas e ocupando o primeiro lugar na App Store na categoria Notícias e Revistas. Em 2017, Weitzman foi incluído na lista Forbes 30 Under 30 por seu trabalho em tornar a internet mais acessível para pessoas com dificuldades de aprendizagem. Cliff Weitzman já foi destaque em EdSurge, Inc., PC Mag, Entrepreneur, Mashable, entre outros meios de comunicação de destaque.