Le fondateur de Speechify discute de l'avenir de l'IA avec le podcast Everyday AI
À l'honneur dans
Rejoignez la conversation captivante alors que le fondateur de Speechify explore les domaines de l'IA avec le podcast Everyday AI.
Le fondateur de Speechify discute de l'avenir de l'IA avec le podcast Everyday AI
Les voix de célébrités sont-elles l'avenir de l'IA générative ? L'IA est-elle sûre ? Le fondateur et PDG de Speechify, Cliff Weitzman, s'est entretenu avec Jordan Wilson pour l'épisode 152 du podcast Everyday AI pour aborder ces questions et bien d'autres.
Podcast Everyday AI
Le podcast Everyday AI est un livestream quotidien gratuit, un podcast et une newsletter qui aident les gens à développer leur carrière grâce à l'IA. Le podcast non seulement tient les auditeurs informés des dernières astuces et tendances liées à l'IA générative en pleine expansion, mais s'assure également qu'ils savent comment tirer parti de l'IA pour réussir. Depuis son lancement en avril 2023, le podcast Everyday AI a attiré 22 000 auditeurs et 7 800 abonnés à la newsletter quotidienne par e-mail qui souhaitent apprendre des idées et des stratégies sur l'IA pour travailler plus intelligemment, pas plus dur, et atteindre de nouveaux sommets de succès grâce à l'intelligence artificielle.
L'histoire de Speechify
Cliff Weitzman a initialement développé Speechify après avoir eu des difficultés à l'université avec la dyslexie et découvert que la plupart des manuels n'ont pas de livres audio. Aujourd'hui, c'est l'application text-to-speech numéro 1 dans le monde, avec plus de 150 000 avis cinq étoiles et plus de 25 millions d'utilisateurs. Comment est-elle devenue si populaire que même Snoop Dogg a voulu s'associer à l'entreprise ? Weitzman a abordé ce sujet et bien plus encore dans l'épisode 152 du podcast Everyday AI diffusé le lundi 27 novembre.
Comment fonctionne Speechify
Weitzman a expliqué comment Speechify est construit sur le meilleur moteur de synthèse vocale (TTS) avec le générateur de voix IA de la plus haute qualité au monde pour transformer n'importe quel texte en parole, instantanément et à moindre coût. Avec une application Android, Mac, et iOS, ainsi qu'une version web et des extensions pour Microsoft Edge et Google Chrome, Speechify ne se limite pas à lire à haute voix des textes numériques, tels que des PDF, des articles de presse, des Google Docs et des e-mails. Grâce à la technologie avancée d'OCR et d'IA, les utilisateurs peuvent rapidement prendre des photos de manuels, de guides d'étude, de notes manuscrites et d'autres documents physiques et les convertir en fichiers audio réalistes en temps réel.
Cas d'utilisation et objectif de Speechify
Permettant aux utilisateurs d'écouter le texte au lieu de le lire ou tout en le lisant grâce à la fonction de surlignage de texte de Speechify, les utilisateurs peuvent absorber l'information plus rapidement, plus facilement et plus efficacement. Cela a fait de Speechify un outil d'IA indispensable pour les étudiants et les personnes ayant des difficultés d'apprentissage ou des handicaps, tels que la dyslexie, le TDAH, la basse vision, la cécité, l'autisme, les commotions cérébrales et l'anxiété.
Cependant, bien que Speechify ait été principalement utilisé comme technologie d'assistance pour ceux ayant des différences d'apprentissage à ses débuts, maintenant toutes sortes de personnes l'utilisent, y compris, selon Weitzman, des médecins, des avocats, des comptables, des militaires, des cadres, des financiers, des apprenants de langues et des multitâches souhaitant augmenter leur productivité et leur vitesse de lecture, grâce à ses voix naturelles de haute qualité et à sa technologie OCR.
En fait, Weitzman a partagé que l'objectif de Speechify est de s'assurer que "la lecture ne soit jamais un obstacle à l'apprentissage pour quiconque, peu importe votre origine."
Voix de célébrités
À mesure que Speechify a grandi, elle a eu l'opportunité de s'associer à des célébrités de renom. Dans l'épisode, Weitzman et Wilson ont discuté de la manière dont Speechify est parvenu à s'associer à Snoop Dogg, qui prête sa propre voix à la multitude d'options vocales de Speechify.
Weitzman a expliqué que de nombreux partenariats de Speechify se concrétisent lorsque des personnes qui utilisent le produit elles-mêmes prennent contact. Il décrit comment l'agent de Snoop Dogg a contacté Speechify, expliquant comment Snoop voulait utiliser sa voix pour aider son public à consommer de l'information. Cela a conduit Weitzman à se rendre au studio personnel de Snoop Dogg pour enregistrer et reproduire sa voix grâce à la clonage vocal et à la technologie de synthèse vocale.
Parmi les plus de 200 voix IA de Speechify dans diverses langues, dont l'anglais, le chinois, l'espagnol, le portugais, et plus encore, la voix de l'actrice et investisseuse de longue date de Speechify, Gwyneth Paltrow, est également une option de narrateur text-to-speech.
Mais avec ces options de voix de célébrités qui peuvent lire n'importe quoi, des publications sur les réseaux sociaux aux articles de recherche, viennent également des mesures de sécurité que Speechify met en place pour éviter les abus.
Sécurité de l'IA et clonage vocal
Bien que Speechify reconnaisse les avantages des outils de synthèse vocale IA et de la technologie de clonage vocal, Weitzman a également expliqué que l'une des préoccupations majeures de Speechify est de protéger les créateurs de contenu et les personnes car "la sécurité de l'IA est extrêmement importante."
La mise en œuvre de politiques de sécurité est devenue encore plus importante à mesure que Speechify a élargi sa fonctionnalité de synthèse vocale pour lancer de nouveaux produits comme Speechify Studio, une suite d'outils alimentée par l'IA qui permet aux créateurs de contenu de créer des voix off IA, des voix personnalisées, de traduire des voix off, de transcrire automatiquement leur travail, d'éditer des vidéos et d'utiliser des avatars IA.
Par exemple, Weitzman explique que Speechify permet uniquement aux utilisateurs de cloner leur propre voix ou une voix qui est juste à côté d'eux, comme celle d'un ami ayant donné son consentement, et non n'importe quelle voix sur Internet, afin de se protéger contre les abus ainsi que contre l'usurpation d'identité ou la violation des droits d'auteur.
« Notre philosophie générale chez Speechify place les détenteurs de droits aux commandes », a déclaré Weitzman. Il a également affirmé que la technologie IA de Speechify n'est pas destinée à remplacer les créateurs de contenu comme les acteurs de voix pour livres audio, mais à « augmenter [leur] capacité à créer », par exemple en les aidant à produire plus de contenu plus efficacement.
De plus, Weitzman a révélé que Speechify travaille actuellement sur un produit qui permettra aux utilisateurs de distinguer facilement si une voix est humaine ou générée par une IA synthétique et, si la voix est fausse, où elle a été créée à l'origine - une protection qui aidera à prévenir les escroqueries vocales où des individus malveillants utilisent un changeur de voix pour imiter la voix d'un proche à des fins malveillantes.
Écoutez Cliff Weitzman sur le podcast Everyday AI
Pour en savoir plus sur la façon dont l'IA de conversion de texte en parole de Speechify façonne l'avenir de l'apprentissage et de la création de contenu, écoutez cet épisode spécial du podcast Everyday AI sur les principales plateformes de podcast telles qu'Apple Podcasts et Spotify ou écoutez ci-dessous :
Horaires du podcast :
[00:12:50] Sécurité dans l'espace texte à voix
[00:18:12] Cas d'utilisation pour la conversion de texte en parole
[00:21:05] Questions du public
[00:24:10] Avenir de la conversion de texte en parole
[00:27:28] Le mot écrit devient-il moins impactant ?
[00:31:30] Utiliser la conversion de texte en parole en tant que professionnels
Cliff Weitzman
Cliff Weitzman est un défenseur de la dyslexie et le PDG et fondateur de Speechify, l'application de synthèse vocale numéro 1 au monde, totalisant plus de 100 000 avis 5 étoiles et se classant en première place dans la catégorie Actualités & Magazines de l'App Store. En 2017, Weitzman a été nommé dans la liste Forbes des moins de 30 ans pour son travail visant à rendre Internet plus accessible aux personnes ayant des troubles d'apprentissage. Cliff Weitzman a été présenté dans EdSurge, Inc., PC Mag, Entrepreneur, Mashable, parmi d'autres médias de premier plan.