Il fondatore di Speechify discute il futuro dell'IA con il podcast Everyday AI
In Primo Piano In
Unisciti alla conversazione affascinante mentre il fondatore di Speechify esplora i mondi dell'IA con il podcast Everyday AI.
Il fondatore di Speechify discute il futuro dell'IA con il podcast Everyday AI
Le voci delle celebrità sono il futuro dell'IA generativa? L'IA è sicura? Il fondatore e CEO di Speechify, Cliff Weitzman, si è seduto con Jordan Wilson per l'Episodio 152 del podcast Everyday AI per affrontare queste domande e molto altro.
Podcast Everyday AI
Il podcast Everyday AI è un popolare livestream giornaliero gratuito, podcast e newsletter che aiuta le persone comuni a far crescere la loro carriera con l'IA. Il podcast non solo tiene gli ascoltatori aggiornati sugli ultimi consigli e tendenze legati al mondo in rapida crescita dell'IA generativa, ma assicura anche che sappiano come sfruttare l'IA per avere successo. Dal suo lancio nell'aprile 2023, il podcast Everyday AI ha raccolto 22.000 ascoltatori e 7.800 iscritti alla newsletter giornaliera via email che desiderano apprendere intuizioni e strategie sull'IA per lavorare in modo più intelligente, non più duro, e portare il loro successo a nuovi livelli con l'aiuto dell'intelligenza artificiale.
La storia di Speechify
Cliff Weitzman ha sviluppato inizialmente Speechify dopo aver avuto difficoltà all'università con la dislessia e aver scoperto che la maggior parte dei libri di testo non ha audiolibri. Oggi è l'app text to speech numero 1 al mondo, con oltre 150.000 recensioni a cinque stelle e più di 25 milioni di utenti. Come è diventata così popolare che persino Snoop Dogg ha voluto collaborare con l'azienda? Weitzman ha trattato questo e molto altro nell'Episodio 152 del podcast Everyday AI andato in onda lunedì 27 novembre.
Come funziona Speechify
Weitzman ha spiegato come Speechify sia costruito sul miglior motore text to speech (TTS) con il generatore di voci AI di più alta qualità al mondo per trasformare qualsiasi testo in parlato, istantaneamente e a prezzi accessibili. Con un'app per Android, Mac e iOS, e una versione web oltre alle estensioni per Microsoft Edge e Google Chrome, Speechify non si limita solo a leggere ad alta voce testi digitali, come PDF, articoli di notizie, Google Docs ed email. Utilizzando tecnologia OCR avanzata e AI, gli utenti possono rapidamente scattare foto di libri di testo, guide di studio, appunti scritti a mano e altri documenti fisici e convertirli in file audio realistici in tempo reale.
Casi d'uso e obiettivo di Speechify
Permettendo agli utenti di ascoltare il testo invece di leggerlo o mentre lo leggono utilizzando la funzione di evidenziazione del testo di Speechify, gli utenti possono assorbire informazioni più velocemente, più facilmente e in modo più efficiente. Questo ha reso Speechify uno strumento AI indispensabile per studenti e individui che hanno difficoltà con differenze o disabilità di apprendimento, come dislessia, ADHD, ipovisione, cecità, autismo, commozioni cerebrali e ansia.
Tuttavia, mentre Speechify era prevalentemente utilizzato come tecnologia assistiva per coloro con differenze di apprendimento nei suoi primi anni, ora tutti i tipi di persone lo usano, inclusi, secondo Weitzman, medici, avvocati, contabili, persone nel settore militare, dirigenti, persone nel settore finanziario, studenti di lingue e multitasker che desiderano aumentare la loro produttività e velocità di lettura, grazie alle sue voci naturali di alta qualità e alla tecnologia OCR.
Infatti, Weitzman ha condiviso che l'obiettivo di Speechify è garantire che "la lettura non sia mai un ostacolo all'apprendimento per nessuno, indipendentemente dal tuo background."
Voci di celebrità
Man mano che Speechify è cresciuto, ha avuto l'opportunità di collaborare con alcune celebrità di grande nome. Nell'episodio, Weitzman e Wilson hanno discusso di come Speechify sia arrivato a collaborare con Snoop Dogg, che presta la sua voce alla vasta gamma di opzioni vocali di Speechify.
Weitzman ha spiegato che molte delle collaborazioni di Speechify nascono quando le persone che usano il prodotto si mettono in contatto. Continua descrivendo come l'agente di Snoop Dogg abbia contattato Speechify, spiegando come Snoop volesse usare la sua voce per aiutare il suo pubblico a consumare informazioni. Questo ha portato Weitzman a volare nello studio personale di Snoop Dogg per registrare e replicare la sua voce attraverso clonazione vocale e tecnologia di sintesi vocale.
Tra le oltre 200 voci AI di Speechify in varie lingue, tra cui inglese, cinese, spagnolo, portoghese e altre, la voce dell'attrice e investitrice di lunga data di Speechify Gwyneth Paltrow è anche un'opzione di narratore text to speech.
Ma con queste opzioni vocali di celebrità che possono leggere qualsiasi cosa, dai post sui social media ai documenti di ricerca, ci sono anche misure di sicurezza che Speechify implementa per evitare abusi.
Sicurezza dell'IA e clonazione vocale
Mentre Speechify riconosce i benefici degli strumenti AI text to speech e della tecnologia di clonazione vocale, Weitzman ha anche spiegato che una delle principali preoccupazioni di Speechify è proteggere i creatori di contenuti e le persone perché "la sicurezza dell'IA è estremamente importante."
Implementare politiche di sicurezza è diventato ancora più importante man mano che Speechify ha ampliato la sua funzionalità text to speech per lanciare nuovi prodotti come Speechify Studio, una suite di strumenti potenziata dall'IA che consente ai creatori di contenuti di creare voice over AI, voci personalizzate, tradurre voice over, trascrivere automaticamente il loro lavoro, modificare video e utilizzare avatar AI.
Ad esempio, Weitzman spiega che Speechify permette agli utenti di clonare solo la propria voce o una voce vicina, come quella di un amico che ha dato il consenso, non qualsiasi voce su internet, per proteggere contro l'uso improprio e la violazione dell'identità o del copyright.
“La nostra filosofia generale in Speechify mette i proprietari dei diritti al posto di guida," ha detto Weitzman. Ha anche affermato che la tecnologia AI di Speechify non è pensata per sostituire i creatori di contenuti come i narratori di audiolibri, ma per “aumentare la loro capacità di creare,” ad esempio aiutandoli a produrre più contenuti in modo più efficiente.
Inoltre, Weitzman ha rivelato che Speechify sta attualmente lavorando su un prodotto che permetterà agli utenti di distinguere facilmente se una voce è umana o generata sinteticamente dall'AI e, se la voce è falsa, dove è stata originariamente creata - una protezione che aiuterà a prevenire che le persone cadano vittime di truffe vocali in cui malintenzionati usano un cambiavoce per imitare la voce di una persona cara per scopi nefasti.
Ascolta Cliff Weitzman nel podcast Everyday AI
Per saperne di più su come l'AI di text to speech di Speechify sta plasmando il futuro dell'apprendimento e della creazione di contenuti, ascolta questo episodio speciale del podcast Everyday AI sulle principali piattaforme di podcast come Apple Podcasts e Spotify o ascolta qui sotto:
Timestamp del Podcast:
[00:12:50] Sicurezza nel campo del text to voice
[00:18:12] Casi d'uso per il text to speech
[00:21:05] Domande del pubblico
[00:24:10] Futuro del text to speech
[00:27:28] La parola scritta sta diventando meno impattante?
[00:31:30] Utilizzare il text to speech come professionisti
Cliff Weitzman
Cliff Weitzman è un sostenitore della dislessia e il CEO e fondatore di Speechify, l'app di sintesi vocale numero 1 al mondo, con oltre 100.000 recensioni a 5 stelle e al primo posto nell'App Store nella categoria Notizie e Riviste. Nel 2017, Weitzman è stato inserito nella lista Forbes 30 under 30 per il suo lavoro nel rendere internet più accessibile alle persone con difficoltà di apprendimento. Cliff Weitzman è stato menzionato in EdSurge, Inc., PC Mag, Entrepreneur, Mashable, tra altri importanti media.