Speechifys grundare diskuterar AI:s framtid med Everyday AI-podden
Medverkat i
Följ med i det fängslande samtalet när Speechifys grundare utforskar AI-världen med Everyday AI-podden.
Speechifys grundare diskuterar AI:s framtid med Everyday AI-podden
Är kändisröster framtiden för generativ AI? Är AI säkert? Speechifys grundare och VD Cliff Weitzman satte sig ner med Jordan Wilson för avsnitt 152 av Everyday AI-podden för att ta itu med dessa frågor och mer.
Everyday AI-podden
Everyday AI-podden är en populär gratis daglig livestream, podcast och nyhetsbrev som hjälper vanliga människor att utveckla sina karriärer med AI. Podden håller inte bara lyssnarna uppdaterade om de senaste tipsen och trenderna inom det snabbt växande området generativ AI, utan ser också till att de vet hur man utnyttjar AI för att lyckas. Sedan lanseringen i april 2023 har Everyday AI-podden fått 22 000 lyssnare och 7 800 dagliga e-postprenumeranter som vill lära sig AI-insikter och strategier för att arbeta smartare, inte hårdare, och ta sin framgång till nya höjder med hjälp av artificiell intelligens.
Historien om Speechify
Cliff Weitzman utvecklade ursprungligen Speechify efter att ha haft svårt i college med dyslexi och upptäckt att de flesta läroböcker inte har ljudböcker. Idag är det den främsta text till tal-appen i världen, med över 150 000 femstjärniga recensioner och 25+ miljoner användare. Hur blev den så populär att till och med Snoop Dogg ville samarbeta med företaget? Weitzman täckte detta och mycket mer i avsnitt 152 av Everyday AI-podden som sändes måndagen den 27 november.
Hur Speechify fungerar
Weitzman förklarade hur Speechify är byggt på den bästa text till tal (TTS) motorn med den högsta kvaliteten AI-röstgenerator i världen för att omvandla vilken text som helst till tal, omedelbart och prisvärt. Med en Android-, Mac- och iOS-app, och webbversion samt Microsoft Edge och Google Chrome-tillägg, är Speechify inte bara begränsat till att läsa digital text, såsom PDF-filer, nyhetsartiklar, Google Docs och e-post, högt. Med hjälp av avancerad OCR- och AI-teknik kan användare snabbt ta bilder av läroböcker, studieguider, handskrivna anteckningar och andra fysiska dokument och konvertera dem till verklighetstrogna ljudfiler i realtid.
Speechifys användningsområden & mål
Genom att låta användare lyssna på text istället för att läsa den eller medan de läser den med Speechifys textmarkeringsfunktion, kan användare ta till sig information snabbare, enklare och mer effektivt. Detta har gjort Speechify till ett oumbärligt AI-verktyg för studenter och individer som har svårt med inlärningsskillnader eller funktionsnedsättningar, såsom dyslexi, ADHD, nedsatt syn, blindhet, autism, hjärnskakningar och ångest.
Men medan Speechify främst användes som en hjälpande teknik för dem med inlärningsskillnader under sina tidiga år, använder nu alla typer av människor det, inklusive, enligt Weitzman, läkare, advokater, revisorer, militärpersonal, chefer, personer inom finans, språkinlärare och multitaskare som vill öka sin produktivitet och läshastighet, tack vare dess högkvalitativa naturliga röster och OCR-teknik.
Faktum är att Weitzman delade att Speechifys mål är att säkerställa att "läsning aldrig är ett hinder för lärande för någon, oavsett bakgrund.”
Kändisröster
När Speechify har vuxit har det haft möjlighet att samarbeta med några stora kändisnamn. I avsnittet diskuterade Weitzman och Wilson hur Speechify kom att samarbeta med Snoop Dogg, som lånar ut sin egen röst till Speechifys mängd av röstalternativ.
Weitzman förklarade att många av Speechifys samarbeten uppstår när personer som själva använder produkten hör av sig. Han fortsätter med att beskriva hur Snoop Doggs agent kontaktade Speechify och förklarade hur Snoop ville använda sin röst för att hjälpa sin publik att konsumera information. Detta ledde till att Weitzman flög till Snoop Doggs egen studio för att spela in och replikera hans röst genom röstkloning och talsyntesteknik.
Bland Speechifys 200+ AI-röster på olika språk, inklusive engelska, kinesiska, spanska, portugisiska och fler, är skådespelerskan och långvariga Speechify-investeraren Gwyneth Paltrows röst också ett alternativ för text till tal-berättare.
Men med dessa kändisröstalternativ som kan läsa allt från inlägg på sociala medier till forskningsartiklar kommer också säkerhetsåtgärder som Speechify implementerar för att undvika missbruk.
AI-säkerhet & röstkloning
Medan Speechify erkänner fördelarna med AI text till tal-verktyg och röstkloningsteknik, förklarade Weitzman också att en av Speechifys största bekymmer är att skydda innehållsskapare och människor eftersom “AI-säkerhet är extremt viktigt.”
Att implementera säkerhetspolicyer har blivit ännu viktigare när Speechify har utökat sin text till tal-funktionalitet för att lansera nya produkter som Speechify Studio, en AI-driven verktygssvit som låter innehållsskapare skapa AI-röstöversättningar, anpassade röster, översätta röstöversättningar, automatiskt transkribera sitt arbete, redigera videor och använda AI-avatarer.
Till exempel förklarar Weitzman att Speechify endast tillåter användare att klona sin egen röst eller en röst som är precis bredvid dem, som en vän som gett sitt samtycke, inte vilken röst som helst på internet, för att skydda mot missbruk samt identitets- eller upphovsrättsintrång.
“Vår filosofi på Speechify sätter rättighetsinnehavare i förarsätet," sa Weitzman. Han påpekade också att Speechifys AI-teknik inte är till för att ersätta innehållsskapare som ljudboksskädespelare utan för att “förstärka [deras] förmåga att skapa,” till exempel genom att hjälpa dem producera mer innehåll mer effektivt.
Dessutom avslöjade Weitzman att Speechify för närvarande arbetar på en produkt som kommer att göra det enkelt för användare att avgöra om en röst är en mänsklig röst eller en AI-genererad syntetisk röst och, om rösten är falsk, var den ursprungligen skapades - ett skydd som kommer att hjälpa till att förhindra att individer blir offer för röstbedrägerier där illasinnade aktörer använder en röstförändrare för att efterlikna en älskads röst av onda avsikter.
Lyssna på Cliff Weitzman i podcasten Everyday AI
För att lära dig mer om hur Speechifys text-till-tal AI formar framtiden för lärande och innehållsskapande, lyssna på detta specialavsnitt av podcasten Everyday AI på stora podcastplattformar som Apple Podcasts och Spotify eller lyssna nedan:
Podcast Tidsstämplar:
[00:12:50] Säkerhet inom text-till-tal
[00:18:12] Användningsområden för text-till-tal
[00:21:05] Publikens frågor
[00:24:10] Framtiden för text-till-tal
[00:27:28] Blir det skrivna ordet mindre betydelsefullt?
[00:31:30] Använda text-till-tal som professionell
Cliff Weitzman
Cliff Weitzman är en förespråkare för dyslexi och VD samt grundare av Speechify, världens främsta app för text-till-tal, med över 100 000 femstjärniga recensioner och förstaplats i App Store i kategorin Nyheter & Tidskrifter. År 2017 blev Weitzman utsedd till Forbes 30 under 30-lista för sitt arbete med att göra internet mer tillgängligt för personer med inlärningssvårigheter. Cliff Weitzman har blivit uppmärksammad i EdSurge, Inc., PC Mag, Entrepreneur, Mashable, bland andra ledande medier.