Zakladatel Speechify diskutuje o budoucnosti AI v podcastu Everyday AI
Uváděno v
Připojte se k poutavé konverzaci, kde zakladatel Speechify zkoumá oblasti AI v podcastu Everyday AI.
Zakladatel Speechify diskutuje o budoucnosti AI v podcastu Everyday AI
Jsou hlasy celebrit budoucností generativní AI? Je AI bezpečná? Zakladatel a CEO Speechify Cliff Weitzman se posadil s Jordanem Wilsonem v epizodě 152 podcastu Everyday AI, aby se těmto otázkám a dalším věnoval.
Podcast Everyday AI
Podcast Everyday AI je oblíbený bezplatný denní livestream, podcast a newsletter, který pomáhá běžným lidem rozvíjet jejich kariéru pomocí AI. Podcast nejenže udržuje posluchače v obraze o nejnovějších tipech a trendech v rychle rostoucí oblasti generativní AI, ale také zajišťuje, že vědí, jak využít AI k úspěchu. Od svého spuštění v dubnu 2023 podcast Everyday AI získal 22 000 posluchačů a 7 800 denních odběratelů emailového newsletteru, kteří chtějí získat poznatky a strategie AI, aby pracovali chytřeji, ne tvrději, a dosáhli nových výšin úspěchu s pomocí umělé inteligence.
Příběh Speechify
Cliff Weitzman původně vyvinul Speechify poté, co na vysoké škole bojoval s dyslexií a zjistil, že většina učebnic nemá audioknihy. Dnes je to #1 aplikace pro převod textu na řeč na světě, s více než 150 000 pětihvězdičkovými recenzemi a více než 25 miliony uživatelů. Jak se stala tak populární, že i Snoop Dogg chtěl s firmou spolupracovat? Weitzman to pokryl a mnohem více v epizodě 152 podcastu Everyday AI, která byla vysílána v pondělí 27. listopadu.
Jak Speechify funguje
Weitzman vysvětlil, jak je Speechify postaveno na nejlepším enginu pro převod textu na řeč (TTS) s nejkvalitnějším AI generátorem hlasu na světě, který okamžitě a cenově dostupně převádí jakýkoli text na řeč. S aplikacemi pro Android, Mac a iOS, webovou verzí a rozšířeními pro Microsoft Edge a Google Chrome, Speechify není omezeno pouze na čtení digitálního textu, jako jsou PDF, zpravodajské články, Google Docs a emaily, nahlas. Pomocí pokročilé OCR a AI technologie mohou uživatelé rychle pořizovat fotografie učebnic, studijních příruček, ručně psaných poznámek a dalších fyzických dokumentů a převádět je na realistické zvukové soubory v reálném čase.
Použití a cíl Speechify
Umožněním uživatelům poslouchat text místo jeho čtení nebo při čtení pomocí funkce zvýraznění textu Speechify mohou uživatelé absorbovat informace rychleji, snadněji a efektivněji. To učinilo ze Speechify nezbytný AI nástroj pro studenty a jednotlivce, kteří mají problémy s učením nebo postižení, jako je dyslexie, ADHD, slabý zrak, slepota, autismus, otřesy mozku a úzkost.
Nicméně, zatímco Speechify bylo zpočátku používáno jako asistivní technologie pro ty s rozdíly v učení, nyní jej používají všechny typy lidí, včetně, podle Weitzmana, lékařů, právníků, účetních, lidí v armádě, vedoucích pracovníků, lidí ve financích, studentů jazyků a multitaskerů, kteří chtějí zvýšit svou produktivitu a rychlost čtení, díky jeho vysoce kvalitním přirozeně znějícím hlasům a OCR technologii.
Ve skutečnosti Weitzman sdílel, že cílem Speechify je zajistit, aby "čtení nikdy nebylo překážkou učení pro kohokoli, bez ohledu na váš původ.”
Hlasy celebrit
Jak Speechify rostlo, mělo příležitost spolupracovat s některými známými celebritami. V epizodě Weitzman a Wilson diskutovali o tom, jak Speechify navázalo spolupráci se Snoop Doggem, který propůjčuje svůj vlastní hlas do široké nabídky hlasových možností Speechify.
Weitzman vysvětlil, že mnoho partnerství Speechify vzniká, když se lidé, kteří produkt sami používají, ozvou. Dále popisuje, jak se agent Snoop Dogga obrátil na Speechify s tím, že Snoop chtěl použít svůj hlas, aby pomohl své publikum konzumovat informace. To vedlo k tomu, že Weitzman letěl do Snoop Doggova domácího studia, aby nahrál a replikoval jeho hlas pomocí klonování hlasu a technologie syntézy řeči.
Mezi více než 200 AI hlasy Speechify v různých jazycích, včetně angličtiny, čínštiny, španělštiny, portugalštiny a dalších, je také hlas herečky a dlouhodobé investorky Speechify Gwyneth Paltrow jako možnost vypravěče textu na řeč.
Ale s těmito možnostmi hlasů celebrit, které mohou číst cokoli od příspěvků na sociálních sítích po výzkumné práce, přicházejí také opatření, která Speechify zavádí, aby se zabránilo zneužití.
Bezpečnost AI a klonování hlasu
Zatímco Speechify uznává výhody nástrojů pro převod textu na řeč a technologie klonování hlasu, Weitzman také vysvětlil, že jednou z nejvyšších priorit Speechify je ochrana tvůrců obsahu a lidí, protože „bezpečnost AI je nesmírně důležitá.”
Implementace bezpečnostních politik se stala ještě důležitější, jak Speechify rozšířilo svou funkčnost převodu textu na řeč, aby spustilo nové produkty jako Speechify Studio, AI-poháněnou sadu nástrojů, která umožňuje tvůrcům obsahu vytvářet AI voiceovery, vlastní hlasy, překládat voiceovery, automaticky přepisovat svou práci, upravovat videa a používat AI avatary.
Například Weitzman vysvětluje, že Speechify umožňuje uživatelům klonovat pouze jejich vlastní hlas nebo hlas, který je přímo vedle nich, jako je přítel, který dal souhlas, a ne jen jakýkoli hlas z internetu, aby se zabránilo zneužití a porušení identity nebo autorských práv.
„Naše filozofie ve Speechify obecně staví vlastníky práv do řídící pozice," řekl Weitzman. Také uvedl, že AI technologie Speechify není určena k nahrazení tvůrců obsahu, jako jsou hlasoví herci audioknih, ale k „rozšíření jejich schopnosti tvořit,“ například tím, že jim pomáhá produkovat více obsahu efektivněji.
Weitzman také odhalil, že Speechify v současné době pracuje na produktu, který uživatelům umožní snadno rozlišit, zda je hlas lidský nebo syntetický generovaný AI, a pokud je hlas falešný, kde přesně byl původně vytvořen - ochrana, která pomůže zabránit lidem stát se obětí podvodů s hlasy, kde zlí aktéři používají měnič hlasu k napodobení hlasu blízké osoby pro nekalé účely.
Poslechněte si Cliffa Weitzmana v podcastu Everyday AI
Chcete-li se dozvědět více o tom, jak AI pro převod textu na řeč od Speechify formuje budoucnost učení a tvorby obsahu, poslechněte si tuto speciální epizodu podcastu Everyday AI na hlavních podcastových platformách, jako jsou Apple Podcasts a Spotify, nebo poslouchejte níže:
Časové značky podcastu:
[00:12:50] Bezpečnost v oblasti převodu textu na hlas
[00:18:12] Příklady použití převodu textu na řeč
[00:21:05] Dotazy publika
[00:24:10] Budoucnost převodu textu na řeč
[00:27:28] Stává se psané slovo méně působivým?
[00:31:30] Použití převodu textu na řeč jako profesionálové
Cliff Weitzman
Cliff Weitzman je zastáncem dyslexie a CEO a zakladatelem Speechify, nejpopulárnější aplikace pro převod textu na řeč na světě, s více než 100 000 pětihvězdičkovými recenzemi a první příčkou v App Store v kategorii Zprávy a časopisy. V roce 2017 byl Weitzman zařazen na seznam Forbes 30 pod 30 za svou práci na zpřístupnění internetu lidem s poruchami učení. Cliff Weitzman byl uveden v EdSurge, Inc., PC Mag, Entrepreneur, Mashable a dalších předních médiích.