Założyciel Speechify omawia przyszłość AI w podcaście Everyday AI
Polecane w
Dołącz do fascynującej rozmowy, w której założyciel Speechify zagłębia się w świat AI w podcaście Everyday AI.
Założyciel Speechify omawia przyszłość AI w podcaście Everyday AI
Czy głosy celebrytów to przyszłość generatywnej AI? Czy AI jest bezpieczne? Założyciel i CEO Speechify, Cliff Weitzman, zasiadł z Jordanem Wilsonem w 152. odcinku podcastu Everyday AI, aby omówić te i inne pytania.
Podcast Everyday AI
Podcast Everyday AI to popularny, darmowy codzienny livestream, podcast i newsletter, który pomaga zwykłym ludziom rozwijać kariery dzięki AI. Podcast nie tylko informuje słuchaczy o najnowszych wskazówkach i trendach związanych z szybko rozwijającą się dziedziną generatywnej AI, ale także uczy, jak wykorzystać AI do osiągnięcia sukcesu. Od momentu uruchomienia w kwietniu 2023 roku, podcast Everyday AI zdobył 22 000 słuchaczy i 7 800 subskrybentów codziennego newslettera, którzy chcą poznać wglądy i strategie AI, aby pracować mądrzej, a nie ciężej, i osiągać nowe wyżyny sukcesu dzięki sztucznej inteligencji.
Historia Speechify
Cliff Weitzman pierwotnie stworzył Speechify po tym, jak w college'u zmagał się z dysleksją i odkrył, że większość podręczników nie ma wersji audio. Dziś to numer 1 aplikacja do zamiany tekstu na mowę na świecie, z ponad 150 000 pięciogwiazdkowych recenzji i ponad 25 milionami użytkowników. Jak stała się tak popularna, że nawet Snoop Dogg chciał współpracować z firmą? Weitzman omówił to i wiele więcej w 152. odcinku podcastu Everyday AI, który ukazał się w poniedziałek, 27 listopada.
Jak działa Speechify
Weitzman wyjaśnił, jak Speechify opiera się na najlepszym silniku zamiany tekstu na mowę (TTS) z najwyższej jakości generatorem głosu AI na świecie, aby natychmiast i przystępnie przekształcać dowolny tekst w mowę. Dzięki aplikacjom na Androida, Maca i iOS oraz wersji na stronie internetowej, a także rozszerzeniom dla Microsoft Edge i Google Chrome, Speechify nie ogranicza się tylko do czytania na głos tekstów cyfrowych, takich jak PDF-y, artykuły prasowe, dokumenty Google i e-maile. Dzięki zaawansowanej technologii OCR i AI użytkownicy mogą szybko robić zdjęcia podręczników, przewodników do nauki, notatek odręcznych i innych dokumentów fizycznych i przekształcać je w realistyczne pliki audio w czasie rzeczywistym.
Zastosowania i cel Speechify
Pozwalając użytkownikom słuchać tekstu zamiast go czytać lub podczas czytania, dzięki funkcji podświetlania tekstu w Speechify, użytkownicy mogą szybciej, łatwiej i efektywniej przyswajać informacje. To sprawiło, że Speechify stało się niezbędnym narzędziem AI dla studentów i osób zmagających się z różnicami w uczeniu się lub niepełnosprawnościami, takimi jak dysleksja, ADHD, słabe widzenie, ślepota, autyzm, wstrząsy mózgu i lęki.
Jednak, choć Speechify było początkowo używane głównie jako technologia wspomagająca dla osób z różnicami w uczeniu się, teraz korzystają z niego wszyscy, w tym, według Weitzmana, lekarze, prawnicy, księgowi, wojskowi, menedżerowie, osoby z branży finansowej, uczący się języków i wielozadaniowcy, którzy chcą zwiększyć swoją produktywność i szybkość czytania, dzięki wysokiej jakości naturalnie brzmiącym głosom i technologii OCR.
W rzeczywistości Weitzman podzielił się, że celem Speechify jest zapewnienie, że "czytanie nigdy nie będzie barierą w nauce dla nikogo, bez względu na pochodzenie.”
Głosy celebrytów
W miarę jak Speechify się rozwijało, miało okazję współpracować z wieloma znanymi celebrytami. W odcinku Weitzman i Wilson omówili, jak Speechify nawiązało współpracę ze Snoop Doggiem, który użycza swojego głosu w szerokiej gamie opcji głosowych Speechify.
Weitzman wyjaśnił, że wiele z partnerstw Speechify powstaje, gdy osoby korzystające z produktu same się zgłaszają. Opisuje, jak agent Snoop Dogga skontaktował się z Speechify, wyjaśniając, że Snoop chciał użyć swojego głosu, aby pomóc swojej publiczności w przyswajaniu informacji. To doprowadziło do tego, że Weitzman poleciał do studia Snoop Dogga, aby nagrać i zreplikować jego głos za pomocą klonowania głosu i technologii syntezy mowy.
Wśród ponad 200 głosów AI Speechify w różnych językach, w tym angielskim, chińskim, hiszpańskim, portugalskim i innych, głos aktorki i długoletniej inwestorki Speechify, Gwyneth Paltrow, jest również opcją narratora tekstu na mowę.
Jednak wraz z tymi opcjami głosów celebrytów, które mogą czytać wszystko, od postów w mediach społecznościowych po prace naukowe, pojawiają się również zabezpieczenia, które Speechify wdraża, aby zapobiec niewłaściwemu użyciu.
Bezpieczeństwo AI i klonowanie głosu
Chociaż Speechify dostrzega korzyści płynące z narzędzi AI do zamiany tekstu na mowę i technologii klonowania głosu, Weitzman również wyjaśnił, że jednym z najważniejszych priorytetów Speechify jest ochrona twórców treści i ludzi, ponieważ „bezpieczeństwo AI jest niezwykle ważne.”
Wdrażanie polityk bezpieczeństwa stało się jeszcze ważniejsze, gdy Speechify rozszerzyło swoją funkcjonalność zamiany tekstu na mowę, aby uruchomić nowe produkty, takie jak Speechify Studio, zestaw narzędzi zasilanych AI, który pozwala twórcom treści tworzyć głosy AI, niestandardowe głosy, tłumaczyć głosy, automatycznie transkrybować swoją pracę, edytować filmy i używać awatarów AI.
Na przykład, Weitzman wyjaśnia, że Speechify pozwala użytkownikom klonować tylko ich własny głos lub głos osoby znajdującej się obok, takiej jak przyjaciel, który wyraził zgodę, a nie dowolny głos z internetu, aby chronić przed nadużyciami oraz naruszeniem tożsamości lub praw autorskich.
„Nasza filozofia w Speechify ogólnie stawia właścicieli praw na pierwszym miejscu," powiedział Weitzman. Dodał również, że technologia AI Speechify nie ma na celu zastępowania twórców treści, takich jak lektorzy audiobooków, ale „wzmacnianie ich zdolności do tworzenia”, na przykład pomagając im w bardziej efektywnym tworzeniu większej ilości treści.
Dodatkowo, Weitzman ujawnił, że Speechify pracuje obecnie nad produktem, który pozwoli użytkownikom łatwo rozróżnić, czy głos jest ludzki, czy generowany syntetycznie przez AI, a jeśli głos jest fałszywy, gdzie dokładnie został pierwotnie stworzony - ochrona, która pomoże zapobiec oszustwom głosowym, w których złoczyńcy używają zmieniacza głosu, aby naśladować głos bliskiej osoby w niecnych celach.
Posłuchaj Cliffa Weitzmana w podcaście Everyday AI
Aby dowiedzieć się więcej o tym, jak AI do zamiany tekstu na mowę od Speechify kształtuje przyszłość nauki i tworzenia treści, posłuchaj tego specjalnego odcinka podcastu Everyday AI na głównych platformach podcastowych, takich jak Apple Podcasts i Spotify, lub posłuchaj poniżej:
Czasówki podcastu:
[00:12:50] Bezpieczeństwo w przestrzeni zamiany tekstu na głos
[00:18:12] Przykłady zastosowań zamiany tekstu na mowę
[00:21:05] Pytania od publiczności
[00:24:10] Przyszłość zamiany tekstu na mowę
[00:27:28] Czy słowo pisane staje się mniej wpływowe?
[00:31:30] Wykorzystanie zamiany tekstu na mowę przez profesjonalistów
Cliff Weitzman
Cliff Weitzman jest rzecznikiem dysleksji oraz CEO i założycielem Speechify, najpopularniejszej aplikacji do zamiany tekstu na mowę na świecie, z ponad 100 000 recenzji 5-gwiazdkowych i pierwszym miejscem w kategorii Wiadomości i Magazyny w App Store. W 2017 roku Weitzman został wyróżniony na liście Forbes 30 under 30 za swoją pracę na rzecz zwiększenia dostępności internetu dla osób z trudnościami w nauce. Cliff Weitzman był prezentowany w EdSurge, Inc., PC Mag, Entrepreneur, Mashable i innych czołowych mediach.