Speechify-Gründer diskutiert Zukunft der KI im Everyday AI Podcast
Bekannt aus
Begleiten Sie das fesselnde Gespräch, in dem der Gründer von Speechify die Welt der KI im Everyday AI Podcast erkundet.
Speechify-Gründer diskutiert Zukunft der KI im Everyday AI Podcast
Sind Promi-Stimmen die Zukunft der generativen KI? Ist KI sicher? Speechify-Gründer und CEO Cliff Weitzman setzte sich mit Jordan Wilson für Episode 152 des Everyday AI Podcasts zusammen, um diese Fragen und mehr zu erörtern.
Everyday AI Podcast
Der Everyday AI Podcast ist ein beliebter, kostenloser täglicher Livestream, Podcast und Newsletter, der normalen Menschen hilft, ihre Karriere mit KI voranzutreiben. Der Podcast hält die Zuhörer nicht nur über die neuesten Tipps und Trends im schnell wachsenden Bereich der generativen KI auf dem Laufenden, sondern zeigt ihnen auch, wie sie KI nutzen können, um erfolgreich zu sein. Seit seinem Start im April 2023 hat der Everyday AI Podcast 22.000 Zuhörer und 7.800 tägliche E-Mail-Newsletter-Abonnenten gewonnen, die KI-Einblicke und Strategien lernen möchten, um intelligenter, nicht härter zu arbeiten und ihren Erfolg mit Hilfe von künstlicher Intelligenz auf neue Höhen zu bringen.
Die Geschichte von Speechify
Cliff Weitzman entwickelte Speechify ursprünglich, nachdem er im College mit Legasthenie zu kämpfen hatte und feststellte, dass die meisten Lehrbücher keine Hörbücher haben. Heute ist es die weltweit führende Text-zu-Sprache-App mit über 150.000 Fünf-Sterne-Bewertungen und mehr als 25 Millionen Nutzern. Wie wurde sie so populär, dass sogar Snoop Dogg mit dem Unternehmen zusammenarbeiten wollte? Weitzman behandelte dies und vieles mehr in Episode 152 des Everyday AI Podcasts, die am Montag, den 27. November, live ging.
Wie Speechify funktioniert
Weitzman erklärte, wie Speechify auf der besten Text-zu-Sprache (TTS) Engine mit dem hochwertigsten KI-Stimmen-Generator der Welt basiert, um jeden Text sofort und kostengünstig in Sprache umzuwandeln. Mit einer Android-, Mac- und iOS-App sowie einer Website-Version und Microsoft Edge und Google Chrome-Erweiterungen ist Speechify nicht nur darauf beschränkt, digitale Texte wie PDFs, Nachrichtenartikel, Google Docs und E-Mails vorzulesen. Mit fortschrittlicher OCR- und KI-Technologie können Benutzer schnell Fotos von Lehrbüchern, Lernhilfen, handschriftlichen Notizen und anderen physischen Dokumenten aufnehmen und in lebensechte Audiodateien in Echtzeit umwandeln.
Speechifys Anwendungsfälle & Ziel
Indem Benutzer Text hören, anstatt ihn zu lesen, oder während sie ihn mit Speechifys Textmarkierungsfunktion lesen, können sie Informationen schneller, einfacher und effizienter aufnehmen. Dies hat Speechify zu einem unverzichtbaren KI-Tool für Studenten und Personen gemacht, die mit Lernunterschieden oder Behinderungen wie Legasthenie, ADHS, Sehschwäche, Blindheit, Autismus, Gehirnerschütterungen und Angstzuständen zu kämpfen haben.
Während Speechify in den frühen Jahren vorwiegend als unterstützende Technologie für Menschen mit Lernunterschieden genutzt wurde, verwenden es jetzt laut Weitzman alle Arten von Menschen, darunter Ärzte, Anwälte, Buchhalter, Militärangehörige, Führungskräfte, Finanzexperten, Sprachlerner und Multitasker, die ihre Produktivität und Lesegeschwindigkeit dank der hochwertigen, natürlich klingenden Stimmen und der OCR-Technologie steigern möchten.
Tatsächlich teilte Weitzman mit, dass Speechifys Ziel darin besteht, sicherzustellen, dass "Lesen niemals ein Hindernis für das Lernen ist, egal welchen Hintergrund man hat.”
Promi-Stimmen
Mit dem Wachstum von Speechify hatte das Unternehmen die Gelegenheit, mit einigen namhaften Prominenten zusammenzuarbeiten. In der Episode diskutierten Weitzman und Wilson, wie Speechify dazu kam, mit Snoop Dogg zusammenzuarbeiten, der seine eigene Stimme zu Speechifys Vielzahl von Sprachoptionen beiträgt.
Weitzman erklärte, dass viele von Speechifys Partnerschaften zustande kommen, wenn Menschen, die das Produkt selbst nutzen, sich melden. Er beschreibt, wie Snoop Doggs Agent sich an Speechify wandte und erklärte, dass Snoop seine Stimme nutzen wollte, um seinem Publikum zu helfen, Informationen zu konsumieren. Dies führte dazu, dass Weitzman in Snoop Doggs hauseigenes Studio flog, um seine Stimme durch Stimmenklonung und Sprachsynthesetechnologie aufzunehmen und zu replizieren.
Unter den über 200 KI-Stimmen von Speechify in verschiedenen Sprachen, darunter Englisch, Chinesisch, Spanisch, Portugiesisch und mehr, ist auch die Stimme der Schauspielerin und langjährigen Speechify-Investorin Gwyneth Paltrow als Text-zu-Sprache-Erzähleroption verfügbar.
Aber mit diesen Promi-Stimmenoptionen, die alles von Social-Media-Posts bis hin zu wissenschaftlichen Arbeiten vorlesen können, kommen auch Schutzmaßnahmen, die Speechify implementiert, um Missbrauch zu vermeiden.
KI-Sicherheit & Stimmenklonung
Während Speechify die Vorteile von KI-Text-zu-Sprache-Tools und Stimmenklonungstechnologie anerkennt, erklärte Weitzman auch, dass eines der größten Anliegen von Speechify der Schutz von Inhaltserstellern und Menschen ist, weil „KI-Sicherheit extrem wichtig ist.”
Die Implementierung von Sicherheitsrichtlinien ist noch wichtiger geworden, da Speechify seine Text-zu-Sprache-Funktionalität erweitert hat, um neue Produkte wie Speechify Studio zu lancieren, eine KI-gestützte Suite von Tools, die Inhaltserstellern ermöglicht, KI-Sprachaufnahmen, benutzerdefinierte Stimmen zu erstellen, Sprachaufnahmen zu übersetzen, ihre Arbeit automatisch zu transkribieren, Videos zu bearbeiten und KI-Avatare zu verwenden.
Zum Beispiel erklärt Weitzman, dass Speechify es Nutzern nur erlaubt, ihre eigene Stimme oder die eines Freundes, der zugestimmt hat, zu klonen, nicht einfach irgendeine Stimme aus dem Internet, um Missbrauch sowie Identitäts- oder Urheberrechtsverletzungen zu verhindern.
„Unsere Philosophie bei Speechify setzt die Rechteinhaber ans Steuer", sagte Weitzman. Er erklärte auch, dass die KI-Technologie von Speechify nicht dazu gedacht ist, Inhaltsproduzenten wie Hörbuchsprecher zu ersetzen, sondern ihre Fähigkeit zu erweitern, Inhalte zu erstellen, indem sie ihnen hilft, effizienter mehr Inhalte zu produzieren.
Zusätzlich enthüllte Weitzman, dass Speechify derzeit an einem Produkt arbeitet, das es Nutzern ermöglicht, leicht zu erkennen, ob eine Stimme menschlich oder KI-generiert ist und, falls die Stimme gefälscht ist, wo sie ursprünglich erstellt wurde - ein Schutz, der helfen wird, zu verhindern, dass Personen Opfer von Stimm-Betrügereien werden, bei denen Betrüger die Stimme eines geliebten Menschen aus böswilligen Gründen nachahmen.
Hören Sie Cliff Weitzman im Everyday AI Podcast
Um mehr darüber zu erfahren, wie die Text-zu-Sprache-KI von Speechify die Zukunft des Lernens und der Inhaltserstellung gestaltet, hören Sie sich diese spezielle Episode des Everyday AI Podcasts auf großen Podcast-Plattformen wie Apple Podcasts und Spotify an oder hören Sie unten:
Podcast-Zeitstempel:
[00:12:50] Sicherheit im Text-zu-Sprache-Bereich
[00:18:12] Anwendungsfälle für Text-zu-Sprache
[00:21:05] Fragen des Publikums
[00:24:10] Zukunft von Text-zu-Sprache
[00:27:28] Wird das geschriebene Wort weniger einflussreich?
[00:31:30] Nutzung von Text-zu-Sprache als Fachleute
Cliff Weitzman
Cliff Weitzman ist ein Verfechter für Legasthenie und der CEO und Gründer von Speechify, der weltweit führenden Text-zu-Sprache-App mit über 100.000 5-Sterne-Bewertungen und dem ersten Platz im App Store in der Kategorie Nachrichten & Zeitschriften. 2017 wurde Weitzman für seine Arbeit, das Internet für Menschen mit Lernschwierigkeiten zugänglicher zu machen, in die Forbes 30 unter 30 Liste aufgenommen. Cliff Weitzman wurde in führenden Medien wie EdSurge, Inc., PC Mag, Entrepreneur und Mashable vorgestellt.