Основатель Speechify обсуждает будущее ИИ в подкасте Everyday AI
Упоминается в
Присоединяйтесь к увлекательной беседе, где основатель Speechify погружается в миры ИИ в подкасте Everyday AI.
Основатель Speechify обсуждает будущее ИИ в подкасте Everyday AI
Являются ли голоса знаменитостей будущим генеративного ИИ? Безопасен ли ИИ? Основатель и генеральный директор Speechify Клифф Вайцман встретился с Джорданом Уилсоном в 152-м эпизоде подкаста Everyday AI, чтобы обсудить эти и другие вопросы.
Подкаст Everyday AI
Подкаст Everyday AI — это популярный бесплатный ежедневный стрим, подкаст и рассылка, которые помогают обычным людям развивать свою карьеру с помощью ИИ. Подкаст не только держит слушателей в курсе последних советов и тенденций в быстрорастущей области генеративного ИИ, но и помогает им использовать ИИ для достижения успеха. С момента запуска в апреле 2023 года подкаст Everyday AI собрал 22 000 слушателей и 7 800 подписчиков на ежедневную рассылку, которые хотят узнать инсайты и стратегии ИИ, чтобы работать умнее, а не усерднее, и достичь новых высот успеха с помощью искусственного интеллекта.
История Speechify
Клифф Вайцман изначально разработал Speechify после того, как столкнулся с дислексией в колледже и обнаружил, что большинство учебников не имеют аудиоверсий. Сегодня это приложение №1 для преобразования текста в речь в мире, с более чем 150 000 пятизвездочных отзывов и более 25 миллионов пользователей. Как оно стало настолько популярным, что даже Снуп Догг захотел сотрудничать с компанией? Вайцман рассказал об этом и многом другом в 152-м эпизоде подкаста Everyday AI, который вышел в эфир в понедельник, 27 ноября.
Как работает Speechify
Вайцман объяснил, что Speechify построен на лучшем движке преобразования текста в речь (TTS) с самым качественным генератором голосов ИИ в мире, чтобы мгновенно и доступно преобразовывать любой текст в речь. С приложениями для Android, Mac и iOS, а также веб-версией и расширениями для Microsoft Edge и Google Chrome, Speechify не ограничивается только чтением цифрового текста, такого как PDF, новостные статьи, Google Docs и электронные письма, вслух. Используя передовые технологии OCR и ИИ, пользователи могут быстро фотографировать учебники, учебные пособия, рукописные заметки и другие физические документы и преобразовывать их в реалистичные аудиофайлы в реальном времени.
Сценарии использования и цель Speechify
Позволяя пользователям слушать текст вместо чтения или во время чтения с помощью функции выделения текста Speechify, пользователи могут усваивать информацию быстрее, легче и эффективнее. Это сделало Speechify незаменимым инструментом ИИ для студентов и людей, испытывающих трудности с обучением или имеющих инвалидность, таких как дислексия, СДВГ, слабое зрение, слепота, аутизм, сотрясения и тревожность.
Однако, хотя Speechify в основном использовался как вспомогательная технология для людей с трудностями в обучении в первые годы, теперь его используют все, включая, по словам Вайцмана, врачей, юристов, бухгалтеров, военных, руководителей, финансистов, изучающих языки и многозадачных людей, желающих повысить свою продуктивность и скорость чтения, благодаря его высококачественным естественным голосам и технологии OCR.
Фактически, Вайцман поделился, что цель Speechify — гарантировать, что "чтение никогда не станет барьером для обучения для кого-либо, независимо от вашего происхождения."
Голоса знаменитостей
По мере роста Speechify у него появилась возможность сотрудничать с некоторыми известными знаменитостями. В эпизоде Вайцман и Уилсон обсудили, как Speechify начал сотрудничество со Снуп Доггом, который предоставил свой голос для множества голосовых опций Speechify.
Вайцман объяснил, что многие партнерства Speechify возникают, когда люди, которые сами используют продукт, обращаются к ним. Он рассказал, как агент Снуп Догга связался с Speechify, объяснив, что Снуп хотел использовать свой голос, чтобы помочь своей аудитории потреблять информацию. Это привело к тому, что Вайцман отправился в домашнюю студию Снуп Догга, чтобы записать и воспроизвести его голос с помощью технологии клонирования голоса и синтеза речи.
Среди более чем 200 голосов ИИ Speechify на различных языках, включая английский, китайский, испанский, португальский и другие, голос актрисы и давнего инвестора Speechify Гвинет Пэлтроу также является опцией для озвучивания текста.
Но с этими опциями голосов знаменитостей, которые могут читать все, от постов в социальных сетях до научных статей, также приходят меры предосторожности, которые Speechify внедряет, чтобы избежать злоупотреблений.
Безопасность ИИ и клонирование голоса
Хотя Speechify признает преимущества инструментов преобразования текста в речь и технологии клонирования голоса, Вайцман также объяснил, что одной из главных забот Speechify является защита создателей контента и людей, потому что "безопасность ИИ чрезвычайно важна."
Внедрение политик безопасности стало еще более важным, поскольку Speechify расширил свои функции преобразования текста в речь для запуска новых продуктов, таких как Speechify Studio, набор инструментов на базе ИИ, который позволяет создателям контента создавать озвучки ИИ, настраиваемые голоса, переводить озвучки, автоматически транскрибировать свою работу, редактировать видео и использовать аватары ИИ.
Например, Вайцман объясняет, что Speechify позволяет пользователям клонировать только свой голос или голос, находящийся рядом, например, друга, который дал согласие, а не любой голос из интернета, чтобы защитить от злоупотреблений, а также нарушения идентичности или авторских прав.
«Наша философия в Speechify в целом ставит владельцев прав на первое место», — сказал Вайцман. Он также отметил, что технология ИИ Speechify не предназначена для замены создателей контента, таких как актеры озвучивания аудиокниг, а для «расширения их возможностей создавать», например, помогая им производить больше контента более эффективно.
Кроме того, Вайцман сообщил, что Speechify в настоящее время работает над продуктом, который позволит пользователям легко различать, является ли голос человеческим или синтетическим, созданным ИИ, и если голос фальшивый, где именно он был изначально создан — защита, которая поможет предотвратить обман голосовыми мошенниками, использующими изменитель голоса для имитации голоса близкого человека в злонамеренных целях.
Слушайте Клиффа Вайцмана в подкасте Everyday AI
Чтобы узнать больше о том, как текст в речь от Speechify формирует будущее обучения и создания контента, послушайте этот специальный выпуск подкаста Everyday AI на основных платформах, таких как Apple Podcasts и Spotify, или слушайте ниже:
Таймкоды подкаста:
[00:12:50] Безопасность в области текст в голос
[00:18:12] Примеры использования текст в речь
[00:21:05] Вопросы от аудитории
[00:24:10] Будущее текст в речь
[00:27:28] Становится ли письменное слово менее значимым?
[00:31:30] Использование текст в речь профессионалами
Клифф Вайцман
Клифф Вайцман — защитник прав людей с дислексией, генеральный директор и основатель Speechify, ведущего в мире приложения для преобразования текста в речь, с более чем 100 000 отзывов на 5 звезд и первым местом в App Store в категории «Новости и журналы». В 2017 году Вайцман был включен в список Forbes «30 до 30» за его вклад в повышение доступности интернета для людей с нарушениями обучения. Клифф Вайцман был упомянут в таких изданиях, как EdSurge, Inc., PC Mag, Entrepreneur, Mashable и других ведущих СМИ.