1. 首页
  2. 文本转语音
  3. Speechify创始人与Everyday AI播客探讨AI的未来
Social Proof

Speechify创始人与Everyday AI播客探讨AI的未来

Speechify是全球第一的音频阅读器。让您更快地阅读书籍、文档、文章、PDF、电子邮件——任何您需要阅读的内容。

精选推荐

forbes logocbs logotime magazine logonew york times logowall street logo
用Speechify收听这篇文章!
Speechify

加入这场引人入胜的对话,Speechify的创始人与Everyday AI播客一起深入探讨AI领域。

Speechify创始人与Everyday AI播客探讨AI的未来

名人声音是生成式AI的未来吗?AI安全吗?Speechify创始人兼CEO Cliff Weitzman与Jordan Wilson在Everyday AI播客第152集中坐下来讨论这些问题及更多内容。

Everyday AI播客

Everyday AI播客是一个受欢迎的免费每日直播、播客和新闻通讯,帮助普通人通过AI提升职业生涯。该播客不仅让听众了解与快速发展的生成式AI领域相关的最新技巧和趋势,还确保他们知道如何利用AI取得成功。自2023年4月推出以来,Everyday AI播客已吸引了22,000名听众和7,800名每日电子邮件新闻通讯订阅者,他们希望学习AI见解和策略,以更聪明而非更辛苦的方式工作,并借助人工智能将成功提升到新的高度。

Speechify的故事

Cliff Weitzman最初在大学时因阅读障碍而开发了Speechify,并发现大多数教科书没有有声书。如今,它是全球排名第一的文字转语音应用,拥有超过150,000个五星评价和2500万以上的用户。它是如何变得如此受欢迎,以至于连Snoop Dogg都想与公司合作?Weitzman在Everyday AI播客第152集中对此进行了详细讨论,该集于11月27日星期一上线。

Speechify的工作原理

Weitzman解释了Speechify是如何基于世界上最优质的AI语音生成器的最佳文字转语音(TTS)引擎构建的,可以即时且经济地将任何文本转换为语音。通过Android、Mac和iOS应用程序、网站版本以及Microsoft Edge和Google Chrome扩展,Speechify不仅限于朗读数字文本,如PDF、新闻文章、Google文档和电子邮件。利用先进的OCR和AI技术,用户可以快速拍摄教科书、学习指南、手写笔记和其他实体文件的照片,并实时将其转换为逼真的音频文件。

Speechify的使用场景与目标

通过Speechify的文本高亮功能,用户可以在阅读时或代替阅读时聆听文本,从而更快、更轻松、更高效地吸收信息。这使得Speechify成为学生和那些在学习上有困难或障碍的人,如阅读障碍、注意力缺陷多动障碍、低视力、失明、自闭症、脑震荡和焦虑症的必备AI工具。

然而,虽然Speechify在早期主要作为辅助技术用于有学习差异的人,但现在各种类型的人都在使用它,包括据Weitzman所说的医生、律师、会计师、军人、企业高管、金融人士、语言学习者和希望提高生产力和阅读速度的多任务处理者,这要归功于其高质量的自然语音和OCR技术。

事实上,Weitzman分享说,Speechify的目标是确保“阅读永远不会成为任何人学习的障碍,无论你的背景如何。”

名人声音

随着Speechify的发展,它有机会与一些知名名人合作。在这一集中,Weitzman和Wilson讨论了Speechify如何与Snoop Dogg合作,他为Speechify的众多语音选项提供了自己的声音。

Weitzman解释说,Speechify的许多合作伙伴关系是通过使用产品的人主动联系而促成的。他接着描述了Snoop Dogg的经纪人如何联系Speechify,解释Snoop希望用他的声音帮助他的观众获取信息。这促使Weitzman飞往Snoop Dogg的内部工作室,通过语音克隆和语音合成技术录制并复制他的声音。

在Speechify的200多种AI语音中,包括英语、中文、西班牙语、葡萄牙语等,女演员兼长期Speechify投资者Gwyneth Paltrow的声音也是文字转语音的叙述选项之一。

但随着这些可以朗读从社交媒体帖子到研究论文的名人语音选项的出现,Speechify也实施了保障措施以避免滥用。

AI安全与语音克隆

虽然Speechify认识到AI文字转语音工具和语音克隆技术的好处,Weitzman也解释说,Speechify最关心的问题之一是保护内容创作者和人们,因为“AI安全极其重要。”

随着Speechify扩展其文字转语音功能以推出新产品如Speechify Studio,一个AI驱动的工具套件,允许内容创作者创建AI配音、定制声音、翻译配音、自动转录他们的作品、编辑视频和使用AI化身,实施安全政策变得更加重要。

例如,Weitzman 解释说,Speechify 只允许用户克隆自己的声音或在身边的声音,比如已获得同意的朋友的声音,而不是随便从互联网上获取的声音,以防止滥用以及身份或版权侵权。

“我们在 Speechify 的总体理念是让权利所有者掌握主动权,”Weitzman 说。他还表示,Speechify 的 AI 技术不是为了取代有声书配音演员等内容创作者,而是为了“增强他们的创作能力”,例如帮助他们更高效地制作更多内容。

此外,Weitzman 透露,Speechify 目前正在开发一款产品,能够让用户轻松辨别声音是人声还是 AI 生成的合成声音,并且如果声音是假的,还能追溯其最初的生成地——这项保护措施将有助于防止人们成为语音诈骗的受害者,坏人利用变声器模仿亲人的声音进行不法行为。

在 Everyday AI 播客中收听 Cliff Weitzman

想了解更多关于 Speechify 的文本转语音 AI 如何塑造学习和内容创作的未来,请在 Apple Podcasts 和 Spotify 等主要播客平台上收听 Everyday AI 播客的特别节目,或在下方收听:

播客时间戳:

[00:12:50] 文本转语音领域的安全性

[00:18:12] 文本转语音的使用案例

[00:21:05] 听众提问

[00:24:10] 文本转语音的未来

[00:27:28] 书面文字的影响力是否在减弱?

[00:31:30] 专业人士如何使用文本转语音

Cliff Weitzman

Cliff Weitzman

Cliff Weitzman 是一位阅读障碍倡导者,也是全球排名第一的文字转语音应用Speechify的首席执行官和创始人,该应用在App Store新闻与杂志类中排名第一,拥有超过10万个五星好评。2017年,Weitzman因其在提高学习障碍人士网络可访问性方面的贡献,被评为福布斯30位30岁以下精英之一。Cliff Weitzman曾被EdSurge、Inc.、PC Mag、Entrepreneur、Mashable等知名媒体报道。