Speechify創設者がEveryday AIポッドキャストでAIの未来を語る
掲載メディア
Speechifyの創設者がEveryday AIポッドキャストでAIの世界に迫る魅力的な会話に参加しましょう。
Speechify創設者がEveryday AIポッドキャストでAIの未来を語る
有名人の声は生成AIの未来なのか?AIは安全なのか?Speechifyの創設者兼CEOのクリフ・ワイツマンが、ジョーダン・ウィルソンと共にEveryday AIポッドキャストのエピソード152でこれらの疑問に挑みます。
Everyday AIポッドキャスト
Everyday AIポッドキャストは、AIを活用してキャリアを成長させたい一般の人々を支援する人気のある無料のデイリーストリーム、ポッドキャスト、ニュースレターです。このポッドキャストは、生成AIの急成長する分野に関連する最新のヒントやトレンドをリスナーに提供するだけでなく、AIを活用して成功する方法を知ることができます。2023年4月の開始以来、Everyday AIポッドキャストは22,000人のリスナーと7,800人のデイリーニュースレター購読者を獲得し、AIの洞察と戦略を学び、よりスマートに働き、成功を新たな高みへと導くことを望んでいます。
Speechifyの物語
クリフ・ワイツマンは、大学でディスレクシアに苦しみ、ほとんどの教科書にオーディオブックがないことを発見した後、Speechifyを開発しました。現在、これは世界で最も人気のあるテキスト読み上げアプリであり、150,000以上の5つ星レビューと2,500万人以上のユーザーを持っています。どのようにしてスヌープ・ドッグが会社と提携したいと思うほど人気になったのでしょうか?ワイツマンは、11月27日月曜日に公開されたEveryday AIポッドキャストのエピソード152でこれについて詳しく語りました。
Speechifyの仕組み
ワイツマンは、Speechifyが世界最高品質のAI音声生成エンジンを基に構築されており、あらゆるテキストを瞬時に手頃な価格で音声に変換できることを説明しました。Android、Mac、iOSアプリ、ウェブサイト版、Microsoft EdgeやGoogleChrome拡張機能を備えたSpeechifyは、PDF、ニュース記事、Googleドキュメント、メールなどのデジタルテキストを読み上げるだけにとどまりません。高度なOCRとAI技術を使用して、教科書、学習ガイド、手書きのメモ、その他の物理的な文書の写真をすばやく撮影し、リアルタイムでリアルな音声ファイルに変換できます。
Speechifyの使用例と目標
Speechifyのテキストハイライト機能を使用して、テキストを読みながらまたは聞きながら情報を吸収することで、ユーザーはより速く、簡単に、効率的に情報を得ることができます。これにより、Speechifyは学習の違いや障害を持つ学生や個人にとって必須のAIツールとなっています。例えば、ディスレクシア、ADHD、低視力、盲目、自閉症、脳震盪、不安などです。
しかし、Speechifyは初期には学習の違いを持つ人々のための支援技術として主に使用されていましたが、現在では、医師、弁護士、会計士、軍人、経営者、金融業界の人々、語学学習者、マルチタスクをこなす人々など、あらゆるタイプの人々がその高品質な自然な音声とOCR技術のおかげで生産性と読書速度を向上させるために使用しています。
実際、ワイツマンはSpeechifyの目標が「どんな背景を持っていても、誰にとっても読書が学習の障壁にならないようにすること」であると共有しました。
有名人の声
Speechifyが成長するにつれて、いくつかの有名人と提携する機会がありました。このエピソードでは、ワイツマンとウィルソンが、スヌープ・ドッグがSpeechifyの多様な音声オプションに自分の声を提供することになった経緯を語りました。
ワイツマンは、Speechifyの多くの提携が、製品を実際に使用している人々が連絡を取ることで実現していると説明しました。スヌープ・ドッグのエージェントがSpeechifyに連絡を取り、スヌープが自分の声を使って彼のオーディエンスが情報を消化するのを助けたいと考えていることを説明しました。これにより、ワイツマンはスヌープ・ドッグのスタジオに飛び、音声クローンと音声合成技術を通じて彼の声を録音し、再現しました。
Speechifyの200以上のAI音声には、英語、中国語、スペイン語、ポルトガル語などのさまざまな言語が含まれており、女優で長期的なSpeechifyの投資家であるグウィネス・パルトローの声もテキスト読み上げのナレーターオプションとして利用できます。
しかし、これらの有名人の声のオプションがソーシャルメディアの投稿から研究論文まで何でも読み上げることができる一方で、Speechifyは誤用を防ぐための安全策を実施しています。
AIの安全性と音声クローン
SpeechifyはAIのテキスト読み上げツールと音声クローン技術の利点を認識していますが、ワイツマンは「AIの安全性は非常に重要です」と述べ、コンテンツクリエイターや人々を保護することがSpeechifyの最も重要な関心事の一つであると説明しました。
Speechifyがテキスト読み上げ機能を拡大し、AI音声オーバー、カスタム音声、音声オーバーの翻訳、自動トランスクリプション、ビデオ編集、AIアバターを作成できるAI搭載のツールスイートであるSpeechify Studioのような新製品を立ち上げる中で、安全ポリシーの実施はさらに重要になっています。
例えば、Weitzmanは、Speechifyがユーザー自身の声や、隣にいる友人のように同意を得た声のみをクローンすることを許可していると説明しています。これは、インターネット上のどんな声でもクローンできるわけではなく、悪用やアイデンティティ、著作権侵害を防ぐためです。
「Speechifyの一般的な哲学は、権利所有者を主導的な立場に置くことです」とWeitzmanは述べています。また、SpeechifyのAI技術は、オーディオブックの声優のようなコンテンツクリエイターを置き換えるためのものではなく、彼らの創造能力を「拡張する」ためのものであり、より効率的に多くのコンテンツを制作するのを助けると述べています。
さらに、Weitzmanは、Speechifyが現在、人間の声かAI生成の合成音声かを簡単に識別できる製品を開発中であることを明らかにしました。もしその声が偽物であれば、どこで作成されたのかを特定することができる保護機能があり、悪意のある人物が声を変えて愛する人の声を模倣する詐欺から人々を守るのに役立ちます。
Cliff WeitzmanのEveryday AIポッドキャストを聴く
Speechifyのテキスト読み上げAIが学習とコンテンツ制作の未来をどのように形作っているかについて詳しく知るには、Apple PodcastsやSpotifyなどの主要なポッドキャストプラットフォームでこの特別エピソードを聴くか、以下で聴いてください:
ポッドキャストのタイムスタンプ:
[00:12:50] テキストから音声への安全性
[00:18:12] テキスト読み上げの使用例
[00:21:05] 視聴者からの質問
[00:24:10] テキスト読み上げの未来
[00:27:28] 書かれた言葉の影響力は減少しているか?
[00:31:30] プロとしてのテキスト読み上げの活用
クリフ・ワイツマン
クリフ・ワイツマンはディスレクシアの提唱者であり、世界で最も人気のあるテキスト読み上げアプリ「Speechify」のCEO兼創設者です。このアプリは10万件以上の5つ星レビューを獲得し、App Storeのニュース&雑誌カテゴリーで1位にランクインしています。2017年には、学習障害を持つ人々にインターネットをよりアクセスしやすくする取り組みが評価され、Forbesの30 Under 30に選ばれました。クリフ・ワイツマンは、EdSurge、Inc.、PC Mag、Entrepreneur、Mashableなどの主要メディアで取り上げられています。