Social Proof

AI音声を活用したオーディオブックのセルフパブリッシング:包括的ガイド

Speechifyは世界で最も人気のあるオーディオリーダーです。書籍、ドキュメント、記事、PDF、メールなど、あらゆる読み物をより速く処理できます。

掲載メディア

forbes logocbs logotime magazine logonew york times logowall street logo
この記事をSpeechifyで聴く!
Speechify

デジタルナレーションの普及とオーディオブック市場の拡大に伴い、多くのセルフパブリッシング作家が高品質なオーディオブックを制作する新しい方法を模索しています。...

デジタルナレーションの普及とオーディオブック市場の拡大に伴い、多くのセルフパブリッシング作家が高品質なオーディオブックを制作する新しい方法を模索しています。新たなトレンドとして、人工知能(AI)技術、特にAI音声を使用して作品をナレーションする方法があります。この記事では、AmazonのAudibleやACXのようなプラットフォームに焦点を当て、AI音声のオーディオブックナレーションにおける可能性と、オーディオブックの制作とセルフパブリッシングのプロセスについて掘り下げます。

AudibleはAIナレーションを許可しているか?

2021年9月時点での知識によれば、最大のオーディオブック小売業者の一つであるAudibleは、公式にはAI音声によるオーディオブック制作を受け入れていませんでした。AmazonのACX(Audiobook Creation Exchange)は、通常は人間のプロのナレーターを推奨するガイドラインを持ち、ナレーションされたオーディオブックの品質を維持していました。両サービスとも、合成音声よりも人間のナレーターの持つ独自の感情の幅と微妙な表現を重視していました。AIナレーションを検討している作家は、最新のガイドラインを確認する必要があります。

ACXはAI音声を受け入れているか?

ACXは、インディーやセルフパブリッシング作家のためのオーディオブック出版を支援するプラットフォームで、伝統的に人間の声優を重視していました。作家がプロのナレーターとつながり、高品質なオーディオブックを制作するための場を提供していました。2021年時点ではAI音声を公式に受け入れていませんでしたが、作家はポリシーの更新を確認するべきです。

AIでオーディオブックを作る方法は?

AIを使ってオーディオブックを作成するには、いくつかのステップがあります。まず、AI音声を提供するテキスト読み上げ(TTS)ソフトウェアやアプリを選びます。これらのサービスの多くは、自然な音質の高品質なAI音声を提供しており、オーディオブックのナレーションに使用できます。音声を選択したら、ソフトウェアにテキスト(ノンフィクション、フィクションなど)を入力し、音声ファイルに変換します。これらの音声ファイルは、シームレスなリスニング体験を確保するために、いくつかのポストプロダクション編集が必要な場合があります。今日の高度なAI技術を持ってしても、AIナレーターは人間の声優の持つ感情の深さや変化に欠けることがあります。

オーディオブックをセルフパブリッシュする方法は?

オーディオブックをセルフパブリッシュするには、まず自分の声や声優(人間またはAI)を使って本を録音します。音声ファイルが準備され、編集が完了したら、ACX、Findaway Voicesなどのオーディオブック出版プラットフォームに提出します。これらのプラットフォームは、Audible、Amazon、Apple Books、Google Play、Koboなどのさまざまな小売業者にオーディオブックを配信します。

オーディオブックをセルフパブリッシュするのにかかる費用は?

オーディオブックをセルフパブリッシュする費用は、いくつかの要因によって大きく異なります:

  1. ナレーション: プロの声優を雇う場合、これが最も大きな費用になることがあります。料金は、ナレーターの経験や需要に応じて、完成時間(PFH)あたり100ドルから500ドル以上になることがあります。自分でナレーションするか、AI音声を使用する場合、この費用を大幅に削減できます。
  2. 編集とポストプロダクション: ナレーションの後、音声を編集し、最終製品の品質を確保するためにマスタリングする必要があります。プロの音声編集サービスは、1時間あたり50ドルから100ドルの料金を請求することがあります。自分でこれを行うスキルがあれば、これらの費用を節約できます。
  3. オーディオブックカバー:既存の本のカバーを適応させることもできますが、多くの作家はより洗練された外観を求めてデザイナーを雇うことを選びます。これには50ドルから数百ドルの費用がかかることがあります。
  4. 配信: ACX、Findaway Voicesなどのプラットフォームは、販売ごとに手数料として一定の割合を取ることが多いです。例えば、ACXは独占配信権を与えるかどうかに応じて40-60%を取ります。他のプラットフォーム、例えばFindaway Voicesは異なる価格構造を持っています。
  5. マーケティング: オーディオブックの宣伝費用も忘れないでください。これには広告、レビュー用コピーの送付、その他のマーケティング戦略が含まれるかもしれません。

これらの変数を考慮すると、オーディオブックをセルフパブリッシュする費用は数百ドルから数千ドルに及ぶ可能性があります。ナレーションにAI音声を使用することで、コストを削減し、予算に限りのある作家にとってよりアクセスしやすいオプションとなる可能性があります。しかし、質の高いナレーションと制作に投資することは、より良いリスナー体験をもたらし、最終的にはオーディオブックの販売増加につながることを忘れないでください。

AI音声でオーディオブックを出版できるか?

はい、AIナレーションのオーディオブックを出版することは可能です。AI音声を受け入れるプラットフォームを選択すれば良いのです。特に、Descriptのような新興プラットフォームでは、自分の声を基にした合成音声「オーバーダブ」声を作成することができ、独立した作家にとってもう一つのAIを活用したオプションを提供しています。ただし、常にプラットフォームのガイドラインを確認してください。

オーディオブックをセルフパブリッシュするにはどうすればいいですか?

オーディオブックを出版するには、録音、編集、フォーマット、そして最終的にさまざまなプラットフォームでの配信といったいくつかの重要なステップがあります。以下は、オーディオブックを出版するための一般的なガイドです:

1. 原稿を完成させる: 原稿が完成し、編集され、ナレーションの準備が整っていることを確認してください。書面でうまくいくフレーズや形式が音声ではうまくいかないことがあるため、音声用に適応させる必要があるかもしれません。

2. ナレーターを選ぶ: 自分でナレーションを行うか、プロの声優を雇うかを決めます。また、AI技術を使ったナレーションも検討できます。どの選択をするにしても、ターゲットオーディエンスの期待に合うようにしてください。

3. オーディオブックを録音する: 静かで防音された環境でナレーションを録音し、音質を高く保ちます。プロのナレーターと一緒に作業している場合は、彼らがこの部分を担当します。

4. 音声ファイルを編集・マスタリングする: 生の音声ファイルは、ミスや不要なノイズ、長いポーズを編集する必要があります。編集後、音声は出版プラットフォームの特定の技術要件を満たすようにマスタリングされなければなりません。

5. オーディオブックのカバーアートを準備する: オーディオブックには、電子書籍や印刷された本と同様にカバーアートが必要です。ほとんどのプラットフォームの仕様を満たすために、オリジナルカバーの正方形バージョンである必要があります。

6. 配信プラットフォームを選ぶ: オーディオブックをどこで配信するかを決めます。Amazon、Audible、iTunesに配信するACX(Audiobook Creation Exchange)などのプラットフォームを利用できます。他の選択肢としては、Google Play、Kobo、Spotifyを含む40以上のプラットフォームに配信するFindaway Voicesがあります。

7. オーディオブックをアップロードする: 選んだプラットフォームの指示に従って、音声ファイルとカバーアートをアップロードします。また、オーディオブックのタイトル、著者名、説明などの詳細を提供する必要があります。

8. 価格を設定して出版する: ACXのようなプラットフォームでは、価格はオーディオブックの長さに基づいて決定されるため、自分で設定することはできません。Findaway Voicesのような他のプラットフォームでは、自分で価格を設定できます。すべてが整ったら、オーディオブックを出版できます。プラットフォームによってレビューされ、承認されれば販売が開始されます。

各オーディオブックプラットフォームには独自のガイドラインと要件があるため、常にこれらを確認し、従うことでオーディオブックが受け入れられるようにしてください。

オーディオブックの自費出版にかかる費用は?

オーディオブックの自費出版にかかる費用は、いくつかの重要な要因によって大きく異なります:

1. ナレーション: プロの声優をナレーションに雇う場合、これが最も大きな費用になる可能性があります。プロのナレーターは、経験や評判に応じて、完成した1時間あたり(PFH)100ドルから500ドル以上を請求することがあります。

2. 編集とマスタリング: 録音後、音声ファイルはミスを取り除き、スムーズなリスニング体験を確保するために編集する必要があります。また、オーディオブックプラットフォームの品質基準を満たすために音声をマスタリングする必要があります。オーディオブックの長さや音声編集者の料金に応じて、1時間あたり50ドルから100ドル以上かかることがあります。

3. オーディオブックカバーデザイン: オーディオブックにはカバーが必要で、プロのデザイナーを雇うと費用がかかるかもしれません。基本的なデザインで50ドルから、カスタムの高級カバーで500ドル以上かかることがあります。

4. 配信: オーディオブックを配信するために選んだプラットフォームによっては、関連する費用が発生することがあります。たとえば、ACX(Amazonのオーディオブック出版プラットフォーム)はロイヤルティシェアシステムで運営されており、前払いの代わりにロイヤルティの一定割合を放棄します。

5. プロモーションとマーケティング: オーディオブックを潜在的な購入者の目に留めるために行う広告やプロモーション活動は、全体のコストに追加されます。

ナレーションにAIを使用することを決定した場合、特にナレーションと編集のコストを削減できる可能性があります。ただし、AIソフトウェアに関連するコストが発生する可能性があります。AIはコストを削減できますが、AIの声の品質は常に改善されているものの、人間のナレーターの感情的な深さや表現力に匹敵しないかもしれません。

要するに、オーディオブックの自費出版は、プロセスの各ステップでの選択に応じて、数百ドルから数千ドルに及ぶ可能性があります。コスト削減策と、リスナーが楽しめる高品質な製品を作るという目標をバランスよく考慮することが重要です。

自費出版のオーディオブックを作成するプロセスは?

オーディオブックを作成し、自費出版することは、慎重な計画と実行を伴う多段階のプロセスです。以下はその基本的な流れです:

1. 準備: 完成し、徹底的に編集された原稿から始めましょう。オーディオ用にいくつかの調整が必要かもしれません。例えば、視覚的な手がかりや脚注はオーディオ形式では意味をなさないことがあります。

2. ナレーション: 誰が本をナレーションするかを決めましょう。自分で行うか、プロのナレーターを雇うか、AI技術を使用することができます。声が本のトーンやスタイルに合っていることを確認してください。

3. 録音: あなたや他の人がナレーションを行う場合、静かで音響の良い防音スペースが必要です。AIナレーションを使用する場合は、選んだAI音声ソフトウェアにテキストを入力します。

4. 編集: このステップでは、ミスや長い間、背景音を取り除き、オーディオがスムーズに流れるようにします。これはオーディオ編集ソフトウェアを使用して行うことができます。

5. マスタリング: 編集が完了したら、オーディオをアップロードするプラットフォームの技術要件を満たすように「マスタリング」する必要があります。これには、音量レベルの調整、一貫した音の確保、オーディオファイルの仕様の確認が含まれます。

6. カバーデザイン: オーディオブックのカバーを出版プラットフォームの仕様に合わせて準備します。通常は本のカバーの正方形バージョンです。

7. 出版: ACXやFindaway Voicesなどの配信プラットフォームを選びます。オーディオファイル、カバー、書籍の詳細をアップロードします。プラットフォームの審査プロセスが完了すると、オーディオブックが公開され、さまざまな小売店で利用可能になります。

8. マーケティング: ソーシャルメディア、メールニュースレター、ウェブサイトなど、さまざまなチャネルを通じてオーディオブックを宣伝します。これは販売を促進し、レビューを得るために重要です。

各ステップには細心の注意が必要です。質の高い制作、魅力的なナレーション(人間またはAI)、効果的なマーケティングは、成功したセルフパブリッシュオーディオブックに不可欠です。

トップ8 AIオーディオブックナレーションソフトウェア/アプリ

  1. Speechify Voice Over: Speechify Voice Over は、書いた本を簡単にオーディオブックに変換できるプレミアムAI音声アプリです。
  2. Google Text-to-Speech: 自然な音声のAIを提供し、複数の言語をサポートし、カスタマイズが可能です。
  3. Amazon Polly: 幅広いリアルな音声を提供し、複数の言語と方言をサポートします。
  4. IBM Watson Text to Speech: 多様な音声を持ち、微調整をサポートし、感情や強調のオプションも含まれています。
  5. Microsoft Azure Cognitive Services Speech Service: 自然な音声のテキスト読み上げを含み、カスタマイズをサポートします。
  6. Apple's Siri: 高品質なAI音声を提供し、Apple製品とシームレスに統合されます。
  7. ReadSpeaker: 高品質なTTS音声で知られ、広範なカスタマイズオプションを提供します。
  8. Descript: 自分の声に基づいた「オーバーダブ」音声を作成できます。
  9. iSpeech: 高品質な音声を提供し、複数の言語をサポートし、声のトーンや速度のオプションが豊富です。

全体として、AI音声の台頭はオーディオブック市場で著者に新たな機会を提供します。小説、ノンフィクション、ポッドキャストのナレーションを問わず、これらのツールは作品の質の高いオーディオ版でオーディエンスに届けるのに役立ちます。

Cliff Weitzman

クリフ・ワイツマン

クリフ・ワイツマンはディスレクシアの提唱者であり、世界で最も人気のあるテキスト読み上げアプリ「Speechify」のCEO兼創設者です。このアプリは10万件以上の5つ星レビューを獲得し、App Storeのニュース&雑誌カテゴリーで1位にランクインしています。2017年には、学習障害を持つ人々にインターネットをよりアクセスしやすくする取り組みが評価され、Forbesの30 Under 30に選ばれました。クリフ・ワイツマンは、EdSurge、Inc.、PC Mag、Entrepreneur、Mashableなどの主要メディアで取り上げられています。