スポンサーリンク
Contents
スポンサーリンク
概要
実用的なTTS技術の進歩により、ボイスクローンや声の実験が盛んになっています。Open JTalkやRVCなどのツールを使い、自分の声や相方の声を再現し、ポッドキャストや遊びに利用してきました。近年、「ポッドキャストできます」サービスが登場していますが、最大の話題はGoogleのNotebookLMです。多彩なリソースを与えるだけで、短時間の解説動画やポッドキャストを自動生成でき、日本語対応も進んでいます。そんな中、マイクロソフトが発表したオープンソースの「VibeVoice」は、最大4人までの多人数ポッドキャスト生成を可能にし、感情表現やコンテキスト理解も高度で、歌のメロディー部分も生成します。ただし、対応言語は英語と中国語でしたが、日本語も試されており、ローカルPCでの導入に成功しています。日本語対応にはまだ不安定さもありますが、生成が高速で2分半の音声を2分で作成可能なことや、多種多様なスクリプト編集ができる点が魅力です。自分のポッドキャストの設定を反映させ、実験的に日本語の話者人工音声を作り出せることも確認済みです。しかし、ボイスクローン機能は未搭載で、さらなる技術の一般公開や進歩に期待が寄せられています。長時間の対話や多話者も対応でき、今後の音声合成技術の発展に大きな可能性を示しています。
ポイント
- 最新のTTS技術やオープンソースツールで多人数ポッドキャストや声の実験が可能となっている。特にローカルで高速に生成できる点が魅力。
- Google NotebookLMやVibeVoiceなど新サービスが登場し、AIを活用したポッドキャスト制作や解説が進化中。日本語対応も期待されている。
- スクリプト長や表現の幅が広がり、音声のカスタマイズやマルチ話者も実現。ボイスクローンや多言語対応は今後の課題とされている。
詳しい記事の内容はこちらから
参照元について

『GameBusiness.jp』のプロフィールと信ぴょう性についてここでは『GameBusiness.jp』の簡単なプロフィール紹介と発信する情報の信ぴょう性についてまとめています。
記事を読む際...
スポンサーリンク
スポンサーリンク