【衝撃】ステイブルオーディオ3.0!商用利用OK音楽生成AIで作曲がオフライン完結へ
音楽生成AIステイブルオーディオ3.0のニュース概要
スタビリティ・エーアイは、音楽および音声生成AIモデルの新シリーズであるステイブル・オーディオ3.0を発表しました。
本シリーズはライセンス済みのデータのみを使用して学習されており、生成されたコンテンツの所有権はユーザーに帰属し、商用利用も可能です。
ユニバーサル・ミュージック・グループやワーナー・ミュージック・グループとの提携により、著作権面での懸念を解消し、企業や開発者が安心して活用できる環境を整えています。
モデルにはセマンティック・アコースティック自動エンコーダーが採用され、生成時間は最大で6分を超える楽曲作成が可能となりました。
特筆すべき点は、スモールモデルがデバイス上でのオフライン作曲に世界で初めて対応したことです。
さらに、画像生成で一般的な手法であるLoRAによるファインチューニングに対応し、特定の音源データを用いたカスタマイズが可能になりました。
既存の楽曲の一部を修正したり、音声を延長したりするオーディオインペインティング機能も搭載されています。
現在はハギングフェイスを通じたオープンウェイトモデルの公開に加え、API経由での提供も開始されており、今後は音楽家向けの新製品スイートも展開される予定です。
商用利用も可能な新機能と技術進化の注目ポイント
- スタビリティ・エーアイが音楽生成AI「ステイブル・オーディオ3.0」を発表。権利処理済みのデータのみを学習し、商用利用可能なオープンウェイトモデルとして公開されます。
- 最大6分超の楽曲生成に対応し、セマンティック・アコースティック自動エンコーダーを採用。オフラインのデバイス上でフル楽曲の作曲が可能な初のモデルも登場しました。
- LoRAによるファインチューニングや、特定箇所の修正や延長ができるオーディオインペインティング機能を搭載。ハギング・フェイス等を通じて順次利用が可能となります。
権利クリーン化がもたらす音楽制作の分析・解説
今回の発表の真の衝撃は、単なる性能向上ではなく、音楽業界における「権利のクリーン化」を前提とした開発エコシステムの確立にあります。
これまで法的な不確実性が障壁となっていた生成AIに対し、大手レーベルとの提携で商用利用の安全性を担保したことは、プロの音楽制作現場にAIが本格導入される決定的な転換点となるでしょう。
今後は、LoRAによる個別のアーティストの作風学習とオーディオインペインティング機能が統合されることで、既存の楽曲制作プロセスが根本から覆されます。
具体的には、数年以内にAIが伴奏や構成を提案し、人間が微調整を行う「AI共作」が業界の標準規格へと昇華し、個人のクリエイターがスタジオ級の音源をオフラインで完結させる時代が到来すると予測されます。
※おまけクイズ※
Q. 「ステイブル・オーディオ3.0」の特筆すべき点として、世界で初めて対応した機能はどれでしょう?
ここを押して正解を確認
正解:スモールモデルによるデバイス上でのオフライン作曲
解説:記事の概要欄にて、デバイス上でのオフライン作曲に世界で初めて対応したスモールモデルが搭載されたと述べられています。

まとめ

Stability AIの「Stable Audio 3.0」は、権利関係をクリアにし商用利用を可能にした点で、音楽制作の転換点となるでしょう。特にLoRAによる学習やオフライン作曲への対応は、クリエイターの作業環境を劇的に変える可能性を秘めています。法的な懸念が解消された今、AIと人間が共作する未来がすぐそこまで来ており、個人の制作環境がどこまで進化するのか、今後の展開が非常に楽しみでなりません。
関連トピックの詳細はこちら


