【衝撃】Sora 2 Pro超え?LTX-2.3で無料音声付き動画生成!プロンプト精度も劇的向上
LTX-2.3のニュース概要
ライトトリックス社がリリースした最新の音声付き動画生成AIモデル「LTX-2.3」は、2026年1月に紹介された「LTX-2」のアップデート版であり、映像のディテール、動きの自然さ、音声のクリアさ、プロンプトへの忠実度が大幅に向上している。
このモデルは、DiT(Diffusion Transformer)ベースの音声・動画基盤モデルであり、単一のモデル内で同期した動画と音声を生成する。
アップデートでは、より高品質なデータでトレーニングされた最新のVAEを用いて潜在空間を再構築し、細部のシャープさや動きの安定性を高めた。
画像から動画を生成する際の一貫性も向上し、微細なテクスチャの保持やラストフレームの自然な補間が可能になった。
テキストコネクタの拡大により、複雑なプロンプトへの理解力も向上し、カメラの動きやシーンの構図、キャラクターのアクションなどをより正確に反映できるようになった。
音声面では、新しいボコーダーによってノイズが減少し、映像と同期したクリアなオーディオを生成する。
また、ネイティブなポートレート動画生成に対応し、最大1080×1920の解像度で活用できる。
用途に合わせてスピードと品質を重視するモードを選択でき、最長20秒、最大4K解像度、24から50FPSの生成が可能である。
「LTX-2.3」は、フルコード、モデルの重み、トレーニングコード、APIアクセス、ウェブベースの「LTX Studio」などが公開されており、ローカル環境での利用やファインチューニング、既存ワークフローへの組み込みが可能。
個人や年間収益が1000万ドル未満の企業であれば、利用、改変、再配布、商用利用を含めて無料で自由に行うことができる。
動画生成AIの注目ポイント
- Lightricksの「LTX-2.3」は、Sora 2 Proを超えるローカル動画生成AI「LTX-2」の性能を大幅に向上させた最新モデル。
- DiTベースで動画と音声を同期生成、VAEの再構築により映像のディテールや動きが格段に向上し、プロンプト理解力も向上。
- フルコードが公開され、個人/年間収益1000万ドル未満の企業は無料で利用・改変・商用利用が可能。
ローカルAIの分析・解説
LightricksのLTX-2.3は、ローカル動画生成AIの進化を示す重要なアップデートである。
Sora 2 Proを超える性能を持つLTX-2を基盤とし、DiTベースの音声・動画基盤モデルとして、映像・音声の品質、プロンプト理解度を大幅に向上させている。
潜在空間の再構築やテキストコネクタの拡大は、生成されるコンテンツの表現力を高め、複雑な指示への対応を可能にした。
特に、画像から動画生成時のテクスチャ保持やラストフレームの自然な補完は、実用レベルの向上に貢献する。
ネイティブな縦型動画生成への対応は、ショート動画市場への適応を示唆する。
フルコードの公開と商用利用可能なライセンスは、AI技術の民主化を促進し、多様な応用を加速させる可能性がある。
LTX-2.3は、ローカルAIの可能性を広げ、コンテンツ制作のあり方を変革する潜在力を持つ。
今後の発展により、AI生成コンテンツのクオリティはさらに向上し、クリエイターの新たな表現手段となるだろう。
※おまけクイズ※
Q. LTX-2.3の基盤となっているモデルは何ベースですか?
ここを押して正解を確認
正解:DiT(Diffusion Transformer)
解説:記事の冒頭で、LTX-2.3はDiTベースの音声・動画基盤モデルであることが明記されています。
詳しい記事の内容はこちらから
参照元について


