生成AIでこなれた文章や画像、動画は作れても、人間味溢れるリアルなボーカルを再現するのは一番難しいと思っていましたが、Udioの登場で楽曲生成AIのレベルも一気に異次元へ突入した感があります。
先週末に試しに制作してみたSakura Promiseの出来栄えがあまりに良かったため、今週末は同じ歌詞で全く異なる様々なジャンルの楽曲を生成してみました。まずは聴いてみてください。
オリジナル J-pop
まずはオリジナルのJ-popバージョンです。
Jazz
Bossa Nova
Heavy Metal
Rock
K-pop
J-pop #2
J-pop #3
Udioを使ってみた感想
これまで最強と言われていたSUNOと比べると、楽曲のメロディライン、ボーカル、演奏ともにUdioの方が頭ひとつ飛び出した印象です。その他、気がついた点をメモ。
- 得意なジャンルと不得意なジャンルがある。例えば、ジャズやボサノバはかなりそれっぽい楽曲を次々と提案してくる一方で、ハワイアンは何度か試してみたがイマイチ。
- 最初は30秒程度の楽曲がまず生成され、それをベースにしてイントロを前に追加したり、次の展開やアウトロを後ろに追加できるが、とにかく最初の30秒が鍵。
- いくら延長やアレンジをしても、この30秒のクオリティがしょぼいとその先も期待できない。
- 逆に、品質の高い30秒が作れれば、いろいろなバージョンで展開させる度に興味深いアレンジが期待できる。
- 同じ歌詞、プロンプト(曲調の指定)でも、生成する度に全く異なる曲調やレベル感の楽曲が生成される。
- このバラツキの大きさから推測すると、たまたまランダムで選択されたベースとして学習した楽曲自体のレベルにかなり依存している印象。
この先が楽しみのような、空恐ろしいような。楽曲生成AIの進化はいったい今後どうなっていくのでしょうか。