AI技術の進化により、かつては大勢のクリエイターが必要だった映像制作が、今や個人のノートPC1台で完結する時代になりました。
今回は、最新の生成AIを駆使して一本のミュージックビデオ(MV)をフルで作り上げた、試行錯誤と発見のプロセスをメモ。
誰かのための自分を卒業するストーリー
コーチングのセッションでクライアントが語った気づきをベースに誕生したのがLiving as Meという楽曲です。セッション後に何バージョンか制作し、彼女からフィードバックをもらって完成したこの作品は本人の許可を頂いて公開しました。

人生の折り返し地点を迎え、周囲の期待に応え続けてきた「誰かのための自分」を卒業し、人生の後半戦をありのままの姿で生き抜く決意を描いた一曲。
長年、自分を守るために着込んできた重い鎧を脱ぎ捨て、本当の自分の声を聴きながら、朝焼けの中を自分自身のテンポで走り出す。迷いや葛藤さえも肯定し、借り物ではない自分の地図を手に「私は私へと帰る」という解放感に満ちた再生のストーリーを描いています。
彼女のストーリーの詳細は、こちらの動画をどうぞ。
楽曲生成とGeminiによる緻密な25シーンのカット割り
楽曲生成AI Sunoの最新版v5.5で生成した3分24秒の楽曲をベースに、映像の構成を練っていきました。
今回こだわったのは、歌詞の世界観と映像をシンクロさせること。そこで、完成した楽曲をGeminiに読み込ませ、歌詞に合わせた8秒ごとのカット割り案を生成させました。

全25シーンにおよぶこの絵コンテ案が、プロジェクトの設計図となりました。AIに曲の解釈を委ねることで、自分一人では思いつかないようなドラマチックな展開が生まれたのは面白い発見でした。
GoogleのFLOWをベースに一貫性のある映像を生成
映像制作のメインステージは、GoogleのFLOWです。キャラクターの整合性を保つため、まずNano Banana 2を使用して、モデルとなる主人公の女性の静止画イメージを作成しました。
その画像をベースとして、Veo 3.1 Fastに同じプロンプトを流し込み、8秒の動画へと昇華させていきます。これにより、シーンが変わっても主人公のビジュアルが崩れない一貫性を確保しました。

Veoに画像とプロンプトを与えて一気に動画を作成することもできますが、なかなかイメージ通りの動画にならないため、試行錯誤の結果、手間がかかりますがこうした2段階を経て制作するフローに落ち着きました。
一方で、主人公が登場しない夜や朝の街をカメラが駆け抜けるような風景シーンにはVeo 3.1 Liteを採用。シーンの特性に合わせてモデルを使い分ける工夫で時間とコストを圧縮しました。
編集と試行錯誤:AIはまだ魔法のボタンではない
最後に、生成した楽曲と25本の動画をCanvaに持ち込み、1本の動画として繋ぎ合わせる編集作業を行いました。ここ数年、AIの進化は目覚ましいものがありますが、実際に触れてみると、狙った通りのイメージを文章から引き出すには、まだまだ泥臭い試行錯誤が必要です。
たった3分少々のMVですが、プロンプトの微調整や生成のやり直しを繰り返し、完成までに数日を要しました。AIは決して自動で何でも作ってくれる魔法のボタンではなく、あくまで人間のイマジネーションを形にするための、非常に高度な筆のようなものだと痛感しました。
こちらが完成したMVです。
原点は高3の夏。AIがもたらした表現の自由
ストーリー性のあるMVをフルで制作したのは今回が初めてでしたが、その作業中、ふと懐かしい記憶が蘇りました。それは高校3年生の夏休み、仲間と映画制作に没頭した日々です。
当時は主演、音楽、編集、製作総指揮といくつもの役割を兼務して走り回っていましたが、今はPCが1台あれば、作詞・作曲、演奏、ボーカル、脚本、演出、そして監督まで、あらゆる役割を自分一人でこなせてしまいます。この圧倒的な自由度の高さこそが、AIクリエイティブの醍醐味です。
あの夏の情熱が、形を変えて最新テクノロジーと融合したような感覚。僕のMV制作の原点は、30数年前のあの夏にあったのだと、AIを通じて再確認することができました。

