Leonardo.aiがやってきたのでAIアシスタント作りに励んでみた

大谷大ちゃん一押しの「Leonardo.ai」が招待待ちの状態から遂に使えるようになった野で色々いじって遊んでいました。折角なので、Midjorneyと行ったりきたりしながら良さげな「AIアシスタント」を作ってみようと思い、色々遊んでいました。

PodcastのAIアシスタントを作る

ふと、AIを駆使してPodcast用のAIアシスタントを作りたいと思い立ち、以下の工程で挑戦してみたところ、なかなか良い感じに出来たんじゃないかと。

MidjorneyとLeonardo.aiを使ってAIアシスタントの画像を作る
VOICEPEAKを使ってAIアシスタントのナレーションを作る
Creative Reality Stuidoに画像とナレーションを食わせて喋る映像を生成

基本的にはPodcastの入りと締めの定型文、そしてお便りの読み上げをやって貰おうかなと思っています。Creative Reality™ Studioは$5.9で月10分、40credit(20プロンプト分位)。お便り読み上げだけだと勿体ないのでVocaloidに歌わせるときも使おう。。

画像生成AIで

最初に作ったAIアシスタント案は次の画像なのですが、ちょっと「初音ミク」感がなきにしもあらずなので、もう少し権利問題が発生しなさそうな感じで模索を開始。

結果的には次の画像をAIアシスタントとすることにしました。

とりあえず、使ったプロンプトはこんな感じ。

(masterpiece), realistic, (portrait of a girl), asian girl,short hair, beautiful face,AI assistant, cyber punk wear and head gear with blue light, sunlight, cinematic light, bangs, a beautiful woman, beautiful eyes, red hair, perfect anatomy, very cute, odd eyes, Centered image, stylized, bioluminescence, 8 life size,8k Resolution, human hands, wonder full, elegant, approaching perfection, dynamic, highly detailed, character sheet, concept art, smooth, facing directly at the viewer positioned so that their body is a symmetrical and balanced, stunningly beautiful teenage girl, detailed hairstyle, smile, medium shot, Front view

Midjorneyで生成されたのが以下。

この辺でここら辺から少しアレンジを加えたりしながらこんな感じの画像も生成したのですが、動画化した際に動きが変だったので断念。

最終的にはバリエーションを作りながら模索してこちらの絵に落ち着きました。質感的にはMidjorneyの方が好きだったのですが、試しにLeonardo.aiに食わせてみると・・

こんな感じになりました。ちょっとアニメっぽいけど、最終的にはこちらを採用。飾りがなんかこっっちの方が良いかんじなんすよ。

ちなみに次の絵も候補でした。

Leonardo.ai単体だとなかなか厳しい感じも

使ってみた感じ同じプロンプトで入力をすると、Midjorneyの方が圧倒的に質感が良く、Leonardo.aiは恐らく事細かにプロンプトとネガティブプロンプトを指定してやって、且つ試行錯誤を繰り返しまくる必要があると感じました。Midjorneyは一発で決めてくる感じ。

最初にLeonardo.aiで作ろうとした際に出てきた絵がこれ。

全く同じプロンプトでMidjorneyが出してきたのがこちら。

まぁ、好みの問題もあると思うのですが一応「Realistic」指示してるので質感的にはMidjorneyの圧倒的勝利感はあります。ただ、Midjorneyの絵をベースにちょっとアレンジを加えてみるとこれはこれで悪くない。

ちなみに、アジアの少女っぽい感じで作ろうとした際のLeonardo.aiがこちら。まぁ、悪くはない。というかMidjorneyがなかったら普通に使えるレベル。

同じプロンプトではないのですが、似たようなプロンプトで生成したMidjorneyの絵がこちら。圧倒的すぎる。

Creative Reality™ Studioは正面からの絵じゃないとキツい

Creative Reality™ Studioでの映像生成、色々試してみたのですが、先ほど紹介した右側面から写したアングルとかで動画を生成すると見るも無惨な感じの仕上がりです。

また、下の様にちょっとソフトな感じの仕上がりの絵だと何か上手く顔の輪郭全体を捉えてくれず変な感じになります。

Creative Reality™ Studioを使うなら、正面且つある程度輪郭線がくっきりしている絵に限るってことですね。そんなわけで、Podcast/Youtube向けのAIアシスタントのベースは以下の絵を使っていきたいと思います。

さいごに

とりあえず、何がすげーってMidjorneyもLeonardo.aiもスゲーいい絵を描いてくれるし、Voice Peakの読み上げも超自然だし、Creative Reality™ Studioの画像と音声アップしたら映像が無茶苦茶簡単にできるんですよね。

Leonardo.aiは無料でも十分使えるし、Midjorneyは月10ドル、Creative Reality™ Studioは14日間トライアルで使えるし、月5.9ドルで使い続けられると。しかも、Creative Reality™ Studio単体でもテキスト⇒音声変換ができるので、音声合成ソフト持ってない人はCreative Reality™ Studioだけでも十分事足りるかも。

僕は以前Voice Peakが発売された時に期間限定の割引で購入したのでちょっとお安く買えたのですが、何はともあれ今回活用することができて良かったです。