Gemini✦画像生成で、思い通りの出力を得る 3 つのコツ!
これが、思い通りの結果を得る 3 つのコツだ❗
- ダメならガンガン [↻ やり直し] をさせること
- 細部の調整には Gimp などの手作業を挟むこと
- Pixel の Google フォトの消しゴムマジックを併用すること
[作例] 手書きイラスト → 3D CG 風の変換を見てみよう
Gemini の画像生成を使いこなすコツを、実践を通して紹介するね。ここでは、記事の OGP の例を見ていこう。これは 2013 年 2 月 8 日に描いたタヌキのイラストを Gemini で 3D CG 風に変換したもの。原画に忠実に、立体的かつ質感たっぷりに描いてくれた。これは、どのように作られたのか?

コツその 1 は、便利な [↻ やり直し] を積極的に使うこと。Gemini は対話の文脈を内部に保持してるから、大幅に間違った出力に続けて会話すると、軌道修正が難しくなる。出力の方向性が大幅に間違った場合は、会話を続けるのではなく、[↻ やり直し] で同じ指示を繰り返してもらおう。モチーフのせいか「ポリシーに従い、お手伝いできません」と断られることもあったけど、その場合も意外と有効😂
コツその 2 は、細部の調整には Gimp などを使って作業すること。作例では、作る度に違う顔のタヌキが出てくるし、シャツのフリルを忘れてたり、タキシードが燕尾服になってたり。チグハグな出力を直すために、前後 2 回の出力を手作業で合成して、間違った箇所を互いで上書きして、全体で意図通りの画像を作ると良い👍
コツその 3 は、Pixel の Google フォトの消しゴムマジックを併用すること。修正する箇所を囲って直接指定できるから、目的によっては Gemini より正確。作例では、線画由来の不要な線を消すのに Pixel の Google フォトを使った。Pixel を持ってない人は… 消しゴムマジックって使えないんだっけ?😅
一番大事な、全部に共通するコツは…🤫
Gemini で画像を作るなら、一撃で完成品を目指さないこと!このタヌキを 3D CG 風にするときも、最初の出力は意図した通りじゃなかった。これらの箇所は、Gemini との対話を通してちまちま指定して修正していった。

いくつも Gemini で画像生成してみたけど、「一撃で完成品を目指さない」は毎回大事だった。例えば下の作例で、この結果を得るまでにやった操作を簡単にまとめてみた。完成品は素晴らしい品質で満足してるけど、これが一発で出るわけじゃないんだよね。
- 何度も [↻ やり直し] して、複数パターンを出力した。ときどき元のイラストと全然違う画像を出してくるので…
- Gimp で、目線と右耳を調整した。特に目線は、プロンプトだけでは意図通りにするのが難しかった。右耳はなぜか全く出力されなかったから、左耳を反転して置いた。胸ビレの色味も Gimp で修正してる
- Pixel の消しゴムマジックで余計な要素を消した。具体的には、原画には無いのに Gemini が勝手に追加したたてがみとか

意外とポン出しで上手く行くことも、ときどきあるんだけどね。例えば下の落書きは、ほぼ 1 発でこの仕上がり。明示的に修正したのは、イラストの影 (網掛け) が模様として出てきちゃってたのを消したくらいで、ほとんど修正要らずだった。こんな不定形なものでもサクッと 3D 風に出せるの、本当に凄いと思う👏

オマケ
3 つのバージョンのギョバを並べてみた。下の画像はそれぞれ、小学生の僕、大学生の僕、AI が描いたギョバ。元々自作モンスターのギョバは、僕が小学生の時に生み出したもの。2013 年にも描いたけど、そのときに生まれたわけじゃないのよね。AI 版は「僕が作った!」とあまり感じられないけど…笑。

あと、カラー版のタヌキとの比較画像も。元の絵を描いた 2 日後の 20213-02-10 に色も塗ってたのでした。ちなみに、この子は「せいそうタヌキ」という名前。清掃、正装、精巣を掛けてるw

