チャリティーオークション、イクイノックスが有馬で装蹄していた蹄鉄が410万。落札したのは東京から来たおばさん。イクイノックスの一口馬主。まあ富裕層なんでしょうなあ
Posts by ittpg
ラスボス感。
これはダメですね。例えば512x512を4倍しても、1024x1024の2倍の画質になりませんでした。ただ、プロンプトに対する出力が安定しすぎてそもそもガチャを回す必要がない。数枚出して出なかったらもうプロンプトを直すしかない感じです。
それでもこんな感じで使えなくはないですが、作業中からいろいろ改善点がありそうでした。右上、夜桜並木だとちょっと多治見要蔵さん味ある。学習画像が縦1.5倍だったこともあり学習時間は10epochで6時間。本が1冊読めてしまった。
画風LoRAが上手くいったのでキャラLoRAに挑戦してみました。旧版で使った学習画像をi2iで2倍にして学習させたところ、効いてはいるもののかなりイマイチ。3枚目LoRAなし⇒2枚目LoRAあり⇒1枚目LoRA+プロンプト、でなんとか。1.5ならLoRAだけで1枚目よりよく出るのですが。
AI画像生成の鬼門・楽器演奏。ギター(1、2枚目)は指が6本になったり弦が7本になりつつも頑張っている。ベースは4弦なのか5弦なのか…?管楽器、鍵盤楽器、ドラムはまだ厳しかったです。ユーフォニウム持たせると黄前ちゃんっぽいのが出てきた。
ちなみに用意した学習データセットの一部。オリジナルともまた違ってうまい具合に画風が混ざってます。なお1.5で1024x1024の画像はまともに作れないので、512x512で作ってhiresで倍にしてます。
ちなみに学習させたかったのはキャラデザではなく画風。1.5で気に入ってたモデルがあったので、それの画風を再現できるかどうかのお試しでした。左LoRAなし、右LoRAあり。目が丸っこくなってタッチも柔らかくなってます。1.5のモデルをそのまま再現したかったのでなく、mixした感じの効果を得たかったのでこれは想像以上の大成功かも。
夕方から一念発起してLoRA作成に挑戦。kohya_ssのバージョンアップと起動に何か所も引っかかってむちゃ大変だったけど、今ようやく5epochまで学習できて、できたLoRAをかけても画像が崩れるようなことはありませんでした。所要時間は学習回数を20⇒10に減らして1epochが10分。1.5の時は5分だったので、こちらも時間は学習データセットの画像面積(512x512⇒1024x1024)にほぼ比例することが分かりました。平たく言えば4倍…
左→右で誰じゃ?って感じですがどうしても出せなかった弓を射る動作もなんとなくそれっぽく。
LoRAは学習時間を考えると恐ろしくて手を出せてないですがとりあえず呪文だけでヒロイン(両腕ある時代)。得物を振り回すアクションも安定してます。
これまでLoRAでないと不可能だったものが結構呪文だけで出る。複数人物もregional prompterで打率の低いガチャを何百枚も回さなくても安定している。なぜ俺はあんな無駄な時間を…ただ試したモデルはどれも人物に偏重している感じはしました。背景は微妙なことも。
ガチャはこれまでどおり小さい画像で生成してhires、でいけそう。パラメータ数かなり多くなっているはずですが同じ画像サイズなら生成時間はそれほど変わらない感じ。ただ、プロンプトの効きが抜群によくなっているので1.5の時のように何百枚も作って1枚をピックアップのようなことはしなくてよさそう。むしろすぐに出なかったら呪文を変えるかそのシーンはあきらめるくらいのノリ。
SDXL、2日間触り倒してだいぶわかってきました。起動時のエラーはやはりtaggerが吐いていたようで、こちらの記事 qiita.com/aramasa_ash/... のパッチを当てたら解消しました。助かりました。
早っ!
さらにモデルを替えてみるも…これはプロンプトについてイチから勉強し直しが必要と理解しました。ただいかんせんガチャのTATのせいでそれもままならず…ちょっと使いこなしは難しそう。やるならLoRAも作り直しですが1.5でも1時間半くらいかかっていたものが作れたとしても何時間かかるやら。
1.5で風景を作るときに効くnohumanを指定しても(左)…なので(むしろ微妙に人が増えてる)、モデルを変えてみました(右)がやっぱり小さく人物がいる。
2次元風モデル落としてきて1.5で左の絵を出したプロンプト(+XLの品質タグ)で作ってもらうと高い確率で半裸のお姉ちゃんが出てくるのですが…モデルの選択が悪かったのか?
で、連載はまだ残ってますが、心に余裕ができたのでSDXLをインストールしてみました。
今の環境が吹っ飛ぶとまずいので、フォルダごとまるっとコピーしてgit pullしてモデルとVAEを配備という雑な手順でもエラーが出ますがとりあえず起動、生成できました。おなじみ1girl。RTX3060 12GBでも1024x1024は20秒ほどで生成。ちなみに1.5の512x512は4秒くらいなので所要時間はだいたい面積比くらい。率の悪いガチャを回すにはちょっと苦しい。エラーはtaggerか何かのエクステンションが吐いている…と信じたい…
『召喚士の休日』は、明日朝の投稿で本編完結です。ここまでお読みいただいた方、本当にありがとうございました。
物語はあとエピローグを6エピソード予定しておりますが、近況報告に記載しましたように、今月下旬公開の予定です。先をお急ぎの方は、恐れ入りますがカクヨム版をお読みください。挿絵がない以外はほぼ同一になる予定です。挿絵もまだ影も形もありません、、なかったらすみません。
学んだのが最終話の最後の挿絵ではもう…w
右手を消す、範囲が小さく消した後の部分が複雑でなければinpaintではなくinpaint sketchの方が確実ということを学んだ。
これは採用しなかったけど、ペトラ遺跡のイメージだったので呪文を"Petra Ruins"にしたらそれっぽのが出てワラタ
考えてみたらこのなろうとカクヨムの違い、データベースエンジニアの頭の中で右と左から囁いている「正規化されたカラムから導出される値は絶対にもたない天使」と「パフォーマンスのためには逆正規化も厭わない悪魔」って感じですね。
どうしても現代風の万年筆を持たされてしまうのでinpaint sketchで羽ペンに持ち替えてもらう。
明日公開の最終話07『死者の地へ』。冬の夜なのでローブを羽織ってる体で書いてたのに忘れて民族衣装のままにしてしまったので本文をいじってしまう歴史修正主義。
直ってる。欠けてた時は累計もカウントされてなかったっぽい。と言うことはこれ表示時に毎回SUMしてるんだろうか?計算コストかかるしそれだとエピソード削除するとその分のPVが累計から減ることになるような。ちなみにカクヨムはエピソード消しても合計PV減らない。
挿絵に3回登場する王様面倒だったのでLoRAは組まずにジェネリック王様にしたけど並べるとちょっと違うな…
あれPV二日飛んでない?…と思ったら自分だけじゃなさそう。
興味深いのは、プロンプトで指示していないのにLoRAで学習した銀髪に馬のたてがみも引っ張られていること。原理的には呪文もLoRAもベクトルにバイアスをかける点では同じ?なのでそうなるんかな。人の髪と馬のたてがみを区別して学習しているモデルでは別々に効くんだろうか、、