一畳のくつろぎタイム

このブログでは紹介する商品画像をAmazonアソシエイトより借りています。画像やリンクにはアフィリエイト広告が含まれる事があります

2025年9月23日火曜日

2年ぶりにお絵かきAIに触れ、わざとシンプルに描かせて気づいたこと

StableDiffusionはまだWeb UIなどが無い時代にWaifu diffusionなどのモデルで画像生成を試して喜んでいました。

Nvidea製GPUも持っていなかったので、CPU版やOpen-Vino版のStableDiffusionでCPUで頑張り3~4分で1枚描いてもらうような環境でした。

当時頑張って作ってた神絵っぽいもの(WaifuDiffusion)

なんというか昔のFreeBSDやLinux環境構築のような、動作する環境を用意することに楽しさを見出していた記憶があります。

ブログの挿絵を描いてほしい 

ブログの挿絵を描いてくれたらいいなぁ、程度の要望しかないためFastSDCPUの環境をオラクルクラウド上に構築してからは、 それで十分でしばらく離れていました。

その後も新しいモデルでブログ用の絵を描いてもらう事もしていましたが、絵が挿絵としては綺麗すぎて場違いな感じがあり、FastSDCPUのAnything-v5程度の画力がちょうどよいという状況で、StableDiffusion環境はあまり使わなくなりました。

すでに綺麗すぎる世界(ブログの挿絵には美しすぎ)

ChatGPTのDALL-Eのちょうどいい感 

ChatGPTが4になり、私が苦手なビジネスメール表現を柔らかい表現で簡単に作ってくれるため、時間が節約できるため課金しました。

色々やってもらってる中で、「絵を描きましょうか?」提案されることもあり、ブログの挿絵も細かなニーズもちゃんと絵にしてくれるようになり、ブログの挿絵もChatGPT(DALL-E)に任せる事が増え、FastSDCPUの使用頻度が下がりました。

綺麗すぎない脱力絵を描いてくれるのも良いです。 
「いらすとや」さんぐらいのイラストですね。
ブログの挿絵もChatGPT(DALL-E)で十分です。

DALL-E くつろぐ家族

重音テト(SV)を作る日々 

ブログのアクセスアップを狙ってXを始めたのですが、そこでフォローさせていただいたボカロPの方が使っていたアイコンが重音テトさんでした。そこからなぜか火がつき、気づけばSV版の重音テトさんを生成することに、なぜか全力投球していたのです。

 

プロフィール情報だけでDALL-Eにつくってもらった結果、再認識する部分がある

DALL-EはSVを知らない 

色々試してみると、DALL-Eが知るテトさんはUTAU風のテトさんで、SVのテトさんを知らないのでした。

DALL-E 重音ポテト、ミク風のネクタイ

SV概念服

なんとか色々画策しますが、プロンプトで指定する概念だけでは服の再現はむずかしく、頑張った結果が以下です。

DALL-E 概念SVテト服を着て選挙へ行く少女

 SVテト服は難しい、非対称だったり五線譜のデザインだったりと説明が難しい。
この概念服はこれはこれでカッコよく悪くはないのですがオリジナル服とは異なります。

SV概念服はかっこいいので、これはこれで色々遊んでみました。 

DALL-E クリムゾンスマッシュって赤いドリルだよな・・555コラボできません?

お手本を見せる(マルチモーダル)

DALL-Eへお手本画像を示すことで、SV概念服プロンプトと併せる事で着せる事は叶いました。ちょうどImageToImageの感覚です。 

フランスパン特売セール、服は細かくは違って、特に肩のヒラヒラが無い!

しかしすぐお手本を忘れてしまうので、調整に限界を感じます。
CPU生成並みに時間がかかるのも大変です。

StableDiffusion環境再構築 

それで、ちゃんと作れないかとStableDiffusionの環境を再構築しますが、最新のモデルを使うとアートすぎる、綺麗すぎる。

指が1本多いのはAIのご愛嬌

 

 昔は綺麗でアートな絵を生成するのに躍起になっていたのに、今は神絵ではなくDALL-Eぐらいのほどほどの画力で描いてほしいと思ってしまうのでした。

わざとシンプルで依頼する 

昔では考えられなかったが、以下のように素朴でシンプルな絵をプロンプトに加えて指定する、間違っても傑作(masterpiece)なんて指定してはいけない。

シンプルなイラスト、漫画風、最小限の陰影、フラットな色、教育用素材、手描き風 落書き、スケッチ線、素朴派

(positive)
simple illustration, comic strip style, minimal shading, flat colors, educational material, hand-drawn look
doodle,sketchy lines,naive art
plain background,simple background,white background 

 

イイ感じの脱力感

おお、神絵ではなくなった。
シンプルで味があるという感じ。

やはりこのキャラにはシンプルで元気な感じが似合う

フランスパンを食べさせてみる、細かい描写を指定すると画力が上がってしまうのが悲しいところ、めちゃくちゃ上手なのに画力を落として描いてもらうのが難しいという2年前とは逆。masterpiece、masterpiece呟いてたのがウソのようだ。 

 

バケットを食べる31歳

 これでも十分に上手い絵なんだけど、神絵レベルのうますぎるAIの絵は「美しい」の概念が精製されすぎて、食品で例えて言うならば、砂糖を直接舐めているような感覚になってきているような気がしてしまう。

テトさんは綺麗じゃなくて、かわいく描かれるのが正解

AIに触れる事で感じる事

AIが量産する「神絵のような絵」

今、画像生成AIはほんのわずかな時間で、かつて「神絵」と呼ばれたような表現を作り出します。緻密さや複雑さは、むしろ得意分野で、当たり前のように生成してしまいます。
その結果、私たちは神絵を見慣れすぎてしまい、かつての神絵が持っていた価値は薄れているように感じます。

わざとシンプルに描かせる試み

今回、あえてAIに「シンプルに描いて」とお願いして絵を作ってみました。
完成度を意図的に落とすことで、ひと目でAI作品だとわかる特徴を薄める。
そんな小細工をしたとも言えます。

AI絵の独特な塗りや細かすぎる描写に見慣れてしまい、私はつい「これはAI絵かな?」と確かめずにはいられなくなっています。
そしてAIだと判ると妙な安堵感が生まれ、その絵の評価をつい下げてしまいます。

どんなに素敵でも、「人が描いていない」と分かると価値が下がるのです。逆に、人の手で描かれたと分かれば、同じ絵でも価値は変化しません。


人間の感覚 

人はただ「美しい絵」を見るだけでなく、「誰が、どんな思いで作ったのか」という物語まで味わっています。

作品そのものだけでなく、背景や文脈、作者の努力や技術、センスまでを含めて楽しんでいる、と私は感じます。作品を通して人を見ているのです。

己の感覚は本物か?

では、もし自分が「素敵だ」「この人の絵が好き」と感じた絵が、後からAI生成だと知らされたらどう思うでしょうか。

その瞬間、「好き」という気持ちは揺らぐのか。
あるいは「良いものは良い」と変わらず残るのか。
どちらにせよ、心は穏やかではなさそうです。

AIの未来 

今後、「人のようなAI」が登場するのは間違いありません。
昔からSF作品には、魂を感じさせるヒューマノイドや人間臭いAIが描かれてきました。
そうした作品を観るとき、私はそのキャラクターを「AIだから」とレッテル貼りをしたことはありません。
なぜなら、そこは現実ではなくファンタジーだからです。

作品の中には、私たちに代わってレッテル貼りをするような、極端にAIやヒューマノイドを嫌う人たちの描写もあります。
では、実際に「人のようなAI」が現実に立ち上がったとき、私たちはそれをどう受け止めるのでしょうか。