PR

Stable Diffusionの奇形防止で手足崩れを直す

Stable Diffusion
記事内に広告が含まれています。

Stable Diffusionの奇形防止完全ガイド

Stable Diffusionの奇形防止について調べているあなたは、手や指が増える、足が不自然に曲がる、胴長になる、顔崩れが起きる、全身画像が安定しないといった悩みを抱えているのではないでしょうか。ここ、かなり気になりますよね。画像生成はプロンプトを入れるだけで動くので簡単に見えますが、実際にはネガティブプロンプト、画像サイズ、Hires.fix、embedding、LoRA、ControlNet、ADetailer、分割生成など、少し設定を変えるだけで結果がガラッと変わります。

この記事では、Stable Diffusionの奇形防止でまず見直すべき基本設定から、手や指の崩れを減らすプロンプト、胴長を避ける画像サイズ、全身画像を安定させる上級テクニックまで、実践しやすい順番で整理します。万能な設定はありませんが、失敗の原因を切り分けながら調整すれば、破綻の少ない画像に近づけることは十分可能です。

この記事のポイント
  • 奇形や作画崩壊が起きる主な原因
  • ネガティブプロンプトの効果的な使い方
  • 画像サイズやHires.fixによる胴長対策
  • ControlNetやADetailerを使った安定化
AIで収入UPを実現可能!

Stable Diffusionの奇形防止の基本

まずは、Stable Diffusionで奇形が起きる原因を整理し、最初に見直すべき基本設定を確認していきます。手や指、胴体、顔の崩れは、単に運が悪いだけではなく、プロンプトの不足、画像サイズの不一致、モデルとの相性、拡張機能の使い方などが重なって起こることが多いです。ここでは、初心者の方でもすぐに試せる対策から順番に見ていきます。

ネガティブプロンプトの使い方

Stable Diffusionの奇形防止で最初に取り入れたいのが、ネガティブプロンプトです。ネガティブプロンプトは、生成したくない要素をAIに伝えるための入力欄です。通常のプロンプトが「描いてほしいもの」を指定するのに対して、ネガティブプロンプトは「描かないでほしいもの」を指定します。ここをきちんと使うだけで、手指の崩れ、低品質、文字、ロゴ、余分な手足などをある程度抑えやすくなります。

たとえば、手や指の崩れが目立つ場合は、bad hands、extra fingers、missing fingers、fused fingers、deformed fingersなどを入れることで、生成結果が安定する場合があります。人体全体の崩れには、bad anatomy、bad body、extra limbs、missing limb、deformed、distortedなどが候補になります。腕や足が増える場合は、extra arms、extra legs、split legs、detached armなども試す価値があります。

最初は基本セットから始める

いきなり長いネガティブプロンプトを全部入れるより、まずは基本セットから始めるのがおすすめです。たとえば、worst quality, low quality, bad anatomy, bad hands, extra fingers, missing fingers, deformedのように、品質と人体崩れに関係する単語を短くまとめます。そのうえで、生成結果を見ながら「指が増えるならextra fingersを強める」「体が分離するならdisconnected limbsを足す」といった形で調整していくと、失敗の原因を見つけやすいです。

基本の考え方は、失敗した要素だけを足していくことです。最初から大量のネガティブプロンプトを詰め込むより、生成結果を見ながら必要な単語を追加したほうが、原因を切り分けやすくなります。

品質低下を避けたい場合は、worst quality、low quality、normal quality、lowres、blurry、jpeg artifactsなどもよく使われます。特にアニメ系モデルでは、品質系のネガティブプロンプトを入れるだけでも、全体の破綻が軽くなることがあります。リアル系モデルでも、ぼやけや低解像度を避ける意味で、lowresやblurryは入れておくと扱いやすいです。

ただし、ネガティブプロンプトは万能ではありません。入れすぎると、絵の勢いが弱くなったり、ディテールが減ったり、逆に不自然な出力になることもあります。特に、同じ意味の単語を何十個も詰め込むと、画像全体が硬くなったり、モデル本来の画風が出にくくなったりします。奇形を完全に消す設定ではなく、失敗確率を下げるための補助として使うのが現実的です。

また、ネガティブプロンプトは前に置いた単語ほど影響しやすいと考えられることが多いです。そのため、今いちばん避けたい崩れを先頭付近に置くのがコツです。たとえば手の崩れが最重要ならbad handsやextra fingersを前のほうに置き、文字やロゴの混入が気になる場合はtext、watermark、signatureを前に置くと調整しやすいですよ。

ネガティブプロンプトの考え方をさらに広く整理したい場合は、生成AI促進本部内のSeaArtプロンプトの書き方のコツも参考になります。Stable Diffusion系のプロンプト整理にも応用しやすい内容です。

手や指の崩れを防ぐ設定

Stable Diffusionで特に崩れやすいのが、手や指です。指が6本になる、指同士がくっつく、手が溶ける、別の場所から指が出るといった失敗は、多くのユーザーが経験します。ここ、めちゃくちゃストレスですよね。顔や服がきれいに出ているのに、手だけが崩れてボツになることもよくあります。

手が崩れやすい理由は、AIが人体構造を人間のように理解しているわけではないからです。Stable Diffusionは大量の画像の傾向から「それらしい形」を生成しますが、指の本数や関節の位置を常に正確に数えているわけではありません。さらに、手はポーズによって見え方が大きく変わります。握る、開く、顔に添える、髪を触る、物を持つなど、形のバリエーションが多すぎるため、破綻しやすいパーツなんです。

ポジティブとネガティブの両方で整える

手や指を安定させたい場合は、ネガティブプロンプトに加えて、ポジティブプロンプト側でも自然な手を意識させます。たとえば、natural hands、detailed hands、five fingers、anatomically correct handsなどを入れると、手を丁寧に描かせる方向へ寄せられる場合があります。手を隠したい場合は、hands behind back、hands in pockets、arms crossedなど、崩れにくいポーズを指定するのも現実的です。

目的使いやすいプロンプト例注意点
指が増えるextra fingers, extra digits強く入れすぎると手が隠れる場合があります
指が欠けるmissing fingers, fewer digits構図によっては効果が弱い場合があります
手が崩れるbad hands, deformed handsモデルごとの相性確認が必要です
指がくっつくfused fingers, interlocked fingers手を組む構図では逆効果になる場合があります
手を自然に描くnatural hands, detailed handsアップ構図ほど効果を確認しやすいです

また、手が画面の小さな領域にしか映っていない場合、AIが細部を描き切れず崩れやすくなります。全身画像で手まできれいに出したいときは、解像度、Hires.fix、ADetailer、ControlNetなども組み合わせて考える必要があります。プロンプトだけで無理に直そうとするより、手が十分なピクセル数で描かれるようにすることが大切です。

私が実務的におすすめするのは、まず手が見えやすい構図でシードやプロンプトを調整し、その後で複雑なポーズへ広げる流れです。いきなり両手を前に出した難しい構図や、指が重なるポーズを狙うと、失敗原因が増えすぎて調整しにくくなります。最初は片手だけ見える構図、手を体の横に下ろす構図、ポケットに入れる構図などから試すと、破綻の傾向を把握しやすいです。

手の修正は一発で完璧にしようとしないことが大切です。プロンプト、画像サイズ、シード、補正機能を少しずつ変えながら、どの設定で崩れが減るかを確認してください。

手を見せる必要がないイラストなら、手を隠す構図も立派な対策です。たとえば、portrait、close-up、upper body、hands out of frameなどを使えば、手の描写そのものを避けやすくなります。作品の目的が顔や服装の表現なら、無理に手を出す必要はありません。逆に、手元が重要な画像なら、ControlNetやADetailerなどの補助機能を積極的に使うといいかと思います。

画像サイズと胴長の原因

胴長や手足の伸びは、画像サイズの設定と深く関係しています。特にSD1.5系のように、比較的小さな解像度で学習されたモデルを使っている場合、最初から大きすぎるサイズで生成すると、AIが余ったキャンバスを埋めようとして、胴体を伸ばしたり、手足を不自然に増やしたりすることがあります。ここは初心者の方がかなりつまずきやすいポイントです。

「高画質にしたいから最初から大きく生成しよう」と考えるのは自然です。ただ、Stable Diffusionではそれが逆効果になることがあります。画像サイズが大きくなると、AIは広いキャンバス全体に対して構図を組み立てる必要があります。その結果、人物の全体バランスが崩れたり、上半身と下半身のつながりがおかしくなったり、足が余分に生成されたりすることがあるんです。

モデルに合ったサイズを選ぶ

一般的な目安として、SD1.5系では512×512、512×768、768×512あたりから始めると安定しやすいです。一方で、SDXL系は1024×1024前後を前提に作られたモデルが多いため、同じStable Diffusionでも適した画像サイズは変わります。つまり、重要なのは「Stable Diffusionならこのサイズ」と決めつけることではなく、使っているモデルの推奨解像度に合わせることです。

512、768、1024という数値はあくまで一般的な目安です。正確な推奨サイズは、使用するモデルの配布ページや公式サイトをご確認ください。モデルごとに学習解像度や推奨アスペクト比が異なるため、すべての環境で同じ結果になるわけではありません。

胴長になる場合は、まず初期生成サイズを下げてください。最初から1500×1500のような大きなサイズで生成するより、小さめのサイズで構図を固めてから、Hires.fixやアップスケーラーで拡大するほうが安定しやすいです。特に人物を1人だけ生成する場合は、縦長なら512×768、横長なら768×512のように、目的に合わせてアスペクト比を選ぶと扱いやすくなります。

よくある目的初期サイズの目安起きやすい失敗対策
顔アップ512×512背景が単調になる背景プロンプトを追加する
上半身512×768手が中途半端に入る手の位置を指定する
全身512×768または768×1024相当顔や手が小さく崩れるHires.fixやADetailerを使う
横長構図768×512人物が複数化する1girl、soloなどを明確に入れる

スマホやローカル環境でStable Diffusionを動かす場合は、端末性能やVRAMの制約も考える必要があります。解像度を上げれば上げるほど、処理負荷は重くなります。無理に大きなサイズで生成してエラーを出すより、まずは安定するサイズで構図を作り、あとから拡大するほうが現実的です。環境構築から見直したい方は、Stable Diffusionスマホローカルの始め方もあわせて確認しておくと、生成環境の考え方が整理しやすくなります。

胴長の原因は画像サイズだけではありません。ポジティブプロンプトでfull body、long legs、wide shotなどを入れすぎると、モデルによっては脚や胴体を強調しすぎる場合があります。逆に、ネガティブプロンプトにlong body、long torso、bad proportionsなどを入れると改善することがあります。サイズ、プロンプト、モデルの相性をセットで見るのが大事ですよ。

Hires.fixで高画質化

Hires.fixは、Stable Diffusionで奇形防止と高画質化を両立しやすくする重要な機能です。基本的には、最初に低めの解像度で構図を作り、その後に画像を拡大しながら細部を描き足す仕組みです。最初から大きな画像を作るのではなく、まず安定した小さな画像を作ってから育てるイメージですね。

最初から大きな画像を生成すると、全体の整合性が崩れやすくなります。一方で、Hires.fixを使えば、低解像度の段階で人物の位置やポーズを安定させ、そのあとで高解像度化できるため、胴長や分離した体を避けやすくなります。特にSD1.5系では、この流れがかなり実用的です。

Hires.fixで見るべき設定

Hires.fixで重要なのは、拡大倍率、アップスケーラー、denoising strengthです。拡大倍率は1.5倍から2倍程度が扱いやすく、denoising strengthは一般的に0.3から0.6前後で調整されることが多いです。ただし、これはあくまで目安です。モデルや絵柄、生成目的によって適切な値は変わります。

denoising strengthを強くしすぎると、拡大時に元画像から大きく変化してしまい、顔や手の形が崩れることがあります。逆に弱すぎると、拡大はされても細部の描き込みが増えにくく、ぼやけた印象になることがあります。私の感覚では、まず0.4前後から試し、元絵の構図を保ちたいなら下げる、細部を描き足したいなら少し上げる、という調整が分かりやすいです。

おすすめの流れは、小さく生成してから拡大することです。まず512×768や768×512などで破綻の少ない構図を作り、良いシードが出たらHires.fixで高画質化する流れが安定しやすいです。

高画質化では、アップスケーラーの選択も重要です。アニメ調、写真調、リアル調で相性が異なるため、同じプロンプトでも複数のアップスケーラーを試して比較すると、崩れにくい設定を見つけやすくなります。アニメ系なら線がくっきりするタイプ、リアル系なら質感を自然に補うタイプを選ぶと失敗が少ないかと思います。

設定項目役割調整の考え方
拡大倍率画像を何倍にするかまずは1.5倍から2倍程度で試す
denoising strength拡大時にどれだけ描き直すか構図維持なら低め、描き込み重視なら高め
アップスケーラー拡大時の補間方法アニメ系とリアル系で比較する
Hires steps拡大後の再生成ステップ高すぎると時間がかかるためバランス重視

Hires.fixを使っても手や顔が崩れる場合は、Hires.fixだけで直そうとしないほうがいいです。全身画像の顔崩れならADetailer、ポーズ崩れならControlNet、手指の崩れなら手用のネガティブプロンプトや補正系LoRAを組み合わせると安定しやすくなります。ひとつの機能に全部を任せるより、それぞれの得意分野で補助するのがコツです。

embeddingで崩れを軽減

embeddingは、特定の傾向をプロンプトに反映しやすくする補助データです。Stable Diffusionの奇形防止では、EasyNegative、badhand系、DeepNegative系などのネガティブembeddingがよく使われます。長いネガティブプロンプトを毎回入力するのが面倒な人にとっては、かなり便利な仕組みです。

embeddingを導入すると、ネガティブプロンプト欄に特定の単語を入力するだけで、低品質や手指の崩れを抑える方向へ誘導できます。たとえばEasyNegativeを使う場合、ネガティブプロンプト欄にEasyNegativeと入力するだけで、低品質な出力を抑える方向に働くことがあります。もちろん、これだけで必ず完璧になるわけではありませんが、ベースの品質を整える補助としてはかなり使いやすいです。

embeddingの導入手順

使い方の基本は、配布されているembeddingファイルをStable Diffusion WebUIのembeddingsフォルダに入れ、WebUIを再起動して、ネガティブプロンプト欄にファイル名を入力する流れです。Textual Inversionの一覧から選択できる環境もあります。ファイル名がそのまま呼び出し名になることが多いので、名前を変更した場合は入力する単語も変わります。

embeddingは、学習されたモデルとの相性が強く出ます。SD1.5向けのembeddingをSDXLで使っても期待通りの効果が出ない場合があります。導入前に、配布ページの対応モデルや利用条件を確認してください。

また、embeddingを入れれば必ず手がきれいになるわけではありません。あくまで失敗傾向を抑える補助であり、画像サイズ、プロンプト、ControlNet、ADetailerなどと組み合わせて使うことで効果を感じやすくなります。特に手の崩れは、embeddingだけでは足りないことが多いです。手が大きく映る構図なら改善しやすいですが、全身画像の小さな手まで完璧に直すのは難しい場合があります。

embeddingの種類主な用途使うときの注意点
EasyNegative系低品質や崩れの軽減アニメ系モデルとの相性を確認する
badhand系手や指の崩れ軽減構図によって効果に差が出る
DeepNegative系全体の品質安定モデルによって絵柄が変わる場合がある
独自学習系特定の失敗傾向を抑える配布元の説明を必ず確認する

embeddingを複数入れる場合は、入れすぎに注意してください。似たような効果のembeddingを何個も重ねると、画像がのっぺりしたり、ディテールが弱くなったりすることがあります。まずは1つだけ入れて比較し、必要なら2つ目を追加する流れが安全です。比較するときは、同じシード、同じプロンプト、同じ設定でembeddingあり・なしを出してみると、効果が分かりやすいですよ。

LoRAで手足を補正

LoRAは、特定のキャラクターや画風を再現するために使われることが多い機能ですが、手足や人体の補正に役立つタイプもあります。Stable Diffusionの奇形防止では、手の描写を安定させるLoRA、線を整えるLoRA、ポーズや体型を補助するLoRAなどが候補になります。ここを使いこなせると、プロンプトだけでは届かなかった細かい調整がしやすくなります。

LoRAの強みは、モデル本体を変えずに特定の傾向を追加できることです。たとえば、手の描写を改善するためのLoRAを使えば、指の形や手首のつながりが安定する場合があります。ポーズ補助系のLoRAであれば、立ち姿や座り姿、アクションポーズなどを出しやすくなることもあります。

LoRAの重みは控えめに試す

LoRAを使うときは、重みの設定が重要です。重みが強すぎると、画風が変わりすぎたり、手足以外の部分に影響が出たりします。逆に弱すぎると、補正効果を感じにくくなります。まずは0.4から0.8前後を目安に試し、画像を見ながら微調整すると扱いやすいです。ただし、この数値も一般的な目安であり、LoRAごとに適正値は違います。

手足補正系LoRAを使う場合も、ネガティブプロンプトや画像サイズの調整は必要です。LoRAだけに頼るより、基本設定で破綻を減らし、最後の補助としてLoRAを加えるほうが安定します。特に、画像サイズが合っていない状態でLoRAを入れても、胴長や体の分裂はあまり改善しないことがあります。土台が崩れていると、補助機能も効きにくいんです。

LoRAは「最後の仕上げ」として使うと安定しやすいです。まず画像サイズ、プロンプト、Hires.fixで崩れを減らし、それでも残る手足の違和感に対して補正系LoRAを足す流れがおすすめです。

LoRAを複数使う場合は、相互作用にも注意が必要です。キャラクターLoRA、衣装LoRA、画風LoRA、手補正LoRAを同時に使うと、それぞれの特徴がぶつかって不自然な結果になることがあります。たとえば、キャラクターLoRAが特定のポーズや体型を強く持っている場合、手補正LoRAを加えても思ったように改善しないことがあります。

よくある問題原因対策
画風が変わりすぎるLoRAの重みが高い重みを0.1ずつ下げる
手足以外が崩れる複数LoRAの干渉LoRAを1つずつ検証する
効果が感じられないモデルとの相性が悪い対応モデルを確認する
同じ顔ばかりになるキャラLoRAが強いキャラLoRAの重みも下げる

LoRAやembeddingは便利ですが、配布元によってライセンスや商用利用条件が異なります。作品を公開・販売する場合は、正確な情報は公式サイトや配布ページをご確認ください。判断が難しい場合は、最終的な判断は専門家にご相談ください。特に商用案件で使う場合は、モデル本体、LoRA、embedding、VAE、素材の利用条件までまとめて確認しておくと安心です。

Stable Diffusionの奇形防止を強化

ここからは、基本設定だけでは解決しにくい崩れを減らすための応用テクニックを解説します。全身画像、複雑なポーズ、顔の小さな構図、背景込みの高解像度生成では、ControlNetやADetailer、分割生成を組み合わせることで安定度を上げやすくなります。少し設定項目は増えますが、使えるようになると生成の自由度がかなり上がりますよ。

ControlNetでポーズ指定

ControlNetは、ポーズ、線画、深度、エッジなどの条件を使って、画像生成を制御するための拡張機能です。Stable Diffusionの奇形防止では、特にOpenPoseを使ったポーズ指定が役立ちます。テキストだけで「自然なポーズ」「立っている女性」「片手を上げる」と指定しても、AIが思い通りの関節位置で描いてくれるとは限りません。そこで、骨格情報を使ってポーズの土台を作るわけです。

OpenPoseを使うと、人物の骨格や関節の位置を指定できるため、腕がありえない方向に曲がる、足の位置が不自然になる、体が分離するといった失敗を減らしやすくなります。複雑なポーズや全身構図を作るときほど、効果を感じやすいです。特に、踊っているポーズ、座っているポーズ、腕を交差するポーズなどは、プロンプトだけよりControlNetを使ったほうが安定しやすいかと思います。

ControlNetは、テキスト画像生成モデルにエッジ、深度、セグメンテーション、人間のポーズなどの条件制御を追加する仕組みとして提案されています。技術的な背景を確認したい場合は、原著論文であるarXiv掲載論文「Adding Conditional Control to Text-to-Image Diffusion Models」が一次情報源として参考になります。

ControlNetで防ぎやすい崩れ

ControlNetで防ぎやすいのは、人体全体の大きな破綻です。たとえば、右腕がどこから出ているか分からない、脚の位置が左右で入れ替わる、ポーズが指定と違う、人物が複数に分裂する、といった失敗を減らしやすくなります。一方で、指の一本一本や細かい顔の造形までは、ControlNetだけで完全に制御できるわけではありません。

つまり、ControlNetはポーズの大枠を安定させるための機能です。手指の細部は、ネガティブプロンプト、Hires.fix、ADetailer、手補正系LoRAなどと組み合わせて調整する必要があります。この役割分担を理解しておくと、「ControlNetを入れたのに指が崩れる」と焦らずに済みます。

ControlNetは、人体の大きな破綻を減らすための土台作りに向いています。特に全身画像や動きのあるポーズでは、プロンプトだけで制御するより安定しやすくなります。

ControlNetを使う際は、制御の強さを上げすぎないことも大切です。強すぎると構図は固定されますが、絵としての自然さが失われる場合があります。逆に弱すぎると、ポーズ指定が効かず、通常生成に近い結果になります。まずは中程度の強さから試し、ポーズが崩れる場合だけ少しずつ上げると調整しやすいです。

ControlNetの用途向いている場面注意点
OpenPose人物のポーズ指定指先までは安定しにくい
Canny輪郭や構図の維持線が強すぎると硬い絵になる
Depth奥行きのある構図細部の形状までは固定しにくい
Lineart線画から生成元線画の品質に左右される

ポーズを安定させたいなら、まずはOpenPoseだけで試すのがおすすめです。複数のControlNetを同時に使うと強力ですが、設定が複雑になり、どの条件が効いているのか分かりにくくなります。最初は1つずつ使い、慣れてきたらDepthやCannyを組み合わせて、構図や奥行きを補強していくといいですよ。

分割生成で全身を安定

分割生成は、高解像度画像を小さな領域に分けて処理する考え方です。Tiled DiffusionやMultiDiffusionのような拡張機能を使うことで、VRAMの負担を抑えつつ、細部まで描き込みやすくなります。全身画像や背景込みの大きなイラストを作りたい人にとっては、かなり心強い方法です。

全身画像では、顔や手が画面内で小さくなりやすく、通常生成だけでは細部が崩れやすくなります。分割生成を使うと、画像の各領域に対して描き込みを補いやすくなるため、背景や衣装の情報量を上げながら、全体の破綻を抑えやすくなります。特に、広い背景の中に人物を配置したい場合や、細かい衣装デザインを出したい場合に向いています。

分割生成が役立つケース

分割生成が役立つのは、通常のHires.fixだけでは細部が足りないときです。たとえば、全身のキャラクターを高解像度で出したい、背景の建物や小物まで描き込みたい、横長のイラストで人物と背景を両立したい、といったケースですね。通常生成では一部がぼやけたり、顔だけ崩れたりする場合でも、分割生成を使うことで改善することがあります。

ただし、分割生成は設定を誤ると、部分ごとの質感がずれたり、境界が不自然になったりすることがあります。特に人物の顔や手がタイルの境界にかかると違和感が出る場合があるため、構図や拡大倍率を見ながら調整することが大切です。ここは少し慣れが必要です。

分割生成は上級者向けの設定です。うまく使えば強力ですが、初期設定のままでは意図しない結果になる場合もあります。まずはHires.fixで安定した画像を作り、その次の段階として試すのがおすすめです。

分割生成を使うときは、最初から複雑な設定にしすぎないことが大切です。まずは小さめのタイルサイズと控えめな拡大率で試し、境界の違和感が出ないか確認します。うまくいったら、少しずつ拡大率を上げたり、タイルの重なりを調整したりして、目的の解像度に近づけます。

確認ポイント見るべき症状調整の方向性
タイル境界線や質感がつながらない重なり幅を増やす
人物の顔顔が別人になるADetailerと併用する
手や指小さく崩れる手用補正や高解像度化を使う
背景細部が増えすぎてうるさいdenoiseやプロンプトを弱める

分割生成は、奇形防止そのものというより「高解像度化したときの破綻を抑えるための補助」と考えると分かりやすいです。人体構造の土台はControlNetや画像サイズで整え、顔や手の補正はADetailerで行い、全体の高解像度化に分割生成を使う。この組み合わせが、全身画像を安定させるうえではかなり実用的です。

顔崩れにはADetailer

ADetailerは、生成後の画像から顔や手などのパーツを検出し、その部分を自動的に補正する拡張機能です。全身画像で顔が小さくなって崩れる場合や、手の形が不自然になる場合に役立ちます。全身構図はかっこいいのに、顔だけ潰れてしまうこと、ありますよね。そういうときにかなり便利です。

Stable Diffusionでは、バストアップの画像なら顔がきれいに出ても、全身画像になると顔の描写に使えるピクセル数が減り、目や口が崩れることがあります。ADetailerは、そうした小さな顔を検出して再描画することで、完成度を上げやすくします。顔だけでなく、手を検出して補正できるモデルもあります。

ADetailerで調整するポイント

使うときは、顔用モデルと手用モデルを目的に応じて選びます。顔だけを直したいのか、手も直したいのかによって設定が変わります。再描画の強さが高すぎると、元の顔つきや表情が変わる場合があるため、少しずつ調整するのが安全です。顔を保ちたい場合はdenoisingを控えめにし、顔の崩れが大きい場合は少し強めにする、という考え方が使いやすいです。

ADetailerを使うときは、専用のプロンプトを入れることもできます。たとえば顔補正ならbeautiful face、detailed eyes、symmetrical eyesなどを追加し、ネガティブ側にbad face、deformed eyes、ugly faceなどを入れます。手補正ならdetailed hands、natural handsを入れ、ネガティブ側にbad hands、extra fingers、missing fingersを入れるといった形です。

画像修正におけるネガティブプロンプトや補正の考え方は、Stable Diffusionのモザイク除去の仕組みと限界でも関連して解説しています。修正系の考え方を知っておくと、ADetailerの調整にも応用しやすくなります。

ADetailerは便利ですが、検出対象がうまく認識されない場合もあります。横顔、後ろ姿、手が隠れている構図、極端に小さい人物では、補正が効きにくいことがあります。

ADetailerで注意したいのは、補正後に顔だけ質感が浮くことです。顔だけ描き込みが強くなりすぎると、体や背景と馴染まない場合があります。その場合は、再描画の強さを下げる、顔用プロンプトを控えめにする、Hires.fixの段階である程度顔を整えておく、といった調整が必要です。

悩みADetailerでの対策追加で見る設定
全身画像の顔が潰れる顔検出モデルで再描画Hires.fixのdenoise
目が左右でずれる顔用プロンプトを追加deformed eyesをネガティブに入れる
手が小さく崩れる手検出モデルを試す手が見える構図にする
顔だけ別人になる再描画を弱める顔用プロンプトを減らす

ADetailerは、全身画像を作る人ほど恩恵を感じやすい機能です。ただし、元画像の構図が大きく破綻している場合は、ADetailerだけでは直しきれません。まず画像サイズやControlNetで体の構造を安定させ、そのうえで顔や手の細部をADetailerで補正する。この順番を意識すると、かなり使いやすくなりますよ。

おすすめプロンプト一覧

ここでは、Stable Diffusionの奇形防止で使いやすいプロンプトを目的別に整理します。コピペで使えますが、すべてを毎回入れる必要はありません。まずは基本セットを入れ、崩れた部分に合わせて追加するのが実践的です。ここを整理しておくと、失敗したときに「どの単語を足せばよさそうか」が見えやすくなります。

目的ネガティブプロンプト例
品質低下を防ぐworst quality, low quality, normal quality, lowres, blurry, jpeg artifacts
人体の崩れを防ぐbad anatomy, bad body, deformed, distorted, mutation, extra limbs
手指の崩れを防ぐbad hands, extra fingers, missing fingers, fewer digits, fused fingers
腕や足の崩れを防ぐextra arms, missing arms, extra legs, missing leg, split legs, bad legs
不要な文字を防ぐtext, watermark, signature, logo, username
構図の欠けを防ぐcropped, out of frame, bad composition, split view, grid view

ポジティブプロンプト側では、masterpiece、best quality、ultra detailed、anatomically correct、well-proportioned、natural poseなどが使いやすいです。ただし、ポジティブ側も盛りすぎると、AIが何を優先すべきか迷いやすくなります。高品質タグを入れすぎれば必ず良くなるわけではないので、目的に合う単語を選ぶことが大切です。

用途別にプロンプトを組む

私がよく使う考え方は、ポジティブプロンプトで「どう描いてほしいか」を明確にし、ネガティブプロンプトで「避けたい失敗」を絞ることです。たとえば、自然な立ち姿を作りたいなら、natural standing pose、well-proportioned bodyなどを入れ、ネガティブ側でbad anatomyやextra legsを補う流れです。手を見せたいなら、detailed handsやnatural handsを追加し、ネガティブ側にbad handsやextra fingersを入れます。

全身画像なら、full body、standing、solo、whole bodyなどを使います。ただし、full bodyを入れると顔や手が小さくなりやすいので、Hires.fixやADetailerとセットで考えるのがおすすめです。顔アップならportrait、close-up、detailed faceなどを使い、手の崩れが気になる場合はhands out of frameを入れて、そもそも手を出さない構図にするのも手です。

プロンプト例は、すべてのモデルで同じ効果を保証するものではありません。生成結果はモデル、サンプラー、CFG Scale、Step数、シード、LoRA、解像度によって変わります。数値や単語はあくまで一般的な目安として調整してください。

作りたい画像ポジティブ例ネガティブ例
自然な全身full body, natural pose, well-proportioned bodybad anatomy, long body, extra legs
きれいな手detailed hands, natural hands, five fingersbad hands, extra fingers, missing fingers
顔アップportrait, close-up, detailed facebad face, deformed eyes, asymmetrical eyes
文字なし画像clean background, simple compositiontext, watermark, signature, logo

プロンプトを保存しておくことも重要です。うまくいったプロンプト、崩れたプロンプト、改善したプロンプトをメモしておくと、自分の環境に合うパターンが見えてきます。Stable Diffusionはモデルや設定によって結果が大きく変わるので、ネット上のテンプレートをそのまま使うより、自分の環境に合わせて育てていく感覚が大切ですよ。

設定ミスで起きる失敗例

Stable Diffusionの奇形防止では、プロンプトだけでなく設定ミスも大きな原因になります。よくあるのは、画像サイズが大きすぎる、Hires.fixのdenoising strengthが強すぎる、LoRAを重ねすぎる、ネガティブプロンプトを入れすぎる、CFG Scaleが高すぎるといったケースです。ここを見直すだけで、かなり改善することがあります。

画像サイズが大きすぎると、胴長や体の分裂が起きやすくなります。Hires.fixの再描画が強すぎると、元の構図から離れて顔や手が崩れることがあります。LoRAを複数使う場合は、それぞれの影響が重なって、画風や人体構造が不安定になることもあります。

CFG Scaleを高くしすぎると、プロンプトへの従い方は強くなりますが、画像が硬くなったり、ディテールが破綻したりする場合があります。反対に低すぎると、プロンプトの意図が弱くなり、狙った構図になりにくくなります。どちらが良いというより、モデルと目的に合わせてバランスを見る必要があります。

一度に複数の設定を変えない

調整するときは、一度に複数の設定を変えないことが重要です。画像サイズ、ネガティブプロンプト、LoRA、Hires.fixを同時に変えると、何が改善に効いたのか分からなくなります。ひとつずつ変更し、良い結果が出た設定を保存していくと、再現性が高まります。ここ、地味ですがかなり大事です。

失敗例原因として多い設定見直すポイント
胴体が長い初期解像度が大きすぎるモデルの推奨サイズに近づける
手が溶ける手が小さい、補正不足ADetailerや手用プロンプトを試す
顔が崩れる全身構図で顔が小さいADetailerやHires.fixを使う
体が分裂する高解像度を直接生成小さく生成してから拡大する
画風が崩れるLoRAの重みが強い重みを下げて比較する
文字が入る学習データの影響text, watermark, signatureを追加する

シードの固定も重要です。シードを固定せずに設定を変えると、設定の効果なのか、偶然よい画像が出ただけなのか判断しにくくなります。検証するときは、同じシード、同じプロンプト、同じモデルで、1項目だけ変えて比較してください。これだけで調整の精度が上がります。

原因を切り分けるコツは、比較条件をそろえることです。シードを固定し、変更する設定を1つだけにすると、どの設定が奇形防止に効いたのか分かりやすくなります。

また、モデル変更も大きな要因です。あるモデルではきれいに出るプロンプトが、別のモデルでは崩れることがあります。リアル系、アニメ系、2.5D系、SDXL系では得意な構図や表現が違います。プロンプトを調整しても改善しない場合は、モデル自体を変えるのも有効です。生成AIでは、設定だけでなく「どのモデルを使うか」も品質に直結します。

最終的には、失敗した画像を見て原因を推測する力が大切です。手だけが崩れるなら手指対策、体全体が伸びるなら画像サイズ、ポーズが崩れるならControlNet、顔だけ潰れるならADetailer、といったように、症状ごとに対策を分けて考えると迷いにくいですよ。

Stable Diffusionの奇形防止まとめ

Stable Diffusionの奇形防止で大切なのは、ひとつの魔法のプロンプトに頼るのではなく、原因ごとに対策を組み合わせることです。手や指の崩れにはネガティブプロンプトやADetailer、胴長には画像サイズとHires.fix、複雑なポーズにはControlNet、全身画像の細部には分割生成や補正系LoRAが役立ちます。

まずは、モデルに合った画像サイズで生成し、品質系と人体構造系のネガティブプロンプトを最低限入れます。そのうえで、手が崩れるなら手指向けの単語やembedding、顔が崩れるならADetailer、ポーズが不安定ならControlNetという順番で追加していくと、失敗原因を見つけやすくなります。最初から全部を入れるのではなく、必要なものを順番に足していくのがポイントです。

Stable Diffusionの奇形防止は、設定の積み重ねです。ネガティブプロンプト、画像サイズ、Hires.fix、embedding、LoRA、ControlNet、ADetailerを目的に応じて組み合わせることで、破綻の少ない画像に近づけます。

この記事で紹介した内容を実践するなら、まずは「基本セット」を作っておくと楽です。たとえば、品質低下を防ぐネガティブプロンプト、人体崩れを防ぐネガティブプロンプト、モデルに合った初期画像サイズ、Hires.fixの控えめな設定、この4つを自分の環境に合わせて保存しておきます。そこから、手が崩れるなら手用プロンプト、顔が崩れるならADetailer、ポーズが崩れるならControlNetを追加していくと、毎回ゼロから悩まずに済みます。

優先順位見直す項目目的
最初画像サイズ胴長や体の分裂を減らす
ネガティブプロンプト手足や品質の崩れを抑える
Hires.fix構図を保ちながら高画質化する
必要時embeddingやLoRA苦手な崩れを補助する
応用ControlNetやADetailerポーズや顔の安定度を上げる

一方で、どの方法も完全に奇形を防ぐものではありません。モデルの仕様、学習データ、生成環境、ライセンス、利用規約によって適切な設定は変わります。正確な情報は公式サイトをご確認ください。また、商用利用、権利関係、安全性、法律面で不安がある場合は、最終的な判断は専門家にご相談ください。

最初から完璧を狙う必要はありません。まずは基本のネガティブプロンプトと画像サイズを整え、良いシードを見つけ、必要に応じて補助機能を足していく。この流れを守るだけでも、Stable Diffusionの奇形防止はかなり扱いやすくなります。何度も失敗しながら、自分のモデルと環境に合う設定を育てていく感覚で取り組むと、生成結果は確実に安定していきますよ。

AIで稼ぐなら今がチャンス!
この記事を書いた人

国立大学を卒業後、2022年から2025年まで地方自治体(市役所)で勤務。
行政現場での実務を通じて、「テクノロジーが人の生活を支える力」に関心を持つ。
現在はフリーライターとして、生成AI・テクノロジー・働き方・キャリアを中心に執筆中。

「専門知識をやさしく、実生活に落とし込む」
をテーマに、公的データや一次情報をもとにした記事制作を心がけています。

renをフォローする
Stable Diffusion
スポンサーリンク
renをフォローする
タイトルとURLをコピーしました