PR

Stable Diffusionで複数キャラの作り方完全ガイド

Stable Diffusion
記事内に広告が含まれています。

Stable Diffusionの複数キャラ生成ガイド

Stable Diffusionで複数キャラを生成しようとすると、二人の描き分けができない、3人以上で顔や服が混ざる、同じ顔になる、手足が崩れる、指定した人数にならないといった悩みが出やすいです。うん、ここは多くの人がつまずくポイントです。

特に、複数人プロンプト、Regional Prompter、Latent Couple、ControlNet、OpenPose、LoRA、BREAK、inpaint、4人以上の集合絵といった関連機能は、名前だけ見ると難しく感じるかもしれません。しかし、役割を整理すれば、どの場面で何を使えばよいかはかなり明確になります。

この記事では、Stable Diffusion複数キャラの基本から、プロンプトだけでできること、拡張機能を使うべき場面、属性混線や欠損を減らす考え方まで、初めてのあなたにも実践しやすい流れで解説します。

この記事のポイント
  • 複数キャラ生成で失敗しやすい原因
  • 二人や3人以上を描き分ける考え方
  • Regional PrompterやLatent Coupleの使い分け
  • LoRAやinpaintで仕上げる実践手順
AIで収入UPを実現可能!

Stable Diffusion複数キャラの基本

Stable Diffusionで複数キャラを扱うときは、まずプロンプトだけで対応できる範囲と、拡張機能を使った方がよい範囲を分けて考えることが大切です。人数指定、構図、キャラごとの特徴、ネガティブプロンプト、画像サイズを整理するだけでも成功率は上がりますが、複数人になるほど属性の混線や融合が起きやすくなります。

この章では、複数人プロンプトの基本、二人の描き分け、3人以上で崩れる理由、4人以上を安定させる考え方、同じ顔になる問題、LoRAの使い方まで、土台になる部分を順番に整理します。まずは「なぜ失敗するのか」を押さえてから、実践的な対策へ進んでいきましょう。

複数人プロンプトの考え方

Stable Diffusionで複数キャラを出す最初の方法は、人数を明確に指定することです。アニメ系やDanbooru系タグに強いモデルでは、2girls、3girls、multiple girls、two people、two characters、1boy and 1girlのような人数タグや関係性タグが効きやすい場合があります。ここ、まず試したくなりますよね。実際、二人や三人くらいまでなら、プロンプトだけでそれらしい構図になるケースも多いです。

ただし、人数タグを入れれば必ず指定通りになるわけではありません。Stable Diffusionは、文章の意味を厳密な命令として処理するというより、学習済みの画像傾向から「それらしい画像」を作る仕組みです。そのため、2人と指定しても1人だけになったり、3人と指定しても顔や体が融合したり、4人と指定したのに5人以上のように見えたりすることがあります。

特に複数キャラ生成では、人数、髪型、服装、ポーズ、背景、小物、画風、品質タグを一度に盛り込みすぎると、情報が競合しやすくなります。たとえば「3girls, school uniform, different hair colors, full body, detailed background, holding books, dynamic pose」のように詰め込むと、モデルは人数、全身、手の動き、背景、服装を同時に処理する必要があります。すると、どこかの情報が弱くなったり、別キャラの属性が混ざったりしやすいです。

最初に決めるべき優先順位

複数人プロンプトでは、最初から完璧な完成形を狙うより、優先順位を決めることが大切です。まず人数を安定させたいのか、二人の描き分けを優先したいのか、ポーズを優先したいのかで、書くべきプロンプトは変わります。人数が最優先なら、背景や小物は控えめにして、2girlsや3girls、standing side by sideなどのシンプルな指定から始める方が安定しやすいです。

基本は、人数、構図、キャラ特徴、背景の順に整理することです。最初から長い呪文を作るより、まずは人数と配置を安定させ、その後に髪色や服装を足す方が失敗を切り分けやすくなります。

たとえば、二人を横並びで出したい場合は、いきなり細かい服装まで入れるより、2girls, standing side by side, simple backgroundのように、人数と構図を優先して確認します。そこから、左側は黒髪、右側は金髪、片方は制服、もう片方は私服というように情報を追加していくと、どの段階で崩れたかが分かりやすくなります。

また、ネガティブプロンプトにsoloや1girlを入れると、単独人物に寄る失敗を減らせる場合があります。ただし、強く入れすぎると構図全体が不自然になったり、余計な人物の一部だけが出たりすることもあります。あくまで一般的な目安として、生成結果を見ながら強度や語句を調整してください。

目的使いやすいプロンプト例注意点
二人を出す2girls, two people, duo顔や服が似やすい
男女を出す1boy and 1girl, man and womanカップル構図に寄りやすい
三人を出す3girls, three characters手足や顔が崩れやすい
集合感を出すgroup of friends, multiple people人数の正確性は落ちやすい

複数人プロンプトは、正解の一文を探すというより、生成結果を見ながら調整するものです。最初は短く、少しずつ足す。この流れを守るだけでも、Stable Diffusion複数キャラの失敗はかなり減らせますよ。

二人を描き分けるコツ

二人を描き分けるときに重要なのは、キャラごとの違いを一目で分かる特徴として設定することです。髪色、髪型、服の色、立ち位置、表情、年齢感、体格、雰囲気などを明確に分けると、モデルが二人を別キャラとして認識しやすくなります。ここを曖昧にすると、せっかく二人出ても同じ顔、同じ服、同じ髪型になりやすいです。

たとえば、片方をblack short hair, school uniform、もう片方をblonde long hair, sweaterのように指定すると、髪型と服装の両方で差が出ます。逆に、どちらもlong hair、どちらもdress、どちらもsmile、どちらもblue eyesのように共通点が多いと、モデルは二人を別キャラとして分離しにくくなります。結果として、顔や衣装が似たり、片方の特徴がもう片方に移ったりします。

プロンプトだけで二人を描き分ける場合は、左右や前後の位置も入れると安定しやすくなります。left side, right side、on the left, on the right、back-to-back、face-to-faceなどの構図指定は、キャラの役割を分ける助けになります。特に、左側キャラと右側キャラで髪色や服装を変える場合は、位置指定と特徴指定をセットで使うのがおすすめです。

二人生成で混ざりやすい要素

二人生成で特に混ざりやすいのは、髪色、服装、アクセサリー、眼鏡、表情です。たとえば、一人だけ眼鏡をかけさせたいのに二人とも眼鏡になる、一人だけ赤い服にしたいのに両方が赤系になる、といったケースはかなりあります。これは、プロンプト内の属性が画面全体に影響しやすいためです。

このような場合は、単に「girl with glasses」と書くのではなく、位置と一緒に指定します。たとえば、girl on the left, black hair, glassesgirl on the right, blonde hair, no glassesのように分けます。それでも混ざる場合は、Regional PrompterやLatent Coupleを使って、領域ごとにプロンプトを分けた方が安定します。

さらに詳しく二人生成の手順を知りたい場合は、掲載サイト内のStable Diffusionで2人の描き分け完全ガイドも参考になります。二人の距離感やControlNetの使い方を整理したいときに役立ちます。

二人生成では、顔の違いだけで描き分けようとするより、髪色、服装、立ち位置をセットで変える方が安定しやすいです。顔だけを変えようとすると、モデルやLoRAの影響で似た雰囲気に寄ることがあります。

また、二人の関係性を表す言葉にも注意が必要です。coupleやromanticを入れると、男女が近づきすぎたり、抱き合う構図に寄ったりすることがあります。友人同士や並んで立つだけの構図にしたいなら、friends, standing apart, side by side, normal distanceなど、距離感が分かる言葉を追加するとよいです。

最後に、二人を描き分けたいときほど、最初は背景をシンプルにしてください。背景が細かいほど、人物の輪郭や服装の描写に使える余力が減りやすいです。まずは白背景や教室、街中など分かりやすい背景で二人の分離を確認し、その後に背景の情報量を増やすと失敗しにくいですよ。

3人以上で崩れる原因

Stable Diffusionで3人以上を生成すると、二人のときよりも急に難易度が上がります。理由は単純で、画面内に必要な情報量が増えるからです。人物が増えるほど、顔、手、服、髪、ポーズ、重なり、背景との境界を同時に処理する必要があり、結果として融合や欠損が起こりやすくなります。ここ、二人まではうまくいったのに三人で急に崩れるので、かなり気になりますよね。

よくある失敗には、顔が同じになる、腕が余る、手がつながる、服の色が混ざる、指定した人数より多くなる、1人が背景に溶ける、中央の人物だけ極端に崩れる、奥の人物の顔が雑になるといったものがあります。これはプロンプトが悪いというより、複数物体や複数属性の整合性を保つことが画像生成モデルにとって難しいためです。

3人以上で崩れやすい原因のひとつは、人物同士の距離が近すぎることです。肩や腕が重なると、モデルはどの腕がどの人物のものかを判断しにくくなります。その結果、手足の融合、余分な指、服の境界の崩れが起こりやすくなります。複数キャラを安定させたいなら、最初はstanding apartやevenly spacedのように、人物同士に距離を取らせる指定が有効です。

構図と画像サイズの影響

3人以上で安定させたい場合は、まず画像サイズと構図を見直します。正方形の小さな画像に3人を詰め込むと、顔や手の描写に使える領域が少なくなります。横並びの集合絵なら横長、縦方向に配置したいなら縦長など、構図に合わせてキャンバスを選ぶとよいです。もちろん数値は環境によって変わるので、あくまで一般的な目安として考えてください。

また、full bodyを入れると全身が入りやすくなる一方で、顔が小さくなって崩れやすくなることがあります。逆にupper bodyやcowboy shotにすると、顔や服装は安定しやすいですが、全身構図ではなくなります。つまり、3人以上では「全身をきれいに出す」「顔を細かく描く」「全員を別キャラにする」をすべて同時に満たすのが難しくなります。どれを優先するか決めるのが大切です。

3人以上はプロンプトだけで完全制御しようとしない方が現実的です。最初から一発完成を狙うより、構図を固定し、生成後にinpaintで崩れた部分を直す流れを前提にすると作業が安定します。

また、3人をそれぞれ別キャラとして扱いたい場合は、Regional PrompterやLatent Coupleのような領域分割系の拡張機能を検討します。画面を左、中央、右に分け、それぞれに異なるプロンプトを割り当てることで、属性混線を減らしやすくなります。ただし、領域分割を使っても、人物同士が近すぎると境界部分で混ざることはあります。

崩れ方主な原因対策
顔が同じ特徴差が少ない髪型や服装を大きく変える
手足が融合人物同士が近い距離を取る構図にする
人数が増減人数指定が弱い構図を単純化する
中央だけ崩れる情報が集中している分割比率や配置を見直す

3人以上の生成は、最初から細かい個性を全部入れるより、まず「3人がきちんと存在している画像」を作ることを優先するとよいです。その後、顔、服、手、背景を段階的に整える方が、結果的に早く完成に近づきます。

4人以上を安定させる方法

4人以上の複数キャラを生成する場合、プロンプトに4girls、5girls、group of friends、multiple girls、crowd、team photoなどを入れるだけでも出ることはあります。ただし、人数を正確に守る力はモデルや設定に強く左右されます。4人と指定しても5人以上になったり、逆に3人だけになったり、顔だけ増えて体が足りないような結果になることも珍しくありません。ここは、かなりモデル依存が強い部分です。

4人以上を安定させるには、まず構図をシンプルにします。横一列、集合写真風、全員が正面を向く、背景は控えめにするなど、モデルが理解しやすい構図に寄せることが大切です。複雑なポーズや全員別々の動作を指定すると、人数制御よりもポーズ再現に処理が取られて崩れやすくなります。

たとえば、4人をそれぞれ別のポーズにしたい場合でも、最初から「走る人、座る人、本を読む人、手を振る人」のようにバラバラに指定すると失敗しやすいです。まずは4人が並んで立つ構図を安定させ、その後に一部のポーズだけを変える方が扱いやすいです。複数キャラは、情報を一気に足すほど崩れやすいと考えてください。

4人以上では横長構図が有利

次に、画像サイズを広めに設定します。横並びの集合絵では横長の比率にすると、各キャラの顔や体に必要なスペースを確保しやすくなります。数値は環境やモデルによって変わるため、あくまで一般的な目安ですが、最初は無理に高解像度へ上げるより、生成が安定するサイズを探す方が重要です。

高解像度にすれば必ず良くなるわけではありません。VRAMが足りない環境で無理にサイズを上げると、生成が遅くなったり、エラーが出たり、逆に構図が散らかったりする場合があります。まずは扱いやすいサイズで構図を固め、必要に応じてHires.fixやアップスケール、inpaintで補う流れが現実的です。

特化LoRAやLyCORISを使う方法もあります。複数人や集合絵に寄せた学習モデルを補助的に使うことで、成功率が上がる場合があります。ただし、4人以上には必ずLoRAが必要というわけではありません。Regional Prompter、ControlNet、OpenPose、inpaintの組み合わせでも十分に対応できるケースがあります。

4人以上の安定化は、プロンプト単体ではなくワークフローで考えるのがコツです。人数タグで大枠を作り、横長構図でスペースを確保し、必要に応じて領域分割やinpaintで仕上げる流れがおすすめです。

また、4人以上ではキャラ全員を完全に別個性にしようとすると難易度が一気に上がります。髪色を4種類に分け、服装も4種類に分け、ポーズも4種類に分けると、属性混線が起きやすくなります。最初は「髪色だけ違う」「服の色だけ違う」など、差分を1〜2種類に絞ると成功率が上がりやすいです。

集合絵では、全員の顔を完璧に出すより、作品として見たときの雰囲気や配置を優先する判断も必要です。細部が崩れた部分はinpaintやADetailerで直し、全体の構図が良い画像をベースに育てる方が、ランダム生成を繰り返すより効率的ですよ。

同じ顔になる時の対策

Stable Diffusionで複数キャラを生成すると、全員が同じ顔になることがあります。これは、同じモデル、同じ画風、同じ品質タグ、同じ顔立ちの評価語を使っているため、人物の顔が平均化されやすいからです。特に美少女系モデルでは、モデルが得意とする顔に寄る傾向が強く出ることがあります。うん、せっかく複数キャラを出したのに全員同じ顔だと、かなり残念ですよね。

対策としては、顔の特徴を分けるより先に、髪型や服装、年齢感、雰囲気を変えるのが有効です。short hairとlong hair、calm expressionとcheerful smile、school uniformとcasual clothes、tall girlとpetite girlのように、顔以外の差を作ることで、結果的に顔の印象も分かれやすくなります。

顔のバリエーションを増やしたい場合は、different face、different hairstyle、different outfits、varied facial featuresなどの指定が役立つこともあります。ただし、強く入れすぎると品質が落ちたり、意図しない顔つきになったりする場合もあるため、生成結果を見ながら調整します。

LoRAとモデルの顔癖を理解する

同じ顔になる原因として、LoRAやモデルの顔癖も大きいです。特定キャラLoRAや特定画風LoRAを強く使うと、画面内の人物全員がそのLoRAの特徴に引っ張られる場合があります。一人だけに効かせたいつもりでも、通常のプロンプト欄に入れるだけでは画面全体に影響しやすいです。

そのため、複数キャラでLoRAを使うときは、強度を下げる、領域分割と組み合わせる、キャラごとの特徴を強く分ける、といった工夫が必要です。たとえば、一人は黒髪ショート、もう一人は金髪ロングのように髪型を明確に変えるだけでも、顔の印象が分かれやすくなります。

同じ顔対策の基本は、顔だけでなく全体のキャラ設計を変えることです。髪型、服装、立ち位置、表情、体格を分けると、モデルが別キャラとして処理しやすくなります。

顔や手足の崩れも同時に気になる場合は、掲載サイト内のStable Diffusionの奇形防止で手足崩れを直す解説もあわせて確認すると、ネガティブプロンプトやADetailer、ControlNetの使い分けを整理しやすくなります。

また、顔だけを直す場合は、最初から全体を再生成するより、ADetailerやinpaintで顔部分を修正する方が効率的です。全体の構図が良いのに顔が似ているだけなら、顔部分だけを修正した方が、服装やポーズを崩さずに改善できます。複数キャラ生成では「構図が良い画像を捨てない」ことも大切ですよ。

同じ顔問題は、プロンプトだけで完全に消すのが難しい場合があります。特にキャラLoRAを複数使う場合は、領域分割、LoRA強度、inpaintを組み合わせて少しずつ調整するのが現実的です。

LoRAで属性混線を防ぐ

LoRAは、特定のキャラ、画風、衣装、ポーズなどを追加で反映させるために使われます。複数キャラ生成では、キャラごとの特徴を強める目的でLoRAを使うことがありますが、同時に属性混線の原因にもなります。たとえば、Aキャラの髪色がBキャラに移る、Bキャラの服装がAキャラに混ざる、全員が同じ表情になる、といった現象です。

この問題を避けるには、LoRAの強度を控えめにすることが大切です。強度を上げるほどキャラ再現性は高まりやすい一方、画面全体に影響して他のキャラまで引っ張られる場合があります。一般的には0.4から0.8前後で試されることが多いですが、これはあくまで目安であり、モデルやLoRAの学習内容によって最適値は変わります。

たとえば、キャラAのLoRAを1.0で入れると、キャラAの特徴は強く出るかもしれません。しかし、同じ画面内のキャラBやキャラCにも髪型、目、服装、顔つきが移ることがあります。複数キャラでLoRAを使う場合は、まず0.4や0.5程度から試し、足りなければ少しずつ上げる方が安全です。

LoRAは領域分割と組み合わせる

LoRAを使う場合は、Regional PrompterのLatent系設定など、領域ごとに影響を分けやすい方法と組み合わせると扱いやすくなります。プロンプト欄に複数のLoRAを並べるだけでは、どのLoRAがどのキャラに効くかを完全に制御するのは難しいためです。

たとえば、左側にキャラA、右側にキャラBを出したい場合、単純にAのLoRAとBのLoRAを同時に入れると、両方の特徴が混ざることがあります。そこで、領域ごとにプロンプトを分け、左領域にAの特徴、右領域にBの特徴を置くと、混線を減らしやすくなります。それでも完全ではないため、最終的にはinpaintで微調整する前提で考えるとよいです。

LoRAやモデルには利用規約やライセンスがあります。商用利用、二次創作、実在人物に似た出力などは注意が必要です。正確な情報は公式サイトをご確認ください。また、権利や契約に関わる用途では、最終的な判断は専門家にご相談ください

また、LoRAを使うほどプロンプト全体の力関係が複雑になります。品質タグ、画風タグ、キャラLoRA、衣装LoRA、ポーズLoRAを同時に使うと、どの要素が原因で崩れているのか分かりにくくなります。複数キャラ生成では、まずLoRAなしで構図を安定させ、次に1つずつLoRAを追加して検証する流れがおすすめです。

LoRA使用時の症状起きやすい原因調整の方向性
全員が同じ顔になるキャラLoRAが強すぎる強度を下げる
服装が混ざる衣装LoRAが全体に効く領域分割を使う
画風が崩れるLoRA同士が競合する同時使用数を減らす
指定キャラが出ない強度が弱い少しずつ強度を上げる

LoRAは便利ですが、複数キャラ生成では「強くすれば良くなる」ものではありません。むしろ、控えめに使いながら、プロンプト、領域分割、修正工程で補う方が安定しやすいです。

Stable Diffusion複数キャラの実践

ここからは、Stable Diffusionで複数キャラをより安定して生成するための実践的な方法を解説します。プロンプトだけでは限界がある場面でも、Regional Prompter、Latent Couple、BREAK、ControlNet、OpenPose、inpaintを組み合わせることで、キャラごとの描き分けや構図の安定性を高めやすくなります。

大切なのは、すべての機能を一度に使うことではありません。構図を固定したいのか、左右でキャラを分けたいのか、崩れた顔や手を直したいのかによって、使う機能を選ぶことです。ここからは、実際の作業で使いやすい順に整理していきます。

Regional Prompterの使い方

Regional Prompterは、画面を複数の領域に分け、それぞれに別のプロンプトを適用できる拡張機能です。Stable Diffusionで複数キャラを描き分けたい場合、かなり実用性の高い方法です。左側に黒髪キャラ、中央に赤髪キャラ、右側に金髪キャラといったように、領域ごとに特徴を指定できます。

基本的な考え方は、画面をColumnsやRowsで分割し、それぞれの領域にプロンプトを割り当てることです。Columnsは横方向の分割、Rowsは縦方向の分割に使います。たとえば、3人を横に並べたいならColumnsで1,1,1のように分けると、左、中央、右の3領域を作れます。

プロンプトは、全体に共通する情報と、各領域に入れる情報を分けて書きます。全体には品質、背景、画風などを入れ、各領域にはキャラごとの髪色、服装、表情などを入れます。こうすることで、背景や画風は統一しつつ、キャラの特徴だけを分けやすくなります。

Regional Prompterの基本設定

Regional Prompterを使うときは、まずActiveをオンにし、Use common promptやUse base promptにあたる共通プロンプト設定を確認します。共通プロンプトを使うと、最初の行に書いた品質タグや背景指定を全領域に反映できます。これにより、キャラごとの指定は分けながら、画面全体の雰囲気を統一しやすくなります。

たとえば、最初の行にmasterpiece, best quality, town, 3girlsのような共通情報を書き、その後にBREAKで区切って、左のキャラ、中央のキャラ、右のキャラを指定します。左にはwhite hair, blouse, red skirt、中央にはred hair, blue t-shirt, denim、右にはyellow hair, suitのように分けるイメージです。

Regional Prompterは、複数キャラの属性混線を減らしたいときに有効です。特に、髪色や服装が混ざる、男女がカップル風に寄りすぎる、左右のキャラが入れ替わるといった悩みに向いています。

ただし、Regional Prompterを使っても必ず完璧に分離できるわけではありません。モデル、LoRA、画像サイズ、プロンプトの相性によっては、境界付近で色や服装が混ざることがあります。その場合は、分割比率を変える、背景をシンプルにする、LoRA強度を下げる、inpaintで仕上げるといった調整が必要です。

設定項目意味使いどころ
Columns横方向に領域を分ける左右や横並びのキャラ分け
Rows縦方向に領域を分ける上下の背景や構図分け
Divide Ratio領域の比率を決める中央を広くするなどの調整
BREAK領域ごとのプロンプトを区切るキャラごとの特徴指定

Regional Prompterは便利ですが、最初から複雑な2D分割を使う必要はありません。まずはColumnsの1,1で二分割、次に1,1,1で三分割というように、単純な構成から慣れるのがおすすめです。分割が複雑になるほど、プロンプトの順番や領域の対応関係を間違えやすくなるので注意してください。

Latent Coupleの使い方

Latent Coupleは、画面内の領域ごとに異なるサブプロンプトを反映させるための拡張機能です。二人のキャラを左右に描き分けたいときによく使われます。基本的には、全体プロンプト、左側のプロンプト、右側のプロンプトをANDで区切って指定する形が代表的です。

たとえば、最初に背景や品質タグを入れ、次に左側キャラの髪色や服装、最後に右側キャラの特徴を入れます。このように構造を分けることで、プロンプト内の情報が全体に混ざりにくくなります。二人を左右に分ける目的なら、Regional Prompterよりも感覚的に使いやすいと感じる人もいるかと思います。

Latent Coupleを使うときは、分割設定とプロンプトの順番をそろえることが大切です。画面を左と右に分けているのに、プロンプトでは上下の構図を想定していると、意図した結果になりにくくなります。また、Weightsや作用ステップなどの設定も結果に影響します。

AND区切りの考え方

Latent Coupleでは、ANDで区切ったプロンプトがそれぞれの領域に対応します。たとえば、最初のプロンプトを全体、次を左側、最後を右側に割り当てる構成です。このとき、全体プロンプトには品質タグ、背景、人数、画風などを入れ、個別プロンプトにはキャラごとの髪型、服装、表情、持ち物などを入れると整理しやすいです。

よくある失敗は、左側プロンプトと右側プロンプトの情報量に差がありすぎることです。片方だけ細かく指定し、もう片方が短いと、細かく指定した側の属性が全体に広がることがあります。二人を描き分けたい場合は、両方のキャラに同じくらいの情報量を与えるとバランスが取りやすいです。

二人生成では、Latent Coupleは分かりやすい選択肢です。一方で、3人以上や複雑な領域指定を扱う場合は、Regional Prompterの方が管理しやすい場面もあります。

うまくいかない場合は、まずプロンプトを短くしてテストします。品質タグ、背景、左キャラ、右キャラだけで生成し、成功してからLoRAや細かい装飾を足すと原因を見つけやすいです。特にLoRAを複数入れている場合は、一度LoRAを外して構図が安定するか確認するとよいです。

Latent Coupleでモザイク状になったり、人物が崩れすぎたりする場合は、設定とプロンプトの対応がズレている可能性があります。分割数、位置、重み、ANDの数を見直してください。

また、Latent Coupleは二人の描き分けには便利ですが、複数人すべてを完全に制御する万能機能ではありません。二人ならLatent Couple、三人以上ならRegional Prompter、ポーズ固定が必要ならControlNetというように、目的別に使い分けると作業がスムーズになります。

BREAKでキャラを分ける

BREAKは、プロンプト内の情報を区切るために使われることがあります。Stable Diffusionで複数キャラを扱うとき、全体の条件、左側のキャラ、右側のキャラといったまとまりを分ける目的で使われます。ここ、単純な記号に見えますが、プロンプトを整理するうえではかなり便利です。

たとえば、全体の品質や背景を先に書き、その後にBREAKで区切って各キャラの特徴を書くと、情報の整理がしやすくなります。Regional Prompterでは、領域ごとのプロンプトを区切る用途としてBREAKを使う場面があります。つまり、BREAKは「文章を見やすくするため」だけでなく、拡張機能側が領域を判断するためにも使われることがあります。

ただし、BREAKを入れれば必ずキャラが分離するわけではありません。BREAKはあくまでプロンプトを整理する補助であり、画面上の位置を厳密に固定する機能ではありません。左右を分けたい場合は、left sideやright sideの位置指定、Regional PrompterやLatent Coupleの領域指定と組み合わせる方が現実的です。

BREAKを使う時の注意点

BREAKを使うときに注意したいのは、区切った順番と領域の順番を一致させることです。たとえばRegional Prompterで左、中央、右の3分割にした場合、BREAKで区切った2行目、3行目、4行目が、それぞれ左、中央、右に対応する形になります。ここがズレると、意図したキャラが別の位置に出ることがあります。

また、最後の行に余計なBREAKを入れると、空の領域指定のように扱われて結果が崩れる場合があります。使っている環境や拡張機能の仕様にもよりますが、基本的には必要な区切りだけ入れ、最後には入れない方が無難です。

BREAKを万能な描き分け機能として扱わないことが大切です。プロンプト整理には便利ですが、人数、位置、キャラ属性を完全に制御するには、他の設定との組み合わせが必要です。

プロンプトが長くなってきたら、品質、人数、構図、背景、キャラA、キャラB、ネガティブのように分類して考えると、どこにBREAKを入れるべきか判断しやすくなります。特に複数キャラ生成では、プロンプトを一文で詰め込むより、まとまりごとに整理した方が後から修正しやすいです。

BREAKは、生成結果を良くする魔法というより、プロンプト設計を崩れにくくする整理術です。領域分割と組み合わせたときに、特に効果を発揮します。

初心者のうちは、まずBREAKなしの短いプロンプトで人数や構図を確認し、その後にBREAKを使ってキャラごとの特徴を分けていくのがおすすめです。いきなり長文プロンプトをBREAKで細かく分けると、どこが原因で崩れたのか分かりにくくなります。

ControlNetとOpenPose活用

ControlNetは、ポーズ、輪郭、構図などを参照しながら画像生成を制御するための機能です。複数キャラ生成では、特にOpenPoseとの組み合わせが役立ちます。OpenPoseを使うと、人物の骨格や立ち位置を参照できるため、二人や三人の距離感、向き、ポーズを固定しやすくなります。

プロンプトだけで複数キャラを生成すると、人物の位置が毎回変わったり、左右が入れ替わったり、重なって融合したりすることがあります。ControlNetとOpenPoseを使うと、先に構図の土台を作り、その上にキャラの特徴を乗せる流れにできます。これは複数キャラ生成ではかなり大きなメリットです。

ControlNetは、テキストだけでは指定しにくい空間的な条件を画像生成に追加する考え方です。ControlNetの仕組み自体については、研究論文でもポーズや深度、エッジなどの条件を使って画像生成を制御する手法として説明されています(出典:arXiv「Adding Conditional Control to Text-to-Image Diffusion Models」)。

OpenPoseで先に立ち位置を決める

たとえば、二人が横に並ぶ構図、背中合わせの構図、向かい合う構図、3人が集合写真のように並ぶ構図などは、OpenPose参照を使うと安定しやすくなります。キャラの髪色や服装はプロンプトやRegional Prompterで分け、立ち位置やポーズはControlNetで固定するという役割分担です。

OpenPoseを使うときは、参照ポーズそのものが複雑すぎないか確認してください。腕が交差している、人物同士が重なっている、全身が小さすぎる、関節が見えにくいといったポーズは、生成結果も崩れやすくなります。最初は、人物同士が離れていて、正面向きで、腕や足の位置が分かりやすいポーズを使うと安定しやすいです。

全身構図で複数人を扱う場合は、人物が画面から切れやすくなるため、Stable Diffusionの全身プロンプトのコツも参考になります。full bodyや構図指定、画像サイズの考え方を押さえると、複数キャラでも体全体を収めやすくなります。

ControlNetは構図担当、プロンプトは属性担当と考えると分かりやすいです。どちらか一方で全部を解決しようとせず、役割を分けることで生成結果が安定しやすくなります。

また、ControlNetを使う場合でも、プロンプト側の人数指定は必要です。OpenPoseで3人分の骨格を入れても、プロンプトが1girl寄りだと一人にまとまってしまうことがあります。逆に、プロンプトで3girlsと入れてもOpenPoseが一人分なら、構図が合わなくなることがあります。参照画像、人数タグ、構図タグをそろえるのがポイントです。

複数キャラ生成では、OpenPoseで「どこに誰がいるか」を決め、Regional Prompterで「誰がどんな見た目か」を分けると、かなり管理しやすくなります。

inpaintで欠損を直す

複数キャラ生成では、最初の1枚で完璧に仕上げるより、良い構図を出してからinpaintで直す方が効率的です。inpaintは、画像の一部を指定して再生成する方法で、崩れた手、欠けた顔、混ざった服、不要な腕、背景に溶けた髪などを修正する場面で使います。ここを使えるようになると、複数キャラ生成の完成度がかなり変わりますよ。

たとえば、3人の集合絵で全体の構図は良いのに、中央キャラの手だけ崩れている場合、画像全体を再生成すると構図まで変わってしまう可能性があります。そこでinpaintを使えば、問題のある部分だけを修正し、全体の雰囲気を維持しやすくなります。

inpaintを使うときは、修正範囲を広げすぎないことが重要です。手だけ直したいのに腕全体や服まで大きく塗ると、周囲との整合性が崩れる場合があります。反対に範囲が狭すぎると、修正に必要な情報が不足します。少し余白を含めてマスクするのが扱いやすいです。

修正対象ごとの考え方

顔を直したい場合は、顔全体と少しの髪、首元まで含めてマスクすると自然につながりやすいです。手を直したい場合は、手首から指先までを含め、必要に応じて持ち物も少し含めます。服の一部を直したい場合は、服の境界線をまたぐように少し広めに塗ると、周囲とのなじみが良くなります。

ただし、複数キャラの境界付近をinpaintする場合は注意が必要です。たとえば、二人の肩が重なっている部分を大きくマスクすると、どちらの人物の服なのか分からなくなり、再び混ざることがあります。境界付近では、プロンプトにleft girl, right girlなどの位置情報を入れたり、修正したいキャラの特徴を短く明確に書いたりするとよいです。

複数キャラ生成では、生成、選別、部分修正の流れを前提にすると完成度を上げやすくなります。特に手足や顔は一発で安定しにくいため、inpaintを仕上げ工程として使うのがおすすめです。

また、顔の崩れにはADetailer、構図の崩れにはControlNet、局所修正にはinpaintといった形で、目的ごとに機能を使い分けると無駄な再生成を減らせます。すべてをinpaintで直そうとすると時間がかかるため、最初の生成段階で構図が悪い場合は、思い切って再生成した方が早いこともあります。

inpaintは仕上げには強いですが、根本的に構図が崩れた画像を完全に直すのは大変です。人物の位置や人数が大きく違う場合は、ベース画像から作り直した方が効率的です。

実践では、まず構図が良い画像を数枚選び、顔、手、服、背景の順に修正していくと進めやすいです。特に複数キャラでは、全員の顔と手を一度に直そうとせず、一人ずつ丁寧に修正する方が自然な仕上がりになりやすいです。

Stable Diffusion複数キャラのまとめ

Stable Diffusion複数キャラの生成では、プロンプトだけで解決できることと、拡張機能を使った方がよいことを分けるのが重要です。2人程度なら、2girls、two people、1boy and 1girlなどの人数指定と、左右の立ち位置、髪色、服装の違いで対応できる場合があります。

一方で、3人以上や4人以上、キャラごとの描き分け、LoRAを使った属性分離、男女混在、集合絵の安定化を狙うなら、Regional Prompter、Latent Couple、ControlNet、OpenPose、inpaintを組み合わせた方が現実的です。特に、構図はControlNet、領域分けはRegional Prompter、部分修正はinpaintという役割分担を意識すると、作業が整理しやすくなります。

最初からすべてを一発で成功させようとすると、Stable Diffusion複数キャラはかなり難しく感じます。でも、工程を分ければ一気に扱いやすくなります。まず人数と構図を決める。次にキャラごとの特徴を分ける。最後に崩れた部分を修正する。この順番を守るだけで、失敗の原因を切り分けやすくなります。

悩み主な対策考え方
人数が合わない人数タグと横長構図まず構図を単純にする
同じ顔になる髪型や服装を分ける顔以外の差も作る
属性が混ざるRegional Prompter領域ごとに指定する
ポーズが崩れるControlNetとOpenPose構図を先に固定する
手足が欠損するinpaintやADetailer生成後に部分修正する
LoRAが混ざる強度調整と領域分割効かせる範囲を意識する

最初は、二人の簡単な構図から始めるのがおすすめです。背景をシンプルにし、左と右で髪色や服装を明確に分け、うまくいったら3人、4人以上へ広げていきます。最初から複雑な集合絵を狙うより、成功条件を少しずつ増やす方が安定します。

おすすめの進め方

  • まずは2人の横並び構図で人数指定に慣れる
  • 髪型、服装、立ち位置を変えて描き分ける
  • 3人以上では横長構図や領域分割を使う
  • ポーズ固定が必要ならControlNetとOpenPoseを使う
  • 最後にinpaintやADetailerで崩れた部分を直す

なお、Stable Diffusionの拡張機能、モデル、LoRA、配布サイトの仕様は変わることがあります。導入手順や利用条件、ライセンス、商用利用の可否については、正確な情報は公式サイトをご確認ください。特に、公開や販売を前提にした画像生成では、著作権、商標、肖像権、利用規約が関わる場合があります。最終的な判断は専門家にご相談ください。

Stable Diffusion複数キャラは、最初こそ難しく感じますが、プロンプト、領域分割、構図固定、部分修正を組み合わせれば、かなり実用的なレベルまで持っていけます。あなたの目的がイラスト制作、創作キャラの集合絵、ゲーム用素材、SNS用画像のどれであっても、まずは小さく試して、うまくいった設定を少しずつ育てていくのが近道ですよ。

AIで稼ぐなら今がチャンス!
この記事を書いた人

国立大学を卒業後、2022年から2025年まで地方自治体(市役所)で勤務。
行政現場での実務を通じて、「テクノロジーが人の生活を支える力」に関心を持つ。
現在はフリーライターとして、生成AI・テクノロジー・働き方・キャリアを中心に執筆中。

「専門知識をやさしく、実生活に落とし込む」
をテーマに、公的データや一次情報をもとにした記事制作を心がけています。

renをフォローする
Stable Diffusion
スポンサーリンク
renをフォローする
タイトルとURLをコピーしました