AIイラストのポーズ指定で手指崩れを減らす今日から実践ガイド
AIイラストのポーズ指定をしてみたのに、思った向きにならない、立つ・座るが安定しない、手や指が崩れる…。あるあるです。あなたが狙った構図に寄せるには、プロンプトだけで押す場面と、ControlNetやOpenPoseで骨格から制御する場面を切り分けるのが近道です。
この記事では、Stable DiffusionのWebUIやComfyUIなどの定番環境を想定しつつ、プロンプト、ネガティブプロンプト、シード値、LoRAの使い分けでポーズを安定させる考え方を整理します。視線、アングル、構図の作り方まで含めて、迷いどころを一つずつ潰していきます。
最後まで読めば、AIイラストのポーズ指定を「運任せ」から「再現できる手順」に変えていけます。まずは基本から、気楽にいきましょう。
- プロンプトで基本姿勢を安定させるコツ
- 視線やアングルで狙いの構図に寄せる方法
- 手指の崩れを減らすネガティブ設計
- ControlNetとOpenPoseで再現性を上げる手順
AIイラストのポーズ指定基本

ここでは、まず「プロンプトだけでどこまで寄せられるか」を整理します。立つ・座る・寝るなどの基本姿勢、視線やアングルの指定、崩れやすい手指の対策、そして再現性を上げるシード値の扱いまで、土台を固めます。
プロンプトで立つ座る指定
AIイラストのポーズ指定で最初に効くのは、やっぱり基本姿勢のタグです。ここ、気になりますよね。立つ・座る・横になるみたいな「動作の核」を先に置くと、モデルが解釈しやすくなってブレが減りやすいです。逆に、雰囲気タグ(かわいい・幻想的・シネマティック等)や画風タグを先に盛りすぎると、AIが「雰囲気の再現」を優先して、ポーズが後回しになりがちなんですよ。
私がよくやるのは、姿勢→体の向き→手足→視線→衣装→背景の順に、短く組んで試行するやり方です。ポーズは確率的に揺れるので、最初から一発で当てにいくより「当たりやすい型」を作ってから寄せるほうが早いかと思います。
まずは「骨格の型」を最小で作る
いきなり全部指定しようとすると、矛盾が混ざって崩れやすいです。たとえば「立つ」と言いながら「膝を抱える」みたいな要素を混ぜると、AIはどっちを採用すべきか迷います。だから最初は、骨格だけが伝わるくらいのミニマムにして、出力を見ながら足すのがコツです。
よく使う基本姿勢の型(まずはここから)
| 狙い | 例(英語タグ) | 補助の考え方 | 崩れやすいポイント |
|---|---|---|---|
| 立つ | standing, legs apart | 重心を作るなら片足寄りも有効 | 腕・脚の角度が曖昧だと溶ける |
| 片足に重心 | contrapposto, standing on one leg | 「左右非対称」を作ると絵が締まる | 腰が折れたり脚が増えやすい |
| 座る | sitting, crossed legs | 椅子・床など「座る場所」も足す | 座面が無いと空中に座りがち |
| しゃがむ | squatting, crouching | 膝の向き・腰の高さも補助すると安定 | 足首・膝が破綻しやすい |
| 横になる | lying, on back / on side | 体の向き(仰向け・横向き)を明示 | 腕が体の下に潜ると崩れやすい |
| もたれる | reclining, leaning back | 支え(壁・椅子)を置くと説得力が増す | 背中の反りで胴体が伸びがち |
| 歩く・走る | walking / running | 動作は背景や服の揺れとセットが強い | 足運びの整合性が崩れやすい |
例:最小構成→段階的に足す
たとえば「立つ」を土台にするなら、最小構成はこんな感じです。ここに服装や背景を足していきます。最初の段階では、クオリティ系タグをあえて少なめにして、姿勢が出るかだけ確認すると迷いが減ります。
1girl, standing, legs apart, looking at viewer「座る」を狙うなら、座る場所を指定すると安定しやすいです。椅子・床・ベッドなど、座面が想像できる要素を入れると「空中座り」が減ります。
1girl, sitting, sitting on chair, crossed legs姿勢タグが効かない時の「あるある」
ここでつまずくパターン、だいたい決まってます。あなたも当てはまるかもしれません。
- 画面内に全身が入っていない:腰から下が見切れていると、脚の情報が弱くてブレやすい
- 同時にやりたいことが多すぎる:衣装・小物・背景・エフェクトまで盛ると姿勢が負ける
- プロンプト内で矛盾:standing と sitting を混ぜる、腕を上げると腕を組むを混ぜる、など
- アングルが極端:from below で大きく煽ると、脚が破綻しやすいことがある
- 一度、背景と小物を消して「人物+姿勢」だけで当てる
- 当たったら、背景は最後に足す(まず骨格)
- 矛盾しそうな動作タグは、どちらかを捨てる
- うまくいかない時は、いったん全身が入る構図に戻す

プロンプトの順番やテンプレの作り方をもう少し体系立てて整理したいなら、画像生成AIのプロンプト例で学ぶテンプレ術も合わせて見ると、置き換えポイントが掴みやすいです。
視線アングルを指定する

同じポーズでも、視線とアングルが変わるだけで印象は激変します。ここ、けっこう沼ですよね。AIイラストのポーズ指定が「なんか違う」と感じるとき、実はポーズそのものよりカメラ位置のズレが原因なことが多いです。たとえば、立ちポーズが「弱い」と感じる場合、ポーズよりも「少し上から見下ろしている」せいで迫力が出ていない、みたいなことが起きます。
視線は“感情”を固定するスイッチ
私はまず視線を固定します。視線は、鑑賞者との距離感を決める強い情報なので、ここがブレると全体の印象が散ります。たとえば「looking at viewer」は対話感が出ますし、「looking away」は物語っぽさが出やすいです。ポーズ指定を効かせたいなら、視線を先に決めて“絵の意図”を固めるのが近道かと思います。
視線・顔向き・アングルの組み合わせ例
| 狙い | 視線 | 顔の向き | アングル |
|---|---|---|---|
| 正面で安定 | looking at viewer | from front | eye level |
| 可愛さ | looking at viewer | three-quarter view | from above |
| 強さ・威圧 | looking at viewer | from front | from below |
| 物語感 | looking away | profile | from side |
| 内省 | looking down | three-quarter view | slightly from above |
アングルは“体の見え方”を変える
次にアングル(上から・下から・正面・斜め)を決めます。ここが決まると、体のひねりや腕の伸びの出方も安定します。たとえば「from below」で煽ると脚が長く強調されやすい反面、手足の破綻が増えることがあります。逆に「from above」は可愛く寄せやすいけど、迫力は落ちやすいです。あなたの狙いが「可愛い」なのか「かっこいい」なのかで、最初にアングルを選んだほうが迷いません。
- 視線:looking at viewer / looking away / looking down などで意図を固定
- 顔の向き:from front / profile / three-quarter view で立体感を決める
- アングル:from above / from below で印象(強さ・可愛さ)を調整
「画面が落ち着かない」時の処方箋
ポーズ指定が効いているのに「画面が落ち着かない」場合は、視線とアングルを先に決めてから、体の傾き(leaning forward / leaning back)を足すと収まりが良くなります。もう一段だけ具体的に言うと、傾きは“前後”だけに絞ると安定します。左右の傾きまでいきなり入れると、ひねりが増えて破綻しやすいからです。

あと、意外と効くのが「構図の中心」を決めることです。被写体が画面のど真ん中にいるのか、左右どちらかに寄っているのか。これが曖昧だと、AIが“なんとなくいい感じ”に散らして、狙いから外れやすいです。まずは中央配置で当てて、当たってから寄せるのがラクですよ。
手指が崩れる対策
手や指は、画像生成AIが苦手になりやすい部位です。ここ、ほんと気になりますよね。特に、両手が画面内に入る、顔や体に重なる、指の形が複雑、という条件が重なるほど崩れやすくなります。だから大事なのは、「手を完璧に描かせる」より「崩れにくい条件を作る」発想です。手は“見せ方”で難易度が激変します。
まずは「崩れにくい手」を選ぶ
私はまず、手の形を単純化して指定します。たとえば「open hand」「clenched fist」「thumbs up」など、形が明確なものが安定しやすいです。逆に、指先でハートを作る、指を交差する、口元に指を当てる、みたいな“接触・重なり”は難易度が上がります。いきなり難しい手を狙うより、まずは崩れにくい手で構図を完成させるのが勝ち筋です。
- 構図で回避:手が顔の前に来ない配置にする
- 形を単純化:open hand / clenched fist などから試す
- 距離を取る:手のアップや強いパースを避ける
- あとで直す前提:最終手段としてインペイントで修正
「手が目立ちすぎない構図」に寄せる
私がよくやるのは、手を主役にしない構図です。たとえば上半身アップで手を画面外に逃がす、手は体の横に置く、手が体に軽く触れる程度にする、など。手を強調するほど、細部の破綻が目立つんですよ。なので最初は、手は“雰囲気の補助”くらいに置いておくと成功率が上がります。
- 手が顔の前に来ていないか(重なりは崩れの温床)
- 極端なパースや近距離の手アップになっていないか
- 複雑な指ポーズをいきなり狙っていないか
- 腕と手の指示が矛盾していないか(arms crossed と arms up など)
ツールやモデルの更新で挙動が変わることがあります。正確な情報は各ツールの公式サイトをご確認ください。商用利用や権利関係が絡む場合の最終的な判断は、専門家にご相談ください。
それでも崩れる時の“現実的な逃げ道”
どうしても手を見せたいなら、先に「ポーズの主役は体」「手は補助」と割り切って、手の主張を弱めるのが現実的です。たとえば、袖で手を隠す、手袋にする、手に何かを持たせて形を固定する(本・スマホ・マグカップ等)、という逃げ方があります。これ、けっこう効きます。

そして最後は、インペイント(部分修正)です。最初から「一発で完璧な手」を狙うと沼るので、まず全体を完成させて、手だけ後から整えるほうが制作が止まりません。あなたの目的が“作品を完成させること”なら、ここは割り切っていいと思います。
ネガティブプロンプト例

ネガティブプロンプトは、AIイラストのポーズ指定を安定させるうえで保険になります。ここも悩みがちですよね。特に人体は、余計な手足や指の増殖、関節の破綻が起こりやすいので、まずは定番の抑えを入れておくのが無難です。ただし、ネガティブは“強くすればするほど良い”ではないです。効かせどころを分けるのがポイントです。
ネガティブは「症状別」に分けると強い
私は、いきなり大量に詰め込みません。最初は「崩れ方の傾向」に合わせて足していきます。たとえば手が崩れるなら、手関連の否定を厚くします。文字が出るなら text 系を足す。こういう感じで、症状に対して処方を足すと管理しやすいです。
定番ネガティブ(まずはこの辺から)
bad anatomy, bad hands, extra fingers, fewer fingers, extra limbs, malformed handsネガティブの“入れすぎ”で起きる事故
ただし、ネガティブを強くしすぎると「手を隠す」「腕が消える」「指が丸ごと減る」みたいな別の事故が起きることもあります。これは、AIが“手を描くな”と解釈してしまうケースがあるからです。なので、まずは薄めで入れて、必要な時に足すくらいがちょうどいいです。
- 最初:人体破綻(bad anatomy / bad hands)だけ入れる
- 手が壊れる:extra fingers / malformed hands を追加
- 画面に文字:text / watermark / signature を追加
- ノイズっぽい:blurry / jpeg artifacts などを追加
「ポーズ指定」とネガティブの相性
ポーズ指定を頑張るほど、腕や脚が画面内で大きく動くので、破綻もしやすくなります。だからポーズを攻めるほど、ネガティブは“最低限の人体保険”として置く価値があります。ただし、ポーズがうまく出ない時にネガティブを増やすと、逆に動きが消えることがあります。ポーズが出ない時は、まずポーズ側(姿勢タグの整理、アングルの修正、全身を入れる)を直してから、ネガティブを調整するのが良い流れです。

ネガティブ設計をもう少し実務的に組み立てたい場合は、SeaArtプロンプトの書き方のコツが考え方の整理に使えます(考え方は他の環境にも応用できます)。
シード値固定で差分
「同じキャラっぽいのに、ポーズだけ変えたい」「表情だけ差分にしたい」みたいな時は、シード値固定が効きます。ここ、地味に大事ですよ。シード値はざっくり言うと“同じ条件で再現するための鍵”で、固定すると比較がしやすくなります。検証が速くなるので、ポーズ指定の上達も早くなります。
固定するのは「比較」したい時
私は、検証フェーズではシード値を固定して、プロンプトの変更点が結果にどう出るかを見ます。逆に、探索フェーズではシード値をランダムにして、アイデア出しを優先します。目的で切り替えるのが一番ラクです。あなたも「今は何をしたいか」で切り替えると、迷いが減ると思います。
- 検証:シード値固定+変更は1点だけ
- 探索:シード値ランダム+良い出力が出たら記録
- 仕上げ:固定に戻して品質とポーズを詰める
「同じシードなのに違う」原因を潰す
シードを固定しても、設定が変わると結果は変わります。ここ、よく引っかかります。たとえば解像度を変えた、サンプラーを変えた、ステップ数を変えた、モデルやVAEを変えた、これだけで全然変わります。なので「差分を取りたい」なら、シード以外の条件も一緒に固定するのがコツです。
差分検証でメモしておくと強い項目
| 項目 | 例 | 変えると起きやすいこと |
|---|---|---|
| モデル | SDXL / SD1.5 など | 人物の骨格や手の癖が変わる |
| 解像度 | 832×1216 など | 構図・手足の破綻率が変わる |
| Sampler | DPM系 / Euler系 など | 線の出方やディテールが変わる |
| Steps / CFG | 28 / 6.5 など | 指示への従い方が変わる |
| プロンプト | 順番・重み | ポーズの採用率が変わる |
差分は「一項目ずつ」が最短
差分検証で一番もったいないのは、同時に2〜3個変えてしまうことです。結果が変わっても、何が効いたのかわからなくなるんですよ。なので、あなたが「ポーズだけ」を詰めたいなら、姿勢タグだけ変える。アングルだけ変える。手のネガティブだけ変える。

こうやって一個ずつ潰すと、再現できる手順が体に入ります。
AIイラストのポーズ指定を再現

ここからは「プロンプトだけだとブレる」「この構図に寄せたい」という場面で使う、再現性の上げ方です。ControlNetとOpenPoseで骨格情報を使って誘導し、参照画像の扱い方、SDXL環境の注意、OpenPoseEditorでの微調整まで、一連の流れをまとめます。
ControlNetでOpenPose活用
狙ったポーズを安定させたいなら、ControlNetのOpenPoseが強力です。ここ、いきなり世界変わりますよ。プロンプトが“言葉でのお願い”だとすると、OpenPoseは“骨格での指定”に近いので、再現性が上がりやすいです。特に「この腕の位置」「この脚の曲がり」を狙う時、プロンプトだけだと当たり外れが出ますが、骨格誘導だと当たりやすくなります。
役割分担:OpenPoseに主導権を渡す
私は、まずOpenPose側にポーズの主導権を持たせ、プロンプト側は「人物の属性」と「画の方向性」に絞ります。ここを逆にすると、プロンプトが勝ってポーズがズレることがあります。たとえば、動きの強いタグやアクション系のタグを盛りすぎると、OpenPoseよりも“躍動感”が優先されて形が崩れる、みたいなことが起きます。
- OpenPose:姿勢・骨格・大まかな手足の位置
- プロンプト:キャラ要素(髪型・服装)と雰囲気(光・背景)
- ネガティブ:人体破綻の予防とノイズ除去
だいたいの設定は「シンプル」でOK
細かい設定項目が多くて身構えるかもしれませんが、最初はシンプルで大丈夫です。あなたが見るべきポイントは、だいたい次の3つです。
- Preprocessor:OpenPose系を選ぶ(フル/手あり/顔あり等、環境により表記が違います)
- Model:ベースモデルに合うOpenPoseモデルを選ぶ
- 強度:効きが弱いなら上げる、崩れるなら下げる(“目安”で調整)
- ポーズがズレる → OpenPose強度を少し上げる、プロンプトの動作タグを減らす
- 体が固い → 強度を少し下げて、自然な動作タグを足す(walkingなど)
- 手が崩れる → まず構図を変えて、次にネガティブで保険をかける
公式の一次情報として、ControlNet拡張の概要と導入元はリポジトリを参照できます。(出典:Mikubill/sd-webui-controlnet公式リポジトリ)
「感覚勝負」から「手順」に変える
この「役割分担」ができると、AIイラストのポーズ指定が一気に“作業”になります。感覚勝負から抜けられます。私が好きなのは、まずOpenPoseで狙いの骨格を出して、次にプロンプトを少しずつ足して“絵作り”をする流れです。

これだと、ポーズが崩れたら「どこで崩れたか」がわかるので、戻るのも早いですよ。
参照画像から骨格抽出

参照画像から骨格を抽出してポーズを取るときは、参照元の選び方が結果を左右します。ここ、めちゃくちゃ重要です。私は次の条件を満たす画像を使います。これだけで成功率が上がります。
参照画像の“当たり”条件
- 全身が見えている(腕や脚が切れていない)
- 背景がうるさくない(人物の輪郭が読み取りやすい)
- 手足が極端に重なっていない(キーポイントが拾いやすい)
- 衣装が極端に長くない(ロングコートで脚が隠れると足位置が迷子になりがち)
- 大きくブレていない(モーションブラーが強いと骨格が飛びます)
抽出前にやると効く“前処理”
参照画像は、そのまま突っ込むより、軽く整えてから入れると安定します。たとえば、人物が小さすぎるならトリミングして人物を大きくする、明るさが暗いなら少し上げる、背景がゴチャゴチャなら背景をぼかす、みたいな感じです。これは絵の品質というより、骨格検出の精度に直結します。
- 人物が画面の高さの6〜8割くらいになるようにトリミング
- 背景がうるさいなら、軽くぼかして輪郭を立てる
- 極端に暗い場合は明るさを少し上げる
- 手足が切れているなら、別の参照に変える(無理に救わない)
権利関係は“先に”確認する
そして重要なのが権利関係です。参照画像に第三者の著作物や人物写真が含まれる場合、利用規約や肖像権・著作権の問題が出る可能性があります。商用利用を考えるなら特に、利用規約の範囲内で扱うのが安全です。
私は基本的に、(1)自分で撮った写真、(2)利用許諾が明確な素材、(3)自作のポーズ人形・3Dモデルのスクショ、のどれかを使うようにしています。ここは「後で揉めない」ための保険です。正確な情報は公式サイトをご確認ください。最終的な判断は専門家にご相談ください。
参照がなくても“それっぽい骨格”は作れる
参照画像がない場合でも、ポーズ人形や3Dのデッサン人形、あるいはOpenPoseEditorで骨格を作ってしまう方法があります。参照を探す時間が長くなると制作が止まるので、「今日は参照なしで組む日」と割り切って骨格から作るのも、けっこう現実的ですよ。
SDXL向けOpenPose注意
SDXL環境では、OpenPoseやControlNet周りの互換性でつまずくことがあります。ここ、ハマりやすいです。よくあるのは「モデルの世代が合っていない」「想定している解像度や設定が噛み合っていない」パターンです。エラーが出た時、焦って設定を盛るほど沼るので、順番に確認すると落ち着きます。
まずは“世代合わせ”を疑う
私がまず見るのはこの3点です。
- ベースモデルがSDXLなのかSD1.5なのか
- ControlNet側のモデルがベースに対応しているか
- 解像度・比率が参照画像と大きくズレていないか
たとえばSDXLを使っているのに、SD1.5向けのControlNetモデルを当ててしまうと、そもそも動かない・エラーが出る・挙動が不安定、みたいなことが起きやすいです。逆も同じです。まずはここを合わせるのが第一です。
SDXLは「効きが薄い」と感じることがある
SDXLのOpenPoseは、環境や組み合わせ次第で「効いてるけど薄い…」みたいに感じることがあります。そんな時は、いきなり強度をMAXにするより、段階的に上げるのが安全です。強度を上げすぎると、体は従うけど画が固くなったり、ディテールが崩れたりすることもあります。
- 設定を増やす前に、ベースモデルとControlNetモデルの対応を確認
- 参照画像の解像度と生成サイズの比率を揃える
- プロンプト側の動作タグを減らして競合を避ける
環境差で挙動が変わりやすい領域です。正確な情報は各ツールの公式サイトをご確認ください。迷う場合の最終的な判断は専門家にご相談ください。
“比率のズレ”が地味に効く
SDXLでうまくいかない時、実は参照画像と生成サイズの比率がズレていて、骨格が伸びたり縮んだりしているケースもあります。縦長参照を横長キャンバスに入れると、同じ骨格でも見え方が変わって「違う」と感じやすいです。

まずは参照の比率に合わせる、これだけで体感が変わることがあります。
OpenPoseEditorで調整

「参照画像はないけど、このポーズが欲しい」や「抽出はできたけど、手首の角度だけ直したい」なら、OpenPoseEditorのような編集で微調整するのが効率的です。ここ、慣れるとめちゃくちゃ便利ですよ。言葉で説明しづらい動きでも、骨格を動かせば一発で伝わるからです。
最初は“全体のバランス”だけ整える
私は、いきなり細部を詰めません。まずは胴体と脚の重心、次に腕、最後に手の向き、という順で整えます。最初から指までこだわると、全体のバランスが崩れたまま“部分だけ頑張る”ことになりがちです。だから順番が大事です。
- 体幹:肩と骨盤の角度で雰囲気が決まる
- 脚:接地と膝の向きで安定感が出る
- 腕:肘の位置で「らしさ」が出る
- 手:最後に形を寄せる(崩れやすいので欲張らない)
よくある「首が長い」「左右が逆」の直し方
骨格抽出や編集だと、首が妙に長く見えたり、左右が逆になったりすることがあります。これ、珍しくないです。首の長さは、頭と肩の距離が伸びているだけのことも多いので、肩の位置をほんの少し上げるだけで整うことがあります。左右反転は、参照画像の向きやカメラ方向の解釈で起きやすいので、骨格を左右反転するか、生成側で反転して整えるのが早いです。
“言葉が出ないポーズ”ほど編集が強い
ポーズを編集できるようになると、「この構図が欲しいのに単語が思いつかない」問題が消えます。言葉より先に“形”で指定できるからです。AIイラストのポーズ指定って、結局「言語化の壁」が一番しんどいので、そこを骨格で突破できるのは大きいです。

ただ、どのツールもアップデートでUIや名称が変わることがあります。正確な操作手順は公式サイトをご確認ください。商用利用や権利が絡む場合は、最終的な判断は専門家にご相談ください。
AIイラストのポーズ指定まとめ
AIイラストのポーズ指定は、プロンプトだけで押す場面と、ControlNetやOpenPoseで骨格から制御する場面を切り分けると、一気に再現性が上がります。あなたの悩み、ここでかなり整理できたんじゃないかと思います。
この記事の要点をもう一回だけ整理
- 基本は、姿勢タグを短く置いてから足す
- 視線とアングルを固定すると「違う」が減る
- 手指は崩れやすい前提で、ネガティブと構図で回避
- 再現したいならOpenPoseで骨格指定に寄せる
迷った時の“最短ルート”
- 全身が入る構図で「standing / sitting」など基本姿勢を当てる
- 視線(looking at viewer など)とアングル(from above など)を固定
- 手が崩れるなら、まず構図で回避してからネガティブを追加
- どうしても狙いに寄らないなら、ControlNet OpenPoseに切り替える
そして、商用利用や参照画像の扱いが絡む場合は、利用規約や権利関係の確認が欠かせません。正確な情報は公式サイトをご確認ください。迷う場合の最終的な判断は、専門家にご相談ください。
LoRAを絡めてポーズと画風をさらに安定させたい場合は、SeaArt LoRAの作り方・使い方も参考になります(考え方は他の環境にも応用できます)。あなたの制作が止まらないように、まずは「基本姿勢+視線+シード固定」の3点から試してみてください。

