Stable Diffusionのアニメプロンプト例集
Stable Diffusionのプロンプト例でアニメ画像を作りたいものの、どんな呪文を入れればよいのか、アニメ塗りや高品質化、ネガティブプロンプトまで一度に整理できず悩む方は多いです。うまくいかないと、髪色が反映されない、手が崩れる、背景がごちゃつく、思ったようなアニメ系の絵柄にならないなど、細かい部分でつまずきますよね。
この記事では、Stable Diffusionのアニメプロンプト例をもとに、anime style、アニメ塗り、キャラクター外見、表情、ポーズ、背景、服装、LoRA、チェックポイント、ネガティブプロンプト、高画質化の考え方まで、初心者でも使いやすい形で整理します。あなたがそのまま試しやすいテンプレートも交えながら、アニメ風イラストを安定して作るための組み立て方を解説します。
Stable Diffusionは、テキストプロンプトをもとに画像を生成できる仕組みとして広く使われています。公式ドキュメントでも、Stable DiffusionPipelineはテキスト入力から画像生成を行うものとして説明されています(出典:Hugging Face Diffusers「Text-to-image」)。ただし、同じプロンプトでも、モデル、サンプラー、CFG Scale、画像サイズ、LoRA、VAEなどの条件で結果は大きく変わります。ここ、かなり気になりますよね。だからこそ、この記事では単なる単語一覧ではなく、どう組み立てれば安定しやすいのかまで踏み込んで解説していきます。
- アニメ系プロンプトの基本構成
- キャラクターや背景の指定方法
- ネガティブプロンプトの使い方
- モデル選びと高画質化の考え方
Stable Diffusionアニメプロンプト例

まずは、Stable Diffusionでアニメ風の画像を作るときに押さえたい基本構造から見ていきます。アニメ系の画像生成では、品質タグ、画風タグ、キャラクター情報、構図、背景、ネガティブプロンプトを分けて考えると、結果を調整しやすくなります。最初から完璧な呪文を作ろうとすると迷いやすいので、ここでは「どのキーワードが何を担当しているのか」を分解しながら進めます。
アニメ系の呪文テンプレ
Stable Diffusionでアニメ系の画像を生成する場合、最初から複雑なプロンプトを作るよりも、まずは型を決めるのがおすすめです。型があると、髪色や表情、服装、背景だけを入れ替えればよく、毎回ゼロから悩まずに済みます。特に初心者のうちは、SNSや配布サイトで見かける長いプロンプトをそのまま真似しても、どの単語が効いているのか分からず、修正が難しくなりがちです。ここ、けっこうつまずきやすいですよね。私としては、まず短いテンプレートで「人物、画風、構図、背景」を安定させてから、少しずつ単語を追加するやり方がいちばん再現しやすいかと思います。
基本の考え方は、品質、画風、人物、構図、背景の順に並べることです。順番だけで必ず結果が変わるわけではありませんが、要素を整理しやすくなります。プロンプトを整理しておくと、生成結果が崩れたときに「品質タグが足りないのか」「人物指定が曖昧なのか」「背景が強すぎるのか」を切り分けやすくなります。
たとえば、アニメ風の女の子を作る基本テンプレートは以下のように組み立てられます。
masterpiece, best quality, anime style, clean lines, vibrant colors, 1girl, cute anime girl, detailed eyes, blue hair, smile, school uniform, upper body, looking at viewer, cherry blossom backgroundこのテンプレートでは、masterpieceやbest qualityで品質の方向性を指定し、anime styleやclean linesでアニメらしい線と塗りに寄せています。そのうえで、1girl、髪色、表情、服装、構図、背景を加える形です。重要なのは、ひとつのプロンプトの中に役割の違う単語が混ざっていることを理解することです。masterpieceは全体の品質、anime styleは画風、blue hairは見た目、upper bodyは構図、cherry blossom backgroundは背景を担当しています。
テンプレートを作るときの分解例
| 役割 | キーワード例 | 考え方 |
|---|---|---|
| 品質 | masterpiece, best quality | 全体の完成度を高める方向へ寄せる |
| 画風 | anime style, clean lines | アニメ調、線画、塗りの雰囲気を指定する |
| 人物 | 1girl, cute anime girl | 登場人物の数や基本属性を指定する |
| 外見 | blue hair, detailed eyes | 髪色や目など、キャラクターの印象を作る |
| 構図 | upper body, looking at viewer | どの範囲を見せるか、どこを見るかを指定する |
| 背景 | cherry blossom background | シーンや世界観を補強する |
ただし、品質タグを大量に入れれば必ず高品質になるわけではありません。モデルによって反応しやすい語句は異なるため、まずは短いテンプレートで試し、必要に応じて単語を足す流れが安定します。たとえば、SD1.5系のアニメモデルではmasterpieceやbest qualityが効きやすいことがありますが、SDXL系や独自学習モデルでは、短く具体的なプロンプトのほうが自然に出る場合もあります。つまり、呪文は万能の正解ではなく、モデルとの相性を見ながら調整するものなんですよ。
使いやすい基本テンプレート
masterpiece, best quality, anime style, clean lines, vibrant colors, 1girl, detailed face, detailed eyes, upper body, looking at viewer, simple backgroundこの基本形に、髪型、表情、衣装、背景を追加していくと、アニメ系プロンプトを作りやすくなります。たとえば、青髪の笑顔にしたい場合はblue hair, smileを足し、図書館にしたい場合はlibrary, bookshelves, warm lightingを追加します。逆に、うまくいかないときは、プロンプトを増やす前に一度この基本形まで戻して、どの追加キーワードが悪さをしているのか確認するとよいです。
プロンプト調整では、1回の生成で複数の要素を変えすぎないのがコツです。髪色、背景、表情、服装を同時に変えると、どの変更が結果に影響したのか分かりにくくなります。まずは髪色だけ、次に表情だけ、というように少しずつ試すと、あなたの環境に合うテンプレートが作りやすくなります。
また、アニメ系の呪文テンプレを作るときは、ネガティブプロンプトもセットで考えておくと便利です。ポジティブ側で「こう描いてほしい」と指定し、ネガティブ側で「これは避けてほしい」と伝えることで、生成結果のブレをある程度抑えられます。特に、手の崩れ、低画質、文字やロゴ、写実的すぎる質感はよく出る失敗なので、最初からテンプレート化しておくと作業がかなり楽になります。
高品質プロンプトの基本

アニメ画像の品質を上げたいときは、やみくもに長い呪文を入れるよりも、役割ごとにキーワードを選ぶことが大切です。よく使われる高品質系の語句には、masterpiece、best quality、high quality、ultra-detailed、sharp focus、detailed eyesなどがあります。ただし、これらは魔法の言葉ではなく、モデルが学習しているタグやキャプションの傾向に応じて効き方が変わります。ここ、かなり大事です。たとえば、アニメ特化モデルではbest qualityやmasterpieceが作例タグとしてよく使われるため反応しやすい場合がありますが、すべてのモデルで同じように効果が出るとは限りません。
特にアニメ系では、顔、目、髪、線画、色の鮮やかさが印象を大きく左右します。そのため、detailed eyes、clean lines、vibrant colorsのように、見た目へ直接影響しやすい語句を優先すると扱いやすいです。単に高品質を意味する言葉を並べるより、「どこを高品質にしたいのか」を具体的に指定したほうが、結果の改善につながりやすいですよ。
| 目的 | プロンプト例 | 狙える効果 | 使いどころ |
|---|---|---|---|
| 全体品質 | masterpiece, best quality | 完成度の高い出力に寄せる | 基本テンプレートの先頭に入れる |
| 線の明瞭さ | clean lines, sharp lines | アニメらしい輪郭を出しやすくする | 線がぼやけるときに追加する |
| 色の鮮やかさ | vibrant colors, colorful | 明るく華やかな印象にする | 色がくすむときに使う |
| 目の描写 | detailed eyes, sparkling eyes | キャラクターの魅力を高める | 顔の印象を強めたいときに使う |
| 細部表現 | ultra-detailed, polished details | 髪や服の情報量を増やす | 装飾や質感を増やしたいときに使う |
| ピント感 | sharp focus, clear focus | ぼやけた印象を減らす | 全体が眠い絵になるときに使う |
一方で、4k、8k、high-resolutionといった語句は、画像の見た目を高精細に寄せるための表現として使われます。しかし、実際のピクセル数は生成画面のwidth、height、アップスケール設定で決まります。プロンプトだけで実解像度が自動的に上がるわけではない点は注意してください。たとえば512×512で出力しているなら、プロンプトに8kと入れても画像サイズ自体は512×512のままです。見た目のディテールが増える可能性はありますが、実際の出力解像度とは別物として考えましょう。
高品質化でよくある勘違い
よくあるのが、masterpiece、best quality、ultra detailed、8k、high resolution、perfect anatomy、beautiful faceなどを大量に詰め込むパターンです。もちろん、うまくハマることもあります。ただ、品質タグが多すぎると、モデルによっては絵柄が硬くなったり、情報量が増えすぎて背景がごちゃついたり、顔が似た雰囲気に固定されたりすることがあります。私なら、最初はmasterpiece, best quality, anime style, clean lines, detailed eyesくらいから始めて、足りない部分だけ追加します。
高品質タグは、足し算だけで考えないことが大切です。生成結果が派手になりすぎる、塗りが重くなる、背景がうるさくなる場合は、タグを追加するのではなく、むしろ減らしたほうが安定することもあります。
また、アニメ系の高品質化では、顔のアップ、上半身、全身で必要なプロンプトが変わります。顔アップならdetailed eyesやbeautiful faceが効きやすいですが、全身の場合はperfect anatomy、full body、standing pose、simple backgroundなど、体全体を整える指定が重要になります。顔だけを強調しすぎると、全身構図で手足のバランスが崩れることもあるため、構図に応じてプロンプトを変えるとよいですよ。
絵柄そのものの決め方まで整理したい場合は、Stable Diffusionの絵柄指定で理想の画風へも参考になります。プロンプト、Checkpoint、LoRAの役割を分けて考えると、アニメ系の調整がかなり楽になります。
ネガティブプロンプト例
アニメ系の生成では、ポジティブプロンプトと同じくらいネガティブプロンプトが重要です。ネガティブプロンプトは、画像に出したくない要素や、避けたい崩れを指定するために使います。たとえば、低画質、ぼやけ、手の崩れ、余分な指、文字、透かし、ロゴ、写実的すぎる質感などを避けたい場合に使います。ここ、めちゃくちゃ実用的な部分ですよね。アニメ風の画像は顔がきれいに出ても、手や背景に違和感が出ることが多いので、ネガティブプロンプトをテンプレート化しておくとかなり便利です。
まず入れておきたいのは、低品質を防ぐ基本ワードです。たとえば、low quality、worst quality、blurry、bad anatomy、bad hands、extra fingers、missing fingers、text、watermarkなどがよく使われます。これらは、画像の品質や人体の崩れ、不要な文字要素を抑えるための基本セットとして使いやすいです。
low quality, worst quality, blurry, bad anatomy, bad hands, extra fingers, missing fingers, deformed, text, watermark, logoアニメ風にしたい場合は、写実的すぎる表現を抑えるために、realistic、photorealistic、3D render、3D modelなどを入れることもあります。特にアニメ塗りやセル画風を狙う場合、リアルな肌質や3D風の質感が混ざると、仕上がりが中途半端に見えることがあります。逆に、少しリアル寄りのアニメイラストを作りたい場合は、realisticをネガティブに入れないほうがよい場合もあります。このあたりは、作りたい絵柄に合わせて調整しましょう。
目的別ネガティブプロンプト
| 避けたい問題 | ネガティブプロンプト例 | 補足 |
|---|---|---|
| 低品質 | low quality, worst quality, blurry | ぼやけや荒さを抑えたいときに使う |
| 人体崩れ | bad anatomy, deformed, extra limbs | 体のバランス崩れを減らしたいときに使う |
| 手の崩れ | bad hands, extra fingers, missing fingers | 指の本数や形が崩れやすいときに使う |
| 不要な文字 | text, watermark, logo, signature | 背景や服に文字が出るときに使う |
| リアル寄り | realistic, photorealistic, 3D render | アニメ調に寄せたいときに使う |
| 背景の混雑 | crowded background, messy background | 背景をすっきりさせたいときに使う |
ネガティブプロンプトを入れすぎると、必要な表現まで弱くなることがあります。最初は低品質、人体崩れ、文字やロゴの除外から始め、問題が出たときだけ追加するのがおすすめです。特に、服装や背景のディテールを増やしたいのに、messy backgroundやtoo many detailsを強く入れると、情報量が不足することもあります。
手や顔の崩れを減らしたい場合は、ネガティブプロンプトだけでなく、画像サイズ、Hires.fix、ADetailer、ControlNetなどの設定も関係します。ネガティブプロンプトはあくまで「避けたい方向を伝えるもの」であり、細かいポーズや手の形を完全に制御できるわけではありません。たとえば、手に本を持たせたい、魔法の杖を持たせたい、料理中の手元を描きたいといった場合は、プロンプトだけでは崩れやすいので、ポーズ補助や生成後の修正も視野に入れるとよいです。
ネガティブプロンプトの基本を詳しく整理したい方は、Stable Diffusionのネガティブプロンプトおすすめテンプレ集で、用途別の考え方を確認してみてください。
また、ネガティブプロンプトは固定テンプレートを作ると便利ですが、毎回まったく同じでよいわけではありません。たとえば、アニメ塗りではrealisticを避けたい一方で、セミリアルなアニメイラストではrealisticを残したほうが魅力的になることもあります。つまり、ネガティブプロンプトも作風に合わせて変える必要があります。あなたが作りたい絵柄に合わせて、不要な単語を足し引きしていきましょう。
アニメ塗りの指定方法

アニメ塗りを狙うときは、anime styleだけでなく、flat color、cell shading、clean shading、black outline、clean outlines、sharp focusなどを組み合わせると方向性を出しやすくなります。アニメ塗りとは、ざっくり言えば、影が整理されていて、線がはっきりし、色面が見やすい塗りのことです。厚塗りやリアル調のように複雑な肌質や細かい光沢を入れるより、色と影をシンプルに分けるイメージですね。ここ、言葉だけだと少し分かりにくいかもしれませんが、プロンプトでは「塗り」「線」「影」を分けて指定するとかなり扱いやすくなります。
アニメ塗りは、単にアニメという単語を入れるだけで完成するものではありません。モデルが厚塗り寄りの場合、anime styleを入れても、影や肌の質感がリアル寄りに残ることがあります。その場合は、塗り、線、影のキーワードを分けて指定すると調整しやすくなります。たとえば、flat colorでベタ塗り感、cell shadingでセル画風の影、clean outlinesで輪郭線、vibrant colorsで色の鮮やかさを指定するイメージです。
anime style, flat color, cell shading, clean shading, black outline, clean outlines, vibrant colorsflat colorはベタ塗りの印象を出したいときに使いやすく、cell shadingは影をアニメらしく整理したいときに役立ちます。black outlineやclean outlinesは輪郭線をはっきりさせる語句で、キャラクターと背景の境界を見やすくしたいときに便利です。ただし、black outlineを強く効かせると、モデルによっては線が太くなりすぎたり、カートゥーン調に寄ったりすることがあります。その場合はclean outlinesやthin line artのような語句に変えると、自然なアニメ調になりやすいです。
アニメ塗りに使いやすいキーワード
| 目的 | キーワード例 | 仕上がりの傾向 |
|---|---|---|
| アニメ調 | anime style, anime screencap | アニメ作品の画面らしい雰囲気に寄せる |
| ベタ塗り | flat color, flat shading | 色面が整理された印象になる |
| セル影 | cell shading, cel shading | 影がくっきり分かれやすくなる |
| 線画 | clean lines, clean outlines | 輪郭や髪の線を見やすくする |
| 発色 | vibrant colors, colorful | 明るく華やかなアニメ調に寄せる |
| 画面感 | anime screencap, simple shading | アニメのワンシーン風に寄せる |
アニメ塗りが弱いと感じるときは、プロンプトを長くする前に、使用しているCheckpointがアニメ向けかどうかを確認しましょう。アニメ塗りは、プロンプトよりもモデルの得意分野に大きく左右されます。厚塗り系モデルで無理にセル塗りを狙うより、最初からアニメ塗りが得意なモデルを使ったほうが早いことも多いです。
アニメ塗りでよくある失敗は、プロンプト内に矛盾した画風指定を入れてしまうことです。たとえば、flat colorやcell shadingを入れているのに、ultra realistic skin、realistic lighting、oil paintingなどを同時に入れると、モデルがどちらに寄せればよいのか迷いやすくなります。もちろん、あえてミックスする表現もありますが、初心者のうちは、まずアニメ塗りに必要な語句だけで組むのがおすすめです。
アニメ塗りに特化して調整したい場合は、Stable Diffusionのアニメ塗りプロンプト実践入門で、flat colorやcell shadingの使い分けを詳しく確認できます。
もうひとつ意識したいのが、背景の塗りです。キャラクターだけアニメ塗りになっても、背景がリアルな写真風だと、全体の統一感が弱くなります。背景にもanime background、simple background、clean background、soft gradientsなどを入れると、キャラクターと背景の雰囲気がそろいやすくなります。アニメ風の完成度を上げるなら、人物だけでなく画面全体の塗りをそろえることが大事ですよ。
キャラクター外見の呪文
アニメキャラクターの印象は、髪型、髪色、目の色、表情、服装、年齢感、雰囲気で大きく変わります。Stable Diffusionでは、これらを具体的に指定するほど、狙いに近い結果へ寄せやすくなります。ただし、指定を細かくしすぎると、要素が混ざったり、モデルが一部を無視したりすることもあります。ここ、意外と悩みますよね。私としては、最初は「髪」「目」「服」「雰囲気」の4つを決めてから、必要に応じてアクセサリーや背景を足す流れが扱いやすいと思います。
たとえば、青髪で明るい雰囲気のキャラクターなら、blue hair、long hair、blue eyes、smile、cheerful、school uniformなどを組み合わせます。神秘的な雰囲気にしたいなら、silver hair、purple eyes、mysterious atmosphere、fantasy outfitなどが使いやすいです。外見プロンプトでは、単語を単体で入れるだけでなく、キャラクターの方向性が伝わるように組み合わせるのが大切です。
| 要素 | プロンプト例 | 使い方 | 補足 |
|---|---|---|---|
| 髪色 | blue hair, pink hair, silver hair | キャラの第一印象を決める | 複数色を入れると混ざることがある |
| 髪型 | long hair, twin tails, short hair | シルエットを指定する | 髪型は顔周りの印象に直結する |
| 目 | blue eyes, sparkling eyes, detailed eyes | 顔の魅力を高める | アップ構図では特に重要 |
| 雰囲気 | cheerful, elegant, mysterious | キャラ性を作る | 表情やポーズと組み合わせると強い |
| 服装 | school uniform, hoodie, white dress | 世界観を補強する | 背景と合わせると自然になる |
| 顔立ち | cute face, delicate face, beautiful face | 顔の方向性を補足する | 入れすぎると似た顔になりやすい |
外見指定で失敗しやすいのは、情報を詰め込みすぎることです。たとえば、髪色を複数入れたり、服装をいくつも指定したりすると、要素が混ざることがあります。最初は髪、目、服、表情の4つに絞ると、調整しやすいです。特に、red hairとblue hairを同時に入れる、school uniformとwhite dressを同時に入れる、short hairとlong hairを同時に入れるような矛盾は避けたほうがよいです。
キャラクター外見の組み立て例
1girl, long blue hair, blue eyes, cheerful smile, school uniform, red ribbon, upper body, looking at viewerこの例では、1girlで人物数、long blue hairで髪型と髪色、blue eyesで目、cheerful smileで表情、school uniformとred ribbonで服装、upper bodyで構図を指定しています。かなりシンプルですが、キャラクターの方向性は十分に伝わります。さらに背景を加えるなら、classroom backgroundやcherry blossom backgroundを足すと、学生らしい雰囲気が出しやすくなります。
外見プロンプトは、キャラクター設定の骨組みです。髪色や服装だけでなく、性格や雰囲気も一緒に指定すると、単なる見た目ではなく「キャラクターらしさ」が出やすくなります。
また、アニメキャラクターでは目の指定がかなり重要です。detailed eyes、sparkling eyes、large eyes、bright eyesなどを入れると、アニメらしい魅力が出やすくなります。ただし、目の指定を強くしすぎると、顔アップではよくても全身構図で目だけが不自然に目立つことがあります。全身なら顔の詳細指定は控えめに、バストアップなら目や表情を強めに、というように構図に合わせるとバランスが取りやすいです。
外見を安定させたい場合は、Seedを固定して少しずつプロンプトを変えるのも効果的です。Seedを変えるたびに顔や髪型が大きく変わるため、比較検証が難しくなります。髪色だけ変えたい、服だけ変えたいという場合は、Seedを固定して、該当キーワードだけ差し替えると違いが見やすくなりますよ。
表情とポーズの指定

表情とポーズは、アニメイラストの魅力を大きく左右します。顔立ちが整っていても、表情やポーズが曖昧だと、キャラクターの感情が伝わりにくくなります。逆に、少しシンプルな絵でも、表情とポーズがハマっていると一気に魅力的に見えます。ここ、かなり大事ですよ。Stable Diffusionでは、smileやlooking at viewerのような短い語句でも印象が変わりますが、より狙ったシーンに近づけるなら、表情、視線、姿勢、動作を分けて指定すると安定しやすいです。
表情を指定する場合は、smile、angry、surprised、crying、blush、serious expression、gentle smileなどが使いやすいです。アニメ系では、blushやsparkling eyesのような感情表現を足すと、キャラクターらしさが出やすくなります。たとえば、恥ずかしそうな表情ならblush, shy smile、元気な雰囲気ならbig smile, cheerful expression、真剣なシーンならserious expression, focused eyesのように組み合わせます。
1girl, smile, sparkling eyes, looking at viewer, upper body, gentle poseポーズを指定する場合は、standing、sitting、looking at viewer、dynamic pose、holding a book、holding a magic wandなど、体の状態と動作を分けて書くと伝わりやすいです。たとえば、図書館で勉強するキャラクターなら、sitting at a wooden desk、holding a pen、focused expression、surrounded by bookshelvesのように、状況をセットで指定します。ただstandingだけだと普通の立ち姿になりやすいので、standing confidently、hands on hips、slightly tilted headのように補足すると、ポーズに表情が出ます。
| 表現したい感情 | 表情プロンプト | 組み合わせたいポーズ |
|---|---|---|
| 明るい | smile, cheerful expression | waving hand, looking at viewer |
| 恥ずかしい | blush, shy smile | looking away, hands near face |
| 驚き | surprised, wide eyes | open mouth, raised hands |
| 真剣 | serious expression, focused eyes | holding a pen, sitting at desk |
| 悲しい | crying, teary eyes | looking down, sitting alone |
| 勇ましい | confident smile, determined eyes | standing confidently, dynamic pose |
表情とポーズは、背景や小物と一緒に指定すると安定しやすくなります。勉強なら机と本、料理ならエプロンとキッチン、花火なら浴衣と夜空のように、状況を補う語句を入れるのがコツです。表情だけを指定するより、なぜその表情をしているのかが分かる要素を一緒に入れると、シーンとしてまとまりやすくなります。
シーン別のプロンプト例
1girl, gentle smile, sitting at a cafe table, holding a cup, warm lighting, cozy atmosphere, upper body1girl, focused expression, studying, sitting at a wooden desk, holding a pen, open books, library background1girl, surprised expression, wide eyes, looking up at fireworks, wearing a yukata, summer festival nightポーズが崩れる場合は、プロンプトだけで解決しようとせず、ControlNetやOpenPoseのような補助機能を使う選択肢もあります。特に複雑な手の動きや全身ポーズは、プロンプトだけでは安定しにくいことがあります。手に物を持たせる、片足を上げる、走る、戦う、弓を引くといった動作は、モデルが苦手なことも多いです。その場合は、構図をupper bodyにする、手元をあまり強調しない、背景や小物を減らすなど、難易度を下げる工夫も有効ですよ。
また、ポーズ指定では、全身を出したいならfull body、上半身ならupper body、顔を重視するならclose-upを入れます。これらを入れないと、モデルが勝手に構図を判断するため、思ったより寄ったり引いたりすることがあります。表情とポーズを安定させるには、感情、視線、構図、動作をセットで指定する。この考え方を覚えておくと、アニメ系プロンプトの完成度が一気に上がります。
Stable Diffusionアニメプロンプト例集

ここからは、背景、服装、モデル、LoRA、高画質化まで、実際にアニメ画像を作るうえで仕上がりを左右する要素を解説します。プロンプトは単語の暗記ではなく、どの要素が何を担当しているのかを理解すると、応用しやすくなります。前半で作ったキャラクターの基本形に、シーンやモデル選びの考え方を足して、より実用的なプロンプトへ育てていきましょう。
背景シーンのプロンプト
アニメ風イラストでは、背景を指定することでキャラクターの魅力が引き立ちます。背景を入れないと、キャラクターだけは整っていても、作品としての雰囲気が弱くなることがあります。逆に、背景を入れすぎるとキャラクターが埋もれたり、画面がごちゃついたりすることもあります。ここ、バランスが難しいですよね。背景プロンプトは、ただ場所を指定するだけでなく、時間帯、光、空気感まで入れると、アニメのワンシーンらしさが出やすくなります。
背景を作るときは、場所、時間帯、光、雰囲気の4つを意識すると組み立てやすいです。たとえば、桜の庭園ならcherry blossom garden、夕方ならat sunset、柔らかい光ならsoft lighting、落ち着いた雰囲気ならpeaceful atmosphereを加えます。場所だけだと情報が少ないので、どんな光が当たっているのか、どんな雰囲気なのかまで指定すると、画像全体の印象が安定します。
cherry blossom garden, sunset, soft lighting, peaceful atmosphere, anime backgroundカフェでくつろぐ女の子なら、sitting at a cafe table、warm lighting、cozy atmosphereを入れると、場面が伝わりやすくなります。図書館なら、library setting、bookshelves、wooden desk、open books、warm ambient lightingが使いやすいです。花火大会なら、summer festival、fireworks、night sky、lantern light、wearing a yukataなどを組み合わせると、季節感とキャラクターの服装が自然につながります。
| シーン | プロンプト例 | 向いている表現 | 相性のよい衣装 |
|---|---|---|---|
| カフェ | cozy cafe, warm lighting | 日常系、落ち着いた雰囲気 | casual outfit, glasses |
| 図書館 | library, bookshelves, wooden desk | 勉強、知的な雰囲気 | school uniform, cardigan |
| 夏祭り | summer festival, fireworks, lantern light | 浴衣、夜景、季節感 | yukata, hair ornament |
| 森 | fantasy forest, glowing mushrooms | ファンタジー、幻想的な表現 | fantasy dress, cloak |
| 街 | anime cityscape, neon lights | 現代風、サイバーパンク風 | hoodie, futuristic outfit |
| 教室 | classroom, sunlight, school desks | 学生、青春、日常系 | school uniform, red ribbon |
背景がごちゃつく場合は、simple background、clean background、uncrowded backgroundを入れると整理しやすくなります。逆に背景の情報量を増やしたい場合は、detailed backgroundを加えますが、キャラクターが埋もれないように注意しましょう。特に、detailed backgroundとultra-detailedを同時に強く入れると、背景の情報量が増えすぎて主役が弱くなることがあります。
背景を安定させるコツ
背景を安定させるには、キャラクターの行動と背景を一致させることが大切です。たとえば、studyingを入れるならlibraryやdesk、cookingを入れるならmodern kitchenやfrying pan、relaxingを入れるならcafeやsofaのように、行動に合う場所を指定します。行動と背景がズレると、モデルが曖昧に解釈して、机の上に不自然な物が増えたり、背景とキャラクターの関係が分かりにくくなったりします。
背景がうまく出ないときは、背景を細かく説明する前に、構図を決めるのがおすすめです。upper bodyなら背景はぼかし気味でも自然ですし、full bodyなら地面や建物の情報が必要になります。構図に合わせて背景の情報量を変えると、画面全体がまとまりやすくなります。
また、アニメ背景を狙うならanime background、painted background、soft gradients、clean compositionなどを入れると、人物との統一感が出やすいです。写真風の背景を避けたいなら、ネガティブプロンプトにrealistic backgroundやphoto backgroundを入れる選択肢もあります。ただし、背景を完全に単純化したい場合はsimple backgroundが便利です。キャラクター重視のサムネイルやアイコンを作るなら、無理に複雑な背景を入れないほうが見栄えがよいこともありますよ。
服装アクセサリーの呪文

服装やアクセサリーは、キャラクターの世界観を一気に伝える要素です。アニメプロンプトでは、服の種類だけでなく、色、素材、柄、装飾まで指定すると、イメージが明確になります。たとえば、同じ女の子キャラクターでも、school uniformなら学生感、hoodieならカジュアル感、white dressなら清楚さ、fantasy outfitなら異世界感が出ます。ここ、キャラ作りではかなり楽しい部分ですよね。服装は見た目だけでなく、背景や表情と合わせることで、画像全体のストーリーを作れます。
たとえば、制服ならschool uniform、白いワンピースならwhite dress、パーカーならhoodie、ファンタジー衣装ならfantasy outfit、サンタ衣装ならSanta Claus outfitと指定できます。アクセサリーでは、ribbon、earrings、necklace、hair ornament、glassesなどがよく使われます。単語だけでも伝わりますが、色や形を足すとより具体的になります。red ribbon、round glasses、gold earrings、floral hair ornamentのように、形容詞を添えるとイメージが安定しやすいです。
1girl, wearing a school uniform, red ribbon, long black hair, gentle smile, classroom background服装の指定で大切なのは、キャラクターの雰囲気と背景をそろえることです。たとえば、図書館で勉強する場面ならneat uniform、カフェならcasual outfit、ファンタジーの森ならfantasy dressのように、場面と衣装が合っていると自然に見えます。逆に、背景が図書館なのに派手な戦闘衣装を指定すると、意図的な演出でない限り、画面の意味が分かりにくくなることがあります。
| 衣装カテゴリ | プロンプト例 | 相性のよい背景 | 雰囲気 |
|---|---|---|---|
| 制服 | school uniform, red ribbon | classroom, library | 青春、日常、学生 |
| カジュアル | hoodie, casual outfit | city street, cafe | 親しみやすい、現代風 |
| 清楚系 | white dress, simple dress | flower garden, forest | 柔らかい、上品 |
| ファンタジー | fantasy outfit, cloak | fantasy forest, castle | 異世界、魔法、冒険 |
| 季節衣装 | yukata, Santa Claus outfit | festival, Christmas room | イベント感、季節感 |
| 知的系 | glasses, cardigan | library, study room | 落ち着き、知的 |
服やアクセサリーを細かく指定しすぎると、生成結果で装飾が増えすぎたり、体の形が崩れたりする場合があります。重要な要素を2〜3個に絞ると、安定しやすいです。特に、frills、jewelry、floral pattern、geometric patternsなどを一度に入れると、服の情報量が増えすぎることがあります。
手に小物を持たせる場合は、holding a book、holding a fan、holding a gift box、holding a spatulaなどを使います。ただし、手と小物は崩れやすい部分でもあります。必要に応じて、bad hands、extra fingers、distorted fingersをネガティブプロンプトに入れるとよいです。小物を持たせる場合は、構図をupper bodyやcowboy shotにして、手元を大きくしすぎないほうが安定することもあります。
衣装プロンプトの具体例
1girl, school uniform, red ribbon, long brown hair, smile, classroom, sunlight, upper body1girl, white dress, flower hair ornament, gentle smile, fantasy forest, soft lighting, clean lines1girl, wearing a yukata, holding a fan, looking up at fireworks, summer festival, lantern light服装やアクセサリーを指定するときは、キャラクターの体型やポーズとの相性も意識しましょう。たとえば、full bodyで長いドレスを指定するとシルエットが見栄えしやすい一方、細かなアクセサリーは見えにくくなります。逆にclose-upやupper bodyでは、髪飾り、ピアス、リボン、眼鏡などが映えやすいです。つまり、見せたい服や小物に合わせて構図を選ぶことも重要なんですよ。
また、服装指定は著作権や商標、実在キャラクターの再現に関わる場合があります。特定作品や実在キャラクターに酷似した生成物を商用利用する場合は、権利面の確認が必要です。正確な情報は公式サイトをご確認ください。
おすすめモデルの選び方
Stable Diffusionでアニメ風の画像を安定して作るには、プロンプト以上にモデル選びが重要です。実写寄りのモデルにアニメ系の呪文を入れても、肌の質感や光の入り方がリアル寄りに残ることがあります。逆に、アニメ特化のCheckpointを使えば、短いプロンプトでもアニメ風の顔立ち、線、塗りが出やすくなります。ここ、初心者ほど見落としがちですが、かなり重要です。プロンプトをいくら調整しても理想に近づかないときは、呪文ではなくモデルの方向性が合っていない可能性があります。
アニメ系を作りたい場合は、アニメやイラストに強いCheckpointを選ぶのが基本です。代表的には、MeinaMix、Anything系、Counterfeit系、Pastel-Mix系、NoobAI-XL系など、アニメ調の作例が多いモデルが候補になります。ただし、モデルのおすすめは時期によって変わります。新しいモデルが登場したり、既存モデルが更新されたり、利用条件が変わったりすることもあるため、常に配布ページの最新情報を確認するのが安全です。
モデルを選ぶときは、名前だけで判断するのではなく、配布ページの作例を確認しましょう。特に、顔つき、線の太さ、塗り、発色、背景の描写、手の安定感はモデルによって違います。可愛い日常系が得意なモデルもあれば、ファンタジー、ダーク系、厚塗り、アニメ塗り、パステル調が得意なモデルもあります。あなたが作りたい画像と作例が近いかどうかを最優先で見ると、失敗が少なくなります。
| 確認項目 | 見るポイント | 判断の目安 |
|---|---|---|
| 顔つき | 目、輪郭、表情の傾向 | 好みのキャラクター像に近いか |
| 塗り | アニメ塗り、厚塗り、淡い塗り | 狙う画風に合っているか |
| 背景 | 背景の情報量や雰囲気 | 人物だけでなく背景も作れるか |
| 手の安定感 | 指や小物の描写 | 作例で崩れが目立たないか |
| 対応環境 | SD1.5系、SDXL系など | 自分のWebUIやPCで使えるか |
| 利用条件 | 商用利用、クレジット表記 | 目的に合った使い方が許可されているか |
モデル選びでは、作りたい絵柄に近い作例があるかを最優先で確認してください。プロンプトで無理に寄せるより、最初から方向性の合うモデルを使う方が早く安定します。特にアニメ塗り、淡いパステル調、ダークファンタジー、ギャルゲー風などは、モデルの個性が強く出ます。
モデル選びでよくある失敗
よくある失敗は、「人気モデルだから自分の目的にも合う」と考えてしまうことです。人気モデルでも、あなたが作りたい絵柄と違えば、プロンプト調整に時間がかかります。また、SD1.5系とSDXL系では、必要なPCスペックや推奨解像度、LoRAの互換性も変わります。SD1.5用のLoRAをSDXLモデルでそのまま使えない場合もあるため、モデルの系統は必ず確認しましょう。
モデルの配布ページでは、ライセンス、推奨設定、トリガーワード、VAEの推奨、商用利用の可否などが書かれていることがあります。画像を公開したり、商用利用したりする場合は、必ず利用条件を確認してください。
また、モデルの利用条件も確認が必要です。商用利用の可否、クレジット表記、派生モデルの扱いなどはモデルごとに異なります。正確な情報は公式サイトをご確認ください。特に、企業利用、広告利用、販売素材、同人活動などに使う場合は、ライセンスの読み違いがトラブルにつながる可能性があります。費用や権利に関わる部分は、慎重に判断するのがおすすめです。
プロンプトがうまく効かないときは、モデルを変えるだけで一気に改善することもあります。アニメ風にしたいのにリアル寄りになる、アニメ塗りが弱い、顔が好みと違う、背景が苦手といった場合は、プロンプトを足す前にモデルの方向性を見直してみてください。Stable Diffusionでは、呪文、モデル、LoRA、設定の全部が結果に関わるため、ひとつの要素だけで解決しようとしないのがコツです。
LoRAとチェックポイント

Checkpointは画像全体の土台を決めるモデルで、LoRAは特定の絵柄、キャラクター性、服装、ポーズ、塗りなどを追加するために使う補助モデルです。アニメ風の画像生成では、この2つの役割を分けて理解すると失敗しにくくなります。ここ、最初は少しややこしいですよね。ざっくり言うと、Checkpointは「画風のベース」、LoRAは「追加の味付け」です。アニメ向けのCheckpointを土台にして、必要に応じてアニメ塗りLoRA、衣装LoRA、ポーズLoRAなどを重ねるイメージで考えると分かりやすいです。
たとえば、Checkpointでアニメ向けの土台を選び、LoRAでアニメ塗り、特定の衣装、表情、ポーズなどを追加します。アニメ塗りが弱い場合は、アニメ塗り向けLoRAを使うことで、flat colorやcell shadingの効果を補いやすくなる場合があります。また、服装LoRAを使えば、プロンプトだけでは再現しにくい複雑な衣装を出しやすくなることもあります。
LoRAを使う際は、Weightを強くしすぎないことも大切です。強すぎると絵柄が崩れたり、顔が似すぎたり、衣装が意図せず固定されたりすることがあります。一般的な目安としては、まず0.4〜0.8程度から試し、結果を見ながら調整すると扱いやすいです。ただし、これはあくまで目安です。LoRAによっては0.3でも十分強く出るものもあれば、1.0近くまで上げないと分かりにくいものもあります。
| 項目 | Checkpoint | LoRA |
|---|---|---|
| 役割 | 画像全体のベースを決める | 特定の特徴を追加する |
| 影響範囲 | 絵柄、塗り、顔、背景全体 | 衣装、キャラ性、画風、ポーズなど |
| 使い方 | 生成前にモデルとして選択 | プロンプト内やUIで読み込む |
| 注意点 | 目的に合う作例を確認する | Weightを強くしすぎない |
| 相性 | SD1.5系、SDXL系などがある | 対応する系統を合わせる必要がある |
LoRAの適切な強さは、モデルやLoRAの設計によって変わります。数値はあくまで一般的な目安であり、必ず同じ結果になるものではありません。うまくいかない場合は、Weightを0.1刻みで調整し、顔、服、背景への影響を見比べるのがおすすめです。
また、LoRAにはトリガーワードが設定されていることがあります。配布ページに指定の単語がある場合は、それをプロンプトへ入れないと効果が出にくい場合があります。Checkpoint、LoRA、VAE、プロンプトの組み合わせで結果が変わるため、設定を一つずつ変えて検証するのがおすすめです。複数のLoRAを同時に使う場合は、互いの効果がぶつかることもあります。たとえば、アニメ塗りLoRAと厚塗りLoRAを同時に使うと、狙いが曖昧になるかもしれません。
LoRAを使うときの実践手順
まずはCheckpointだけで基本プロンプトを生成し、土台の絵柄を確認します。次にLoRAをひとつだけ追加し、Weightを0.5前後から試します。この時点で大きく崩れるなら、Weightを下げるか、Checkpointとの相性を疑います。問題なければ、必要に応じて2つ目のLoRAを追加します。複数LoRAを入れる場合は、どのLoRAがどの効果を出しているのか分かるように、ひとつずつ追加して比較するのが安全です。
LoRAは便利ですが、頼りすぎるとプロンプトの自由度が下がることもあります。特定の顔、衣装、構図に引っ張られすぎる場合は、Weightを下げる、トリガーワードを減らす、別のLoRAを試すなどの調整をしてみてください。
LoRAやCheckpointを使う際も、利用条件の確認は欠かせません。特に配布モデルには、商用利用禁止、再配布禁止、特定用途禁止などの条件がある場合があります。画像生成そのものだけでなく、生成物の公開や販売に関わる部分は慎重に見ましょう。
高画質化の設定ポイント
Stable Diffusionでアニメ画像を高画質に見せるには、プロンプトだけでなく、生成サイズ、Hires.fix、アップスケーラー、サンプリングステップ、CFG Scaleなどの設定も関係します。ここ、かなり誤解されやすいところです。プロンプトに8kやhigh resolutionと入れれば画像サイズが勝手に大きくなるわけではありません。実際の出力サイズは、WebUIやAPIで指定したwidth、height、アップスケール倍率などで決まります。プロンプトは見た目の方向性、設定は実際の処理条件、と分けて考えると分かりやすいですよ。
プロンプトにhigh quality、ultra-detailed、sharp focusを入れると、見た目の方向性は高精細に寄りやすくなります。ただし、実際の画像サイズは設定で決まるため、プロンプトだけで解像度が上がるわけではありません。ここは誤解しやすいポイントです。たとえば、512×768で生成した画像に8kというキーワードを入れても、画像ファイル自体が8Kサイズになるわけではありません。細部が描き込まれる可能性はありますが、ピクセル数とは別物です。
Hires.fixは、低めの解像度で生成した画像を拡大しながら再描画する機能です。アニメ系では、顔や目、髪のディテールを整えやすくなる一方で、denoising strengthを上げすぎると元の構図や顔つきが変わることがあります。たとえば、最初の絵はよかったのにHires.fix後に顔が変わる、手が増える、背景が別物になるといったこともあります。その場合は、denoising strengthを下げたり、アップスケール倍率を控えめにしたりすると安定しやすいです。
| 項目 | 一般的な目安 | 注意点 | 調整の考え方 |
|---|---|---|---|
| Sampling steps | 20〜30前後 | 増やせば必ず良くなるわけではない | 時間と品質のバランスを見る |
| CFG Scale | 5〜8前後 | 高すぎると硬い絵になりやすい | プロンプト追従と自然さを調整する |
| Hires.fix | 1.5〜2倍程度 | 環境によって処理負荷が増える | まず控えめな倍率で試す |
| Denoising strength | 0.3〜0.5前後 | 高すぎると絵が変わりやすい | 顔や構図が変わるなら下げる |
| VRAM | 12GB以上が扱いやすい場合が多い | 用途やモデルにより必要量は変わる | SDXLや高解像度では多いほど安心 |
| 画像サイズ | モデル推奨に合わせる | 大きすぎると崩れやすいことがある | SD1.5系とSDXL系で分けて考える |
VRAMについては、SD1.5の通常生成なら比較的軽い環境でも動く場合がありますが、SDXL、高解像度、Hires.fix、LoRA学習などを快適に使う場合は、より多いVRAMがあると安心です。数値はあくまで一般的な目安であり、利用するWebUI、モデル、解像度、拡張機能によって変わります。たとえば、同じ画像サイズでも、複数のLoRAやControlNetを使うと必要なメモリが増えることがあります。
高画質化で優先したい順番
私なら、まずはモデルに合った解像度で普通に生成し、構図と顔が安定するかを確認します。次に、必要であればHires.fixを使い、拡大後の顔や手の崩れを見ます。それでも細部が足りない場合に、アップスケーラーや追加修正を検討します。最初から大きなサイズで無理に生成すると、時間もVRAMも使いますし、構図が崩れやすくなることもあります。まずは安定する設定を見つけてから、少しずつ高画質化するのがおすすめです。
4kや8kなどのプロンプトは、実際の出力サイズを保証するものではありません。高解像度の画像が必要な場合は、生成設定、Hires.fix、アップスケーラー、書き出しサイズを確認しましょう。印刷や商用素材として使う場合は、用途に必要な解像度も事前に確認しておくと安心です。
また、高画質化はPCへの負荷や費用にも関係します。高性能GPUを用意すれば快適になる可能性はありますが、価格は時期や在庫、用途によって変わります。クラウド環境を使う選択肢もありますが、こちらも料金体系や利用規約の確認が必要です。費用やPC購入に関わる判断は、価格相場や用途によって大きく変わります。正確な情報は公式サイトをご確認ください。
高画質化で大切なのは、プロンプト、モデル、設定を別々に見直すことです。顔がぼやけるならdetailed eyesやADetailer、全体が粗いならHires.fixやアップスケール、絵柄が違うならCheckpointやLoRA、背景がうるさいならプロンプト整理とネガティブプロンプト、というように原因を分けて考えると改善しやすいです。闇雲にタグを増やすより、どの問題を直したいのかを明確にするのが近道ですよ。
Stable Diffusionアニメプロンプト例まとめ

Stable Diffusionのアニメプロンプト例を使いこなすには、単語をたくさん覚えるよりも、プロンプトの役割を分けて考えることが大切です。品質タグで完成度の方向性を作り、anime styleやflat colorで画風を決め、キャラクター外見、表情、ポーズ、服装、背景を必要な分だけ追加していきます。ここまで読むと、プロンプトは単なる呪文ではなく、画像の設計図に近いものだと分かるかと思います。あなたが作りたい絵を「品質、画風、人物、構図、背景、除外要素」に分けて言語化できれば、生成結果はかなり調整しやすくなります。
基本形としては、次のようなプロンプトから始めると扱いやすいです。
masterpiece, best quality, anime style, clean lines, vibrant colors, 1girl, detailed eyes, smile, upper body, looking at viewer, simple backgroundこの基本形は、アニメ風のキャラクターを作るための最小構成に近いテンプレートです。ここに、blue hair、school uniform、library background、warm lightingなどを足せば、具体的なキャラクターやシーンに変えられます。逆に、うまくいかないときは、この基本形まで戻して、何を足した瞬間に崩れたのか確認すると改善しやすいです。
ネガティブプロンプトは、低品質、人体崩れ、文字やロゴ、写実的すぎる要素を必要に応じて除外します。たとえば、次のような形です。
low quality, worst quality, blurry, bad anatomy, bad hands, extra fingers, missing fingers, text, watermark, realistic, photorealistic, 3D renderただし、ネガティブプロンプトも入れすぎると、必要な表現まで弱くなることがあります。アニメ塗りを狙うならrealisticや3D renderを避けるのは有効ですが、セミリアルなアニメ調を狙う場合は、realisticを入れないほうがよいこともあります。つまり、ネガティブプロンプトは固定ではなく、作りたい画像に合わせて変えるものです。
| 作りたい画像 | 追加したいプロンプト | ネガティブの考え方 |
|---|---|---|
| アニメ塗りの女の子 | flat color, cell shading, clean lines | realistic, 3D renderを避ける |
| 図書館で勉強 | studying, library, bookshelves, holding a pen | lazy, messy backgroundを必要に応じて避ける |
| カフェでくつろぐ | cozy cafe, warm lighting, relaxing | crowded backgroundを避ける |
| 花火を見る浴衣キャラ | yukata, fireworks, summer festival, night sky | bad hands, distorted fingersを入れる |
| ファンタジー系 | fantasy outfit, glowing forest, magical atmosphere | modern city, realistic photoを避ける |
Stable Diffusionのプロンプト例でアニメ画像を作るなら、まず短い基本テンプレートを作り、結果を見ながら一つずつ足す方法が最も安定します。モデル、LoRA、ネガティブプロンプト、高画質化設定を分けて調整すると、失敗の原因を見つけやすくなります。
最後に押さえたい実践フロー
まず、アニメ向けのCheckpointを選びます。次に、短い基本プロンプトでキャラクターの顔や塗りが好みに合うか確認します。その後、髪型、表情、服装、背景をひとつずつ追加します。崩れが出たら、ネガティブプロンプトや構図を調整します。仕上げに、Hires.fixやアップスケーラーで高画質化を試します。この順番で進めると、どこで失敗したのか分かりやすく、修正もしやすいです。
最初は思い通りに出ないこともありますが、キャラクター、背景、塗り、構図を分けて調整すれば、狙ったアニメ風イラストに近づけやすくなります。あなたの環境に合うテンプレートを保存し、少しずつ改善していきましょう。Stable Diffusionは、同じプロンプトでも環境やモデルによって結果が変わるため、完璧な正解を探すより、自分の制作環境で安定する型を作ることが大切です。生成結果を見ながら、不要な単語を削り、効いた単語を残していけば、あなた専用のアニメプロンプト例集ができていきますよ。
なお、公開や商用利用を前提に画像を作る場合は、使用モデルやLoRAのライセンス、生成サービスの利用規約、素材の権利関係を必ず確認してください。正確な情報は公式サイトをご確認ください。


