メインコンテンツへスキップ
A
プロンプト

画像生成プロンプトの作り方 — 思い通りの画像を出す書き方とコツ

主題・スタイル・構図・光・品質指定。画像生成 AI で狙った絵を出すためのプロンプトの組み立て方を実例つきでまとめました。

#プロンプト#画像生成#デザイン

思い通りの画像を出すための前提

画像生成AIで「なんか惜しい」画像しか出ないとき、原因の多くはモデルの性能ではなくプロンプトの設計にあります。生成AIは入力された言葉を手がかりに、学習した膨大な画像の中から「それらしい組み合わせ」を再構成しているにすぎません。だからこそ、何を・どんなスタイルで・どう配置して・どんな光で・どの品質で描くのかを、こちらが明示的に指定するほど結果は安定します。逆に「かわいい猫の絵」のような曖昧な指示では、モデルの「平均値」に引っ張られて凡庸な画像になります。

この記事では、Midjourney・DALL·E・Stable Diffusion に共通する画像生成プロンプトの組み立て方を、具体的な単語例とともに解説します。

画像生成プロンプトの基本構造

良いプロンプトは、おおよそ次の6要素を順番に積み上げて作られています。

要素役割
主題(Subject)何を描くかa young woman, a wooden cabin, a red sports car
スタイル(Style)画風・媒体oil painting, anime style, photorealistic, 3D render
構図(Composition)視点・画角close-up, wide shot, bird's-eye view, rule of thirds
光(Lighting)光源と雰囲気golden hour, soft diffused light, neon glow
画質・品質(Quality)解像度・質感highly detailed, 8K, sharp focus
ネガティブ要素描いてほしくないもの(blurry, extra fingers, text)

主題だけを書いて終わらせず、最低でも「主題+スタイル+光」までは指定するのが、平凡さから抜け出す最初の一歩です。

要素別の書き方と単語例

主題は「具体名詞+状態+行動」で

「dog」より「a golden retriever puppy running through tall grass」のように、種類・状態・動作まで踏み込みます。人物なら年齢・服装・表情(a middle-aged man, wearing a navy suit, smiling softly)を添えると破綻が減ります。

スタイルは媒体と作家性で指定

  • 媒体: watercolor(水彩)、charcoal sketch(木炭画)、cinematic photo(映画調写真)
  • 時代・流派: Art NouveauBauhausukiyo-e(浮世絵)
  • 質感: matteglossyfilm grain

特定の存命作家名を入れる手法は、規約や著作権の観点から避け、画風を表す一般語(impressionist など)で代替するのが無難です。

構図と光で「写真らしさ」を出す

構図は low angle(ローアングル)、over-the-shoulder(肩越し)、macro(接写)など、カメラ用語が効きます。光は時間帯(golden hourblue hour)と質(backlit逆光、rim light縁光)を組み合わせると立体感が出ます。写真寄りなら shot on 35mmf/1.8bokeh のようなレンズ表現も有効です。

実際のプロンプト例

英語(写真調・人物ポートレート):

Portrait of a Japanese woman in her 30s, short black hair,
wearing a beige trench coat, standing on a rainy Tokyo street at night,
cinematic photo, shot on 35mm, f/1.8, shallow depth of field,
neon reflections, blue hour, highly detailed, sharp focus
--ar 3:4
Negative: blurry, distorted hands, extra fingers, watermark, text

日本語(イラスト調・風景)。日本語対応モデルや翻訳を挟む場合の例です。

主題: 朝霧に包まれた山あいの茅葺き屋根の集落
スタイル: 水彩画風、淡い色調、輪郭はやわらかく
構図: 俯瞰、遠景に山の稜線
光: 朝日の逆光、霧に光が透ける
品質: 高精細、繊細な筆致
除外: 人物、文字、過度な彩度

英語の方が学習データが豊富で意図が通りやすいため、細部にこだわるときは英語、ニュアンス重視なら日本語、と使い分けると効率的です。

仕上がりを安定させるコツ

  • アスペクト比を最初に決める: SNS縦長は 3:49:16、バナー横長は 16:9。後からトリミングするより、生成時に指定した方が構図が破綻しません。
  • 参照画像(image prompt)を使う: 構図や色味を言葉で説明しきれないときは、参考画像を添えて「これに寄せて」と指示すると一発で近づきます。
  • 一度で完成させない: 1枚目を「叩き台」と割り切り、気になる箇所だけ単語を足し引きして反復します。「服を赤に」「もっと広角に」と1要素ずつ変えると、何が効いたか分かります。
  • 強調と除外を使い分ける: 重要語を前方に置く、または重み付け構文((word:1.3) など)で強める一方、不要物はネガティブプロンプトで明示的に排除します。

ツール別の留意点

ツール得意プロンプトの癖
Midjourney芸術性・質感--ar --style などパラメータ指定。短めの語句でも美しく仕上がる
DALL·E自然文の理解文章で情景を説明する書き方が得意。文字の描画も比較的強い
Stable Diffusion細かい制御重み付け・ネガティブプロンプト・LoRA など制御幅が広い反面、記述は最も技術的

同じプロンプトでも出力傾向は大きく異なります。ツールを乗り換えたら、まずは短いプロンプトで「そのモデルの素直な反応」を確かめてから盛り付けるのがコツです。

著作権・商用利用の注意

  • 生成画像の著作権・利用範囲は各サービスの規約で異なります。商用利用前に必ず最新の利用規約を確認してください。
  • 既存キャラクター名・ブランド名・存命作家名をプロンプトに入れて生成した画像は、権利侵害リスクがあります。業務利用では避けるのが安全です。
  • 実在人物の顔を再現する用途は、肖像権・パブリシティ権の問題が生じます。

まとめ

思い通りの画像を出す鍵は、主題・スタイル・構図・光・品質・除外という6要素を意識的に積み上げ、1要素ずつ反復改善することです。最初から完璧を狙わず、「叩き台→微修正」のサイクルを回せば、どのツールでも狙った絵に近づけられます。さらに踏み込んだテクニックは画像生成プロンプト特集でも掘り下げています。

実務で使えるプロンプトをゼロから組むのは手間がかかります。equaliA では、現場のクリエイターが実際に成果を出した画像生成プロンプトを売買できます。用途に合うテンプレートを探したい方は、販売中のプロンプト一覧をのぞいてみてください。「AIのノウハウを、みんなで等しく」——誰かの試行錯誤の結晶を、あなたの制作の出発点にしてください。

AI のノウハウを、買う・売る

equaliA は、現役ユーザーが磨いた AI プロンプト・Skill・ノウハウを 1 件から売買できるマーケットプレイスです。気になるノウハウを探すのも、あなたの知見を出品するのも無料で始められます。