TOP 技術ブログ ふーしー編集長のAIラボ 第2回 生成AIのプロンプトを知る
AI技術ブログ

ふーしー編集長の
AIラボ

ChatGPTが登場して早や3年!
いまどきの
生成AIの傾向を学ぶ!

第2回 生成AIのプロンプトを知る 2025.09.04

前回は「生成AIを振り返る」という内容でした。

第2回はプロンプトを解説したいと思います。プロンプトは生成AIに対する「指示書」のような役割を果たします。
この「指示書」は、その器と器に入れる内容に分けられます。

まず器の部分です。入れ物ですね。
例えば「300円でお菓子を袋に詰め放題」といったサービスはお得だし、遊び心もあって楽しいですよね。
例えて言うと次のようなことが言えます。
【袋】プロンプトの器
【お菓子】プロンプトの指示内容

まずプロンプトの器ですが、お菓子を詰める袋の同じようにサイズが決まっています。
このサイズを越えてお菓子を入れることはできません。
プロンプトも器のサイズを越えて生成AIへの質問や指示を書き込むことができないのです。
このプロンプトのサイズを「コンテキストウィンドウサイズ」とか「コンテキストサイズ」と呼びます。
難しい言葉ですね。お菓子詰め放題の袋の大きさ、と思っていただければOKです。
主要な生成AIのコンテキストウィンドウサイズの代表的な仕様は次の通り。

# 生成AI(LLM)モデル コンテキストウィンドウサイズ
(お菓子詰め放題の袋の大きさ)
1 GPT-3.5 Trubo(OpenAI) 4,096トークン
2 GPT-4(OpenAI) 8,192トークン
3 Llama2(Meta) 8,192トークン
4 GPT-4 Turbo(OpenAI) 128,000トークン
5 GPT-4o(OpenAI) 128,000トークン
6 Claude 3 sonnet(Anthropic) 200,000トークン
7 Gemini1.5Flash(Google) 1,000,000トークン

※トークン: 生成AIが処理できる単語/文章の最小単位。
文字数とは少し違いますが文字数という認識でもOKです。

2023年にOpenAI社のChatGPTが登場しました。
この時の「お菓子詰め放題の袋の大きさ」は4096トークンとまだ小さく、たくさんお菓子を袋に詰め込むと袋から溢れてしまうので、回答できなくなってしまっていました。
現在はGoogle社の生成AI「Gemini(ジェミニ)」は100万トークンという大きな「お菓子詰め放題の袋」になっています。
たくさん、お菓子を詰め込むことができますね。これは利用者の満足度があがりますね。
生成AIの場合も大きいトークン数をサポートしていると生成AI利用の満足度が上がりやすいと思います。

さて、「トークン」ってなんだ?という話をします。
「お菓子詰め放題」で例えると様々な種類、大きさのお菓子(チョコレート、ガム、飴、ビスケット、etc)がトークンです。
「お菓子詰め放題」のお菓子は袋に入れる際の最小単位ですね。トークンは、生成AIのモデルがテキストを処理する際の単位です。
面白いことに、英語の場合と日本語ではトークンの扱いが異なります。(例:米国製お菓子は大きいサイズだからすぐに袋がいっぱい!みたいな)

トークンを例題を示して説明します。

米国製お菓子は大きいサイズだからすぐに袋がいっぱい!
みたいな事でなく、生成AIは、日本語の場合、英語に比べてたくさんトークンが必要っていう話ですね。

トークンのまとめ

  1. AIが言葉を理解する最小単位: 単語全体だったり、単語の一部だったり、句読点だったり、いろんな形があります。
  2. 効率よく理解するため: AIは、文字を一つずつ読むよりも、意味のある”かたまり“(トークン)で処理する方が、効率よく学習したり、文章を作ったりできるのです。
  3. 生成 AIによって分解の仕方が違う: 生成AIの種類(ChatGPTとかGeminiとか)によって、同じ文章でもトークンの分け方が違うことがあります。これは、それぞれの生成AIが持っている「言葉のルールブック」が違う、と考えた方がよさそうです。
  4. 文字の数とトークンの数は違う: 特に日本語は、文字数は少なくてもトークン数が多くなることがあります。

次に「生成AIのプロンプトを工夫する」について解説しますね。
生成AIへのプロンプト入力を工夫することは、生成AIにハルシネーションという間違いやもっともらしいウソを回答させない、そして期待する結果を得やすくなります。

  • ・プロンプトの要素を理解する(ルールや手順を決めておくといいね、ということです)
  • ・プロンプトの型を理解する(囲碁や将棋の「定石」みたいなものです)

プロンプトの要素:
プロンプトには何を書き込んだら効果的か?質問や依頼事項は思い浮かびますよね?
そのほかには下記のような要素を書き加えることが効果的です。

# プロンプトの要素 Note
1 入力(Input)を与える 日本で一番高い山は? 質問や依頼事項を書く
2 役割(Role)を与える あなたはデータ分析の専門家です LLMは与えられた役割になりきって回答する
3 指示(instruction)を与える 次の文章を要約してください 強めの依頼事項
4 追加情報(content)を与える 次の故障記録から故障の傾向を分析してください
・モーター回転数 nnnn/S
・異常音 nnn/Hz


・LLMが学習していない情報/知らない情報(業務情報など)を与える
・LLMに知識がなくてもこの情報を基に回答生成できる
5 出力形式(format)を与える ・結果は箇条書きでお願いします
・400文字以内で回答してください
・JSON形式で出力してください
・CSV形式で出力してください
出力形式を指示できる

プロンプトの要素!って言われると小難しいですね。
自分なりの規則とかルールと考えればいいと思います。
「やることリスト」みたいなテンプレート感覚で生成AIのプロンプトに与える基本ルール、マイルールと考えればいいと思います。

プロンプトの型:
プロンプトには型があります。プロンプトエンジニアリングとも呼ばれています。
将棋に例えると定石のようなものですね。

プロンプトにおける「型」は、将棋の「定石」のように、「効果的であることが知られている、再利用可能なプロンプトのパターンや書き方」と言えます。
将棋で定石を学ぶことが上達への近道であるように、プロンプトの型を学ぶことは、生成AIを使いこなす上で非常に強力な武器になります。

プロンプトの型として主なものを次に示します。
またまた小難しいものがでてきましたね。でもこういったモノがあるというくらいの認識でいいと思います。

# プロンプトの型 内容
1 zero-shot prompting タスクの例を一切与えず、指示だけでタスクを実行させる手法
2 few-shot prompting いくつかの例(shot)を指示してから、本題の指示を出す手法
3 Chain-of-Thought Prompting(CoT) 答えだけでなく、そこに至るまでの思考プロセスも出力させる手法
4 Zero-shot CoT 思考プロセスの一例を一切見せずに、「ステップバイステップで考えてください」のような指示を追加するだけで、論理的な思考を促す手法
5 Self−Consistency 同じプロンプトを複数回実行し、その中で最も多く得られた回答を最終的な答えとして採用する手法
6 Generate Knowledge Prompting 質問に直接答える前に、まずAI自身に関連知識を生成させ、その知識をヒントとして最終的な回答を作成させる二段階の手法
7 ReAct AIが「思考(Reason)」と「行動(Act)」を繰り返すことで、複雑な問題を解決するフレームワーク。単なるプロンプト技術というより、AIエージェントの高度な動作原理

二つのよく使うもの、知っていると便利なものだけ紹介します。

はい、第2回はここまでになります。

第3回は「業務で使う」といった視点でお話ししたいと思います。