「ChatGPTと長く会話していたら、さっき伝えた内容を忘れられてしまった」
「長い文章を貼り付けたら、後半がうまく処理されなかった」。
生成AIを使っていて、こんな経験はありませんか。その背景には、コンテキストウィンドウという生成AIの仕組みが関係しています。
この記事では、生成AIを業務で使い始めた方に向けて、コンテキストウィンドウとは何か、なぜ会話を忘れることがあるのか、そして実務でどう付き合えばよいのかを、専門用語をかみ砕いて解説します。
仕組みを知っておくと、生成AIをぐっと使いこなしやすくなります。
AIと長い相談してたら、最初の方の話忘れられることあるヨネ
この記事の対象読者
- 仕事で生成AIを使い始めた、または使いこなしたい方
- AIが会話の内容を忘れてしまう理由を知りたい方
- 長い文章や大量の資料をAIに扱わせたい方
コンテキストウィンドウとは?AIが一度に「覚えていられる」量
コンテキストウィンドウとは、生成AIが一度に処理し、記憶していられる情報量の上限のことです。
「コンテキスト長」と呼ばれることもあります。
人間にたとえると「一度に覚えていられる会話の長さ」や「作業机の広さ」のようなものだと考えると、イメージしやすいでしょう。
机が広ければたくさんの資料を一度に広げて作業できますが、机が狭ければ古い資料を片付けないと新しい資料を置けません。
生成AIも同じで、このコンテキストウィンドウの範囲内であれば、入力した内容を踏まえて適切に応答できますが、コンテキストウィンドウの範囲を超えると古い情報からあふれていってしまいます。
重要なのは、この「情報量」には、あなたが入力した文章だけでなく、AIが出力した回答も含まれるという点です。会話を続けるほど、やり取り全体が積み重なってコンテキストウィンドウを消費していきます。
情報量の単位「トークン」とは
コンテキストウィンドウの大きさは、「トークン」という単位で表されます。
トークンとは、AIが文章を処理するときに扱う、テキストの最小単位のことです。
人間にとっての最小単位が1文字であるのに対し、AIは単語や文字の断片といったトークンを単位に文章を読み書きしています。
日本語の場合、おおよその目安として、1文字がおよそ1〜3トークンに相当するとされています。
ひらがなは1文字あたり1トークン程度、漢字は2〜3トークンになることもあり、文字の種類によって幅があります。
あくまで概算ですが、感覚をつかむための目安として整理すると、次のようになります。
| テキスト | おおよそのトークン数の目安 |
|---|---|
| 日本語のひらがな1文字 | 約1トークン |
| 日本語の漢字1文字 | 約2〜3トークン |
| 英語の単語1つ | 約1トークン |
つまり、「コンテキストウィンドウが◯◯トークン」とは、「AIが一度に扱えるトークンの量が◯◯まで」という意味になります。トークン数が大きいほど、より長い文章や多くの資料を一度に扱えるということです。
なぜAIは会話を「忘れる」のか
長く会話を続けていると、AIが最初のほうに伝えた内容を忘れてしまうことがあります。
これは、AIの性能が悪いわけではなく、コンテキストウィンドウの仕組みによるものです。
会話のやり取りが積み重なり、その合計がコンテキストウィンドウの上限に近づくと、古い情報から順番にウィンドウの外へ押し出されていきます。
机の上がいっぱいになって、古い資料を端に追いやるのと同じイメージです。
押し出された情報はAIの「視界」から外れるため、結果として「さっき言ったことを忘れた」ように見えるのです。
特に重要な前提や指示は、会話が長くなってきたら改めて伝え直すと、AIが意図を取り違えにくくなります。
なお、コンテキストウィンドウはあくまで「1つの会話の中で覚えていられる範囲」であり、別の会話(チャット)を新しく始めると、原則として前の会話の内容は引き継がれない点にも注意が必要です。
最近はどのAIもアップデートによってコンテキストウィンドウが大きくなってきている傾向はあるよ。
コンテキストウィンドウは「大きいほどいい」とは限らない
「それなら、コンテキストウィンドウは大きいほど良いのでは」と思うかもしれません。
確かに、大きいほど長い文章や大量の資料を一度に扱えるという明確なメリットがあります。
長い契約書の要約や、複数の資料をまとめて分析させたい場合には、大きなコンテキストウィンドウが役立ちます。
一方で、いくつか知っておきたい注意点もあります。
ひとつは、処理する情報量が増えるほど計算の負荷が高まり、応答に時間がかかったり、利用コストが増えたりすることです。
もうひとつは、情報を詰め込みすぎると、AIがどの情報に注目すべきか分散してしまい、かえって肝心な点を見落とす場合があることです。
大きなコンテキストウィンドウを持つモデルであっても、不要な情報まで詰め込むより、必要な情報を整理して渡すほうが、精度の高い回答を得やすくなります。
なお、具体的なコンテキストウィンドウのサイズは、生成AIのサービスやモデルのバージョンによって大きく異なり、技術の進歩とともに頻繁に更新されています。
最新の数値を知りたい場合は、利用しているサービスの公式情報を確認することをおすすめします。
【ポイント】
コンテキストウィンドウは大きければ良いというわけではない
業務で上手に付き合うためのコツ
仕組みを踏まえて、実務でコンテキストウィンドウと上手に付き合うコツを紹介します。
まず、長い会話で重要な前提があるときは、適宜その内容を要約して伝え直すと、AIが取り違えにくくなります。
次に、話題が大きく変わるときや、これまでの文脈を引きずりたくないときは、新しい会話(チャット)を始めるのも有効です。
そして、大量の資料を扱わせたい場合は、関係のある部分に絞って渡すことで、コストを抑えつつ精度も保ちやすくなります。
まとめ:仕組みを知れば、AIはもっと使いこなせる
最後に、この記事のポイントを振り返ります。
コンテキストウィンドウとは、生成AIが一度に処理・記憶できる情報量の上限のことで、その大きさはトークンという単位で表されます。
会話のやり取りが上限を超えると古い情報から押し出されるため、AIが会話を忘れたように見えることがあります。
そして、コンテキストウィンドウは大きいほど良いとは限らず、コストや注意の分散といった側面も理解しておくことが大切でした。
この仕組みを知っておくと、「なぜ忘れるのか」「どう情報を渡せばよいのか」が見えてきて、生成AIをより的確に使いこなせるようになります。
重要な情報は整理して伝える、話題が変わったら会話を切り替える。こうした小さな工夫の積み重ねが、AI活用の質を大きく左右します。
よくある質問(FAQ)
- コンテキストウィンドウとトークンの違いは何ですか?
-
トークンはAIが文章を処理する最小単位で、コンテキストウィンドウはそのトークンを一度にどれだけ扱えるかという「容量」を指します。トークンが文字の単位、コンテキストウィンドウが机の広さ、とイメージするとわかりやすいでしょう。
- なぜAIは会話の内容を忘れてしまうのですか?
-
会話のやり取りが積み重なってコンテキストウィンドウの上限を超えると、古い情報から順に範囲外へ押し出されるためです。重要な前提は、会話が長くなったら改めて伝え直すとよいでしょう。
- 入力した文章だけがコンテキストウィンドウを消費するのですか?
-
いいえ。あなたが入力した文章だけでなく、AIが出力した回答も含めて消費されます。会話を続けるほど、やり取り全体が積み重なって容量を使っていきます。
- コンテキストウィンドウは大きいほど良いのですか?
-
長い文章を扱えるメリットがある一方、コストの増加や、情報を詰め込みすぎることで注意が分散するといった側面もあります。必要な情報を整理して渡すほうが、精度の高い回答を得やすくなります。
- 日本語の1文字は何トークンになりますか?
-
おおよその目安として、ひらがなは1文字あたり約1トークン、漢字は約2〜3トークンとされています。文字の種類によって幅があり、あくまで概算である点にご注意ください。
参考リンク
