AMAZON でお買物

AIT 界に激震!トークン数 92% 削減も可能な「Chain of Draft」が従来の常識を覆す

AI

はじめに

近年、AIの進化は目覚ましく、特に大規模言語モデル(LLM)は複雑な問題を解く能力を飛躍的に向上させています。
その中でも「Chain of Thought(CoT)」という手法は、AIが問題を段階的に考えることで、より正確な答えを導き出せることを示しました。

しかし、CoT には問題もあります。
AIが一つの問題を解くのに大量のテキストを生成し、処理時間もコストもかかってしまうという点です。
人間が問題を解く際には、すべての思考過程を言葉にするわけではなく、重要なポイントだけをメモに残しながら進めることが一般的です。
そこで登場したのが、新しいアプローチである「Chain of Draft(CoD)」です。

この手法では、AIが考える際のメモを最小限にすることで、より効率的に問題を解決できるようになります。
無駄な情報を削ぎ落とし、必要な部分だけを簡潔にまとめることで、計算コストや処理時間を大幅に削減しつつ、正確性を維持することが可能になります。
AIの運用コストを抑えつつ、処理の迅速化が求められる現代において、CoD は非常に有効な手法となるでしょう。

Chain of Draft(CoD)とは?

「Chain of Draft」とは、AIが考える過程をシンプルにまとめ、必要最小限の情報のみを保持しながら問題を解決する手法です。
従来の「Chain of Thought」では、AIが細かいステップごとに詳細な説明を行いながら問題を解いていましたが、そのプロセスには多くの冗長な部分が含まれていました。
CoD では、考え方の本質をとらえ、極力シンプルに表現することで、より迅速に結論へと到達することを可能にします。
具体的には、各思考ステップを5語以下に制限するガイドラインを用いています。

例えば、ある数学の問題を考えてみましょう。
太郎は20個のキャンディを持っていましたが、いくつかを花子にあげた結果、12個になりました。
では、花子にあげたキャンディの数はいくつでしょうか?

従来の Chain of Thought では、太郎が最初に持っていたキャンディの数から、現在の個数を引くというプロセスを詳細に説明しながら解答に至ります。
しかし、Chain of Draft では「20 – x = 12。したがって、x = 8」という最小限のステップで簡潔に答えを導き出すことができます。
このように、不要な説明を削ることで、思考の効率を大幅に向上させることが可能になります。

CoD のメリット

この手法の最大のメリットは、処理速度の向上です。
従来の CoT では、AIが長い文章を生成しながら思考を進めるため、時間がかかっていました。
しかし、CoD を採用することで、AIが短いプロセスで問題を解決できるため、応答速度が格段に速くなります。

さらに、計算コストの削減も大きな利点です。
AIの運用においては、生成されるテキストの量(トークン数)が増えるほどコストも増加します。
CoD では、余計な言葉を減らすことで、コストを抑えつつ高精度な回答を提供することが可能になります。

また、正確性を保ちつつ、よりシンプルに問題を解決できる点も魅力的です。
長々とした説明がなくても、必要な情報を適切に整理しながら回答することで、精度を損なうことなく短時間で最適な解答を得ることができます。
特に、リアルタイムでの応答が求められるAIアシスタントやチャットボットでは、CoD の導入が大きな効果を発揮するでしょう。

実験結果

実際にAIモデルを使って CoD の効果を検証したところ、驚くべき結果が得られました。
例えば、GPT-4o においては、従来の CoT を用いた場合、正答率は 95.4% であったものの、1回の回答に平均 205.1 トークンを使用し、処理に 4.2 秒かかっていました。
一方、CoD を適用すると、正答率は 91.1% とほぼ同じ水準を維持しながら、トークン数は 43.9 に削減され、処理時間も 1.0秒に短縮されました。
Claude 3.5 においても同様の傾向が見られ、トークン数と処理時間の大幅な削減が確認されました。

このような結果から、CoD は計算コストを削減しながらも、精度をほとんど落とすことなく回答を生成できる手法であることが明らかになりました。
特に、処理速度が求められるリアルタイムアプリケーションや、リソースの限られた環境でのAI活用において、その効果が期待されています。
タスクによっては元のトークン数の 7.6% まで削減することも可能です。

CoD の活用事例

CoD は、さまざまな場面で活用が期待されています。
AIチャットボットでは、より短時間でユーザーの質問に答えることが可能になり、スムーズな会話の流れを実現できます。
カスタマーサポートにおいても、迅速な対応が求められる場面で、CoD を用いることでより効率的なサポートが可能になります。

また、自動翻訳や要約機能にも応用することで、余計な情報を省いた簡潔で分かりやすい文章を生成することができます。
例えば、ビジネス文書の作成では、AIが要点を的確にとらえながら、簡潔なアウトラインを作成することで、効率的な資料作成が可能になります。

さらに、プログラムのデバッグ支援にも役立ちます。
エラーメッセージを簡潔に提示することで、開発者の負担を軽減し、問題の特定と修正をスムーズに行うことができます。
このように、CoD は多様な分野での活用が見込まれる技術であり、AIの可能性をさらに広げるものと言えるでしょう。

さらに、研究者たちは Streaming や Skeleton-of-Thought(SoT)、Coconut などの他の技術と CoD を組み合わせることで、さらなる効率化の可能性を示唆しています。

制限事項

CoD にはいくつかの制限もあります。
例えば、few-shot の例示なしで CoD を使用した場合、その効果は大幅に低下することが研究で示されています。
また、パラメータが3B以下の小型モデルでは、CoT と比較して CoD の性能差が顕著になる傾向があります。
これは、CoD スタイルの推論データが訓練過程に十分含まれていないことが原因と考えられています。

まとめ

AIの思考プロセスを効率化する新手法「Chain of Draft(CoD)」は、無駄な文章を削減しながら、正確な答えを素早く導き出し、計算コストも大幅に削減することが可能な革新的な技術です。
特に、リアルタイム応答が求められる場面や、大量のデータを処理するシステムにおいて、その効果が大いに期待されます。

参考:Chain of Draft: Thinking Faster by Writing Less

コメント

タイトルとURLをコピーしました