2024年 3月、日本電信電話株式会社(NTT)が、AI界における新たなマイルストーンを打ち立てる準備が整いました。
その名も「tsuzumi」―軽量でありながら、世界トップレベルの日本語処理能力を誇る独自の大規模言語モデルです。
NTT はこの新しいモデルを通じて、AI 技術の持続可能性の問題に取り組み、電力消費とコストの大幅な削減を実現しようとしています。
なぜ「tsuzumi」なのか?
ChatGPT やその他の大規模言語モデル(LLM)が高い言語処理能力を提供する一方で、これらのモデルは膨大なエネルギーを消費し、大規模な GPU クラスタを必要とします。
これに対し「tsuzumi」は NTT が 40 年以上にわたって蓄積してきた自然言語処理と AI 技術の研究成果を結集して開発されました。
この新モデルは、OpenAI の GPT-3 と比較して、約 1/300 から 1/25 のパラメータで動作する超軽量版と軽量版を提供し、CPU や GPU 上で高効率に動作します。
これにより、推論やチューニングのコストを大幅に削減し、AI 技術の持続可能な発展を支えます。
今後の展望
「tsuzumi」は現在、日本語と英語に対応しており、特に日本語処理における高性能を誇ります。
NTT は、このモデルを基盤として、業界固有の言語表現や知識に対応できるよう柔軟性を高め、マルチモーダル機能の実装など、さらなる機能拡張を計画しています。
これにより、特定の業界や社会課題に特化した LLM の開発を進め、AI 群との連携によるリアルワールドでの問題解決に貢献することを目指しています。
まとめ
NTT の「tsuzumi」は、AI 技術の新たな地平を開き、言語モデルの持続可能性に対する新しいアプローチを提供します。
この取り組みは、AI の可能性をさらに広げるとともに、環境への配慮を組み込んだ技術開発の重要性を示しています。
今後も NTT の進化する「tsuzumi」から目が離せません。
コメント