AI研究者も予想外！既存モデル BERT が秘めていた”生成AI級の実力”の正体

BERT が文章を「生成できる」という話を聞いて驚くだろうか？
多くの人は「BERTは生成ではなく解析に特化したモデル」という先入観を持っているはずだ。
確かに、AI業界のトレンドもその認識を強化してきた。
GPT シリーズのような生成モデルが脚光を浴びる中、BERT に代表されるマスク付き言語モデル（Masked Language Model、以下MLM）は、時代遅れの技術のように扱われることも少なくない。

しかし、ノルウェー・オスロ大学の研究チームが、この固定観念を覆す発見を報告した。
彼らは、MLM が追加学習や構造変更なしでも生成タスクを実行できる能力を持つことを実証したのである。
この研究成果は、AI技術にまだ未開拓の可能性が眠っていることを示唆している。

BERT はどうやって生成モデルになったのか？
実験結果が示す、生成モデルと MLM の「棲み分け」
未来のAIは「ハイブリッド」が鍵？
人間味のある技術開発
結論

BERT はどうやって生成モデルになったのか？

従来の MLM である BERT とその発展形は「穴埋め問題」の解決に特化して開発されてきた。
そのため、BERT は部分的なテキスト補完には長けているものの、GPT のように文章を順次生成する能力は持ち合わせていないと考えられてきた。

しかし、研究チームは巧みな工夫でこの制約を克服した。
彼らは BERT の進化版である DeBERTa を用い、文末に特殊な[MASK]トークンを配置。
このトークンの予測を通じて、単語を逐次生成するプロセスを確立した。
この手法を繰り返し適用することで、DeBERTa は生成モデルのように完全な文章を構築できるようになった。

さらに、生成文の自然さを向上させるため、複数の候補文を評価して最適な選択肢を選定する「ランキング手法」を導入。
これにより、DeBERTa は GPT-3 に匹敵する精度で文章生成を実現した。

実験結果が示す、生成モデルと MLM の「棲み分け」

DeBERTa の生成能力はどのように評価されたのか？
研究チームは、GPT-3 と DeBERTa を多様なタスクで比較検証した。
文章の一貫性や意味理解を問う言語理解タスクでは、DeBERTa が GPT-3 を凌駕する成績を収めた。
特に、人間の読解力テストに類似した課題において、DeBERTa は際立って高いスコアを記録した。

一方、翻訳やクローズドブック型の質問応答では、GPT-3 が圧倒的な優位性を示した。
これは、GPT-3 が多言語データや大規模知識ベースで学習を重ねているため、より広範な知識を有していることが要因と考えられる。
この結果は、両モデルが異なる得意分野を持つことを明確に示している。

未来のAIは「ハイブリッド」が鍵？

本研究のもう一つの重要な意義は、AI技術の将来像に示唆を与えている点にある。
DeBERTa と GPT-3 の実験結果は、MLM と生成モデルの利点を統合した「ハイブリッドモデル」の実現可能性を示唆している。
MLM のデータ効率性と生成モデルの多様性が融合できれば、これまで解決が困難だった複雑な課題に挑戦できる可能性が開けるだろう。

人間味のある技術開発

この画期的な発見の背景には、研究チームの地道な努力がある。
限られたデータでモデルの潜在能力を最大限に引き出すアイデアを創出し、それを入念に検証し続けた彼らの熱意には、AIの新たな地平を切り拓こうとする強い意志が反映されている。

このような人間の探究心こそが、AI技術の更なる進化を推進する原動力となるだろう。

結論

AI技術の進歩は、革新的なアイデアだけでなく、既存技術の新たな可能性の発見によっても達成される。
今回の研究は、BERT のような確立されたモデルにも未開の可能性が潜んでいることを実証した。
DeBERTa の成果は、技術革新にとどまらず、私たちの視野を広げる契機となった。
次なるブレークスルーは、既存技術と新技術の融合から生まれる可能性を秘めている。

参考：BERTs are Generative In-Context Learners