中国のテクノロジー大手 Baidu(バイドゥ)が、新たなAIモデル「Ernie 4.5」と「Ernie X1」を発表しました。
AI市場は現在、OpenAI の GPT-4、Google の Gemini、Meta の Llama などの競合がひしめき合う激戦区ですが、Baidu はどのような差別化を図るのでしょうか?
特に価格面での優位性を強調する Baidu の戦略は、AI業界に新たな影響を与える可能性があります。
「Ernie 4.5」と「Ernie X1」の技術的進化
Baidu の最新大規模言語モデル(LLM)である「Ernie 4.5」は、マルチモーダルな基盤モデルとして、複数のモダリティ間の協調的最適化を特徴としています。
Baidu によると、言語理解、生成、推論、記憶能力が向上し、特に「幻覚防止、論理的推論、コーディング能力」が改善されているといいます。
Ernie 4.5 の主要な特徴は、テキスト、画像、音声、動画などの様々なコンテンツタイプを統合・理解する能力であり、インターネットミームや風刺漫画などの複雑なコンテンツも理解できる強力な文脈認識能力を備えています。
一方「Ernie X1」は Baidu の新しいディープシンキング推論モデルであり、理解力、計画力、反省力、進化能力の強化に焦点を当てています。
Baidu の「ツール使用が可能な最初のマルチモーダルディープシンキング推論モデル」として、中国語の知識 Q&A、文学創作、複雑な計算などの分野で優れた性能を発揮します。
このモデルのツール使用には、高度な検索、ドキュメント Q&A、画像理解、AI画像生成、ウェブページ読み取りなどの機能が含まれています。
AI市場における競争と Baidu の立ち位置
Baidu は、個人ユーザー向けには Ernie Bot を通じてこれらのモデルを無料で提供しています。
特に注目すべき点として、Baidu は Ernie 4.5 が GPT-4.5 よりも優れたパフォーマンスを発揮しながら、価格は GPT-4.5 の「わずか 1%」であると主張しています。
これらの技術的進歩は「FlashMask」動的注意マスキング、異種マルチモーダル専門家混合、時空間表現圧縮、知識中心のトレーニングデータ構築、自己フィードバック強化ポストトレーニングなどの技術によるものです。
一方、Ernie X1 の能力は、段階的強化学習法、思考と行動の連鎖を統合したエンドツーエンドのトレーニングアプローチ、および統一された多面的な報酬システムなどの技術によって支えられています。
実際のユースケースと導入事例
Baidu は、これらの新モデルを同社の幅広い製品エコシステム(Baidu 検索や Wenxiaoyan アプリなど)に統合し、ユーザー体験を向上させる計画です。
企業ユーザーやデベロッパー向けには、Baidu AI クラウドの Qianfan プラットフォーム上の API を通じて Ernie 4.5 が利用可能となっており、競争力のある価格体系が提供されています。
Ernie X1 も近い将来、同じプラットフォームで利用可能になる予定です。
Baidu のAI戦略の今後
Baidu は「2025年が大規模言語モデルと技術の開発・反復にとって重要な年になる」と予想しており、AI能力の向上と次世代モデルの開発に向けて、AI、データセンター、クラウドインフラへの投資を継続する計画です。
特に、これらの新モデルにより、中国市場だけでなくグローバル市場でも競争力を高めることが期待されています。
Baidu がAI技術の革新と価格競争力を両立させる戦略は、AI業界の既存の勢力図を変える可能性があります。
Baidu の「Ernie 4.5」と「Ernie X1」が、価格競争と技術革新の両面で成功を収めるのか、今後の展開に目が離せません。
参考:Baidu undercuts rival AI models with ERNIE 4.5 and ERNIE X1
コメント