賢く、有能で、驚くほど生産的。
大規模言語モデルは、過去4000年の中国の歴史を整理することはできても、「今何時?」という問いに答えることはできません。量子力学を明快に説明できたとしても、画像とテキストが混在するプロ並みのプレゼンテーション資料(PPT)の作成に苦労することさえあります。
まるで万能に見える大規模モデルが、なぜこれほど実用性に欠けるのでしょうか?
理由はシンプルです。「賢い」ことと「仕事ができる」ことは、必ずしも両立しないからです。
知性を獲得するには、膨大な知識を学習するための大規模なモデルが必要です。発達した脳が質問にうまく答えられるように訓練されるのと同じです。
しかし、「賢さ」と「能力」の両方を満たすためには、この賢い脳に、状況に応じて動かせる手足を与える必要があります。「深い思考」と、それを現実世界で実行するための「深い伝達」能力を持たせる必要があるのです。
つまり、スマートな思考から「スマートで有能」な実現へと、大規模モデルの進化をいかに促進するかが、今回のAIブームを一過性のものにするか、それとも歴史を変えるイノベーションにするかの鍵を握っています。
百度(Baidu)は、その答えを示しました。
2025年4月25日、Baidu AI開発者会議「Create 2025」において、百度の創業者であるロビン・リー氏は、世界初となるコンテンツ連携オペレーティングシステム「Cangzhou OS」を発表しました。これは、百度文庫と百度網盤が共同で開発したものです。
これまで百度文庫とクラウドディスクが蓄積してきた基盤技術、機能、データを完全に統合することで、「Cangzhou OS」は、まるで水のように様々なシナリオに溶け込み、最も合理的な形式で、低いハードルとエンドツーエンドの高品質な配信を実現します。そして何より、ユーザーにとって最も直感的で使いやすいインターフェースを提供するのです。
「Cangzhou OS」と、それを基盤とする百度文庫、百度網盤のAIに対するビジョンと期待は、「いつでも、どこでも、どのデバイスからでも」、真のワンストップでエンドツーエンドのサービスを提供し、AIを「全能で遍在する」存在にすることです。
01. AIをOSレベルへと進化させる「Cangzhou OS」
テクノロジー業界には、あらゆる技術が研究室から一般家庭に普及するまでには、長い時間を要するという共通認識があります。いわゆる「ガートナーのハイプ・サイクル」です。
このサイクルにおいて、初期の成長は主に、技術革新によってもたらされる市場の過度な期待に依存します。しかし、技術の実装効果が期待通りにいかないため、成長は一時的に鈍化します。その後、技術の実装に必要な条件が成熟し、ほぼ意識することなく利用できるインフラストラクチャとして具体化されることで、再び成長の勢いを増します。そして、その上に豊かなエコシステムが花開くのです。
ソフトウェア業界において、この第二段階の始まりを示す兆候の一つが、成熟したオペレーティングシステムの登場です。例えば、コンピューター業界のWindowsや、携帯電話業界のiOSなどが挙げられます。
では、「成熟したオペレーティングシステム」とはどのように定義できるのでしょうか?約15年前、世界のテクノロジー業界では、次のような議論がありました。「AppleのiPhoneも、他のスマートフォンも、どちらも大きなタッチスクリーンで操作でき、電話をかけたり、写真を撮ったり、音楽を聴いたり、テキストメッセージを送信したりできるのに、なぜ異なる種類の製品として存在するのだろうか?」
その主要な理由の一つは、iOSがMac OSからカーネルレベルの安定性とマルチタスク機能を継承し、オープンなエコシステムを構築したことにあります。開発者は、Appleが提供するこれらの基盤機能を自由に活用し、独自の革新的なアプリケーションを開発できます。これにより、携帯電話の定義は、MotorolaやNokiaといった一握りの大企業の製品から、無限の可能性を秘めた巨大な産業へと変貌を遂げました。そして、10年以上にわたるモバイルインターネットの時代を切り開いたのです。
テクノロジーは今後も進化し続けるでしょうが、ビジネスの物語は常に同じようなパターンを繰り返すでしょう。携帯電話のOSで証明された基本的なロジックは、大規模モデル時代のOS構築にも応用できるのです。
その鍵となるのは、完全な基盤機能、柔軟な中央スケジューリング、そして豊かなアプリケーションサービスのエコシステムの3つです。これは、「Cangzhou OS」の3層アーキテクチャ(基本インフラストラクチャ、中央システム、アプリケーションサービス)にまさに対応しています。唯一の違いは、アプリケーションとハブ、そしてベース間の橋渡しが、従来のAPIから、より標準化され、参入障壁の低い**MCP(Massive Content Processing)**に変更されたことです。
MCPサーバーの基本インフラストラクチャの中核となるコンポーネントは「Chatfile plus」です。これは主に、知識ベースのフレームワークを使用して、様々なモード、形式のコンテンツを要素レベルで分解・分析します。さらに、マルチモーダル理解、マルチモーダル検索、ファイルのトランスコードと分析など、一連のツールフレームワークコンポーネントも実行します。
同時に、百度文庫と百度網盤は、パブリックドメイン知識ベース、プライベートドメイン知識ベース、そしてメモリベースという「三大ライブラリ」を構築しました。具体的には、百度文庫が長年にわたり蓄積してきた公共知識データ(パブリックドメイン知識ベース)、クラウドディスクのユーザーが許可した知識データ(プライベートドメイン知識ベース)、そして文庫またはクラウドディスク内のユーザーの過去の指示、利用習慣、生成履歴(メモリベース)を指します。
これらのデータは、テキスト、画像、動画、音声、ドキュメントなど、様々な形式で存在します。このうち、パブリックドメイン知識ベースは一般的な知識を提供し、プライベートドメイン知識ベースとメモリベースは、ユーザーのパーソナライズされたデータを保存します。
知識ベースのフレームワークにおいて、「Cangzhou OS」は「三大ライブラリ」内のマルチモーダルコンテンツをベクトル化し、ラベル付けします。つまり、画像、テキスト、動画、音声、ドキュメントといった非構造化データを、様々な専門モデルを通じて、コンピューターが理解できる多次元ベクトルデータに変換するのです。
中央システムに関しては、百度文庫と百度網盤は、文書、PPTなどのコンテンツ編集用の「フュージョンエディター」、閲覧用の「リーダー」、そしてオーディオとビデオ再生用の「プレーヤー」という独自の「三大デバイス」を開発しました。
さらに、「Cangzhou OS」は「スケジューリングセンター」を活用し、インタラクティブコンポーネント、意図モデル、伝送インフラストラクチャを通じてユーザーの記憶とポートレートデータを組み合わせ、モデルを通じてユーザーの意図を理解し、効率的にスケジューリングエージェントを割り当てます。
最上位レベルには、数百ものAIエージェントが存在します。「Cangzhou OS」は、ドキュメントライブラリ、ネットワークディスク上のPPT、AI絵本、AIマインドマップ、AIポスター、AIメモ、AIスキャン、AIリスニングなど、多岐にわたるAIエージェントを統合しています。生成されるコンテンツの種類も、画像、テキスト、動画、音声など様々で、学習、オフィス、生活、エンターテイメントといった幅広いシナリオをカバーします。また、フュージョンエディターの編集、変更、微調整機能を活用することで、検索とコンテンツ生成の品質を高め、実際のパーソナライズされたタスクの要求にさらに適合させます。
02. 「Cangzhou OS」が生み出す、より「賢く有能な」エージェントたち
トップレベルのアプリケーションサービスに注力する百度文庫と百度網盤は、数億人のユーザーによって検証された数百もの便利なAIエージェントをリリースし、さらに多数のサードパーティの専門エージェントを接続することで、アプリケーションのエコシステムを拡大しています。
「ワンストップAIコンテンツ取得・作成プラットフォーム」としての百度文庫は、4000万人以上の有料ユーザーと9700万人の月間アクティブAIユーザーを抱えています。一方、百度網盤も「ワンストップコンテンツサービスプラットフォーム」へと進化し、10億人以上のユーザーにサービスを提供しており、総利用容量は1000億GBを超え、月間アクティブAIユーザーは8000万人を超えています。百度文庫と百度網盤は、まさにビッグモデルの時代における「超生産性」を実現する存在となったのです。
カンファレンスでは、百度文庫と百度網盤が「滄州OS」をベースに開発した新機能、「GenFlowスーパーパートナー」と「AIノート」が実演されました。
GenFlowは、百度文庫アプリによって開始されたマルチエージェントコラボレーション機能です。「Cangzhou OS」のサポートにより、コンテンツ生成を並行して実行でき、最も包括的で専門的なネットワーク情報と、ユーザー自身の習慣や好みに基づいて様々なタスクを配信できます。
例えば、ユーザーが結婚式の計画を立てたいとします。最初の入力は、「メーデーに海南省で屋外結婚式を挙げたいので、計画と招待状の作成を手伝ってください」という簡単な文章だけです。
要件は単純に見えますが、履歴テンプレートに基づいて空白を埋めるだけでは、ユーザーの満足は得られません。ユーザーの美的感覚、予算の期待、プロセスの好みを知る必要があります。また、メーデー連休中の海南省の天気、交通状況、会場の分布も考慮する必要があります。その後、PPTツールを使用して、これらの情報と知識を組み合わせ、完全な計画を作成する必要があります。最後に、計画とユーザーの美的感覚に基づいて、完璧な結婚式の招待状ポスターを生成するのです。
上記のコンテンツを完成させるためには、ユーザーの過去のチャット記録、閲覧履歴だけでなく、意図認識、フルネットワーク検索、PPTツールなどを個別に呼び出し、ユーザーの意図を分析し、好みを理解し、ツールを自由に組み合わせる必要があります。最終的に、プロセス、日付、会場、予算、テーマ、実行の詳細、スタイル、人員配置を含む、非常に具体的で完全な計画がユーザーに提供されます。
同時に、ユーザーが求める企画提案とポスターは互いに整合性が取れている必要があり、そのためには両者の情報がすべて一貫しており、同じオペレーティングシステムを使用して並行して出力されることが不可欠です。
もちろん、AIは一度にすべての人の期待に応える結果を生成できるわけではないため、ウェディングプランとポスターの両方が編集可能である必要があります。これをサポートするのが、「Cangzhou OS」の統合エディター機能です。
深い思考から徹底的な実行まで、「GenFlowスーパーパートナー」が市場でほぼ唯一の真の「マルチエージェントコラボレーション」製品であることは明らかです。これは、高コスト、生成時間の長さ、効率の低さ、安定した配信の難しさ、複数回の対話による最適化の不可能さなど、マルチエージェントコラボレーション製品の一般的な問題を解決するだけでなく、成熟した製品に直接組み込まれ、ユーザーが許可したプライベートデータと組み合わせることで、AIが「全能で遍在する」という目標を達成する真のチャンスを与えます。
百度網盤のAIノート機能は、多くのオフィスワーカーや、大学院入試、公務員試験の準備をしている人々にとって強力なツールです。
AI Notesは、業界初のマルチモーダルAIノートであり、ユーザーが百度網盤に保存した様々な大学院入試の学習ビデオとノートページを同じインターフェースに統合し、シームレスな連携を実現します。ビデオコンテンツとメモは密接に関連しており、ビデオの視聴からAIメモの生成、AIマインドマップによる要約、そして最後にAIによる質問での学習成果のテストまで、ユーザーの学習サイクル全体を完全にカバーします。
例えば、少し前に英語での大学院入試の難しさが話題になり、ユーザーは英語での大学院入試に向けて集中的に復習したいと考えていました。AI Notesは、まずユーザーのネットワークディスクに保存されている関連情報を検索し、同時にインターネット上の公開情報にあるテストポイントを照会して整理します。しかし、プロセス全体はそこで終わりません。AI Notesは過去の試験問題を組み合わせて、生成したテストポイントの最終検証も行います。検証されたテストポイントのみに基づいて、マインドマップとテスト問題の予測を継続的に生成し、ユーザーの学習進捗を加速させることができるのです。
このプロセスでは、結婚式の計画と同様に多くのツールが使用されます。例えば、テストのポイントや実際の質問を見つけるためには、ネットワーク全体を検索する機能が必要です。また、実際の質問はPDFや画像形式で提示されることが多く、有名な教師の解説はビデオ形式で提供されるため、マルチモーダルコンテンツを解析する機能も必要です。最終的なマインドマップの生成とテスト問題の予測には、大規模モデルの推論能力、マルチモーダルコンテンツを生成する能力、様々なコンテンツをマッピングして関連付ける能力が求められ、さらにコンテンツ生成の絶対的な正確性も保証する必要があります。
その背景にあるのは、「Cangzhou OS」の強力なサポートです。
もちろん、Baiduは開発者がMCPを完全に採用できるようにサポートしているため、「Cangzhou OS」はBaiduの内部エコシステムに役立つだけではありません。オペレーティングシステムの開発と成長において最も重要なのは、外部の世界に開かれ、開発者の革新能力を刺激することです。
そのため、エコシステムとアプリケーションの価値を最大化するために、「Cangzhou OS」をベースとする百度文庫と百度網盤は、まずMCPをフル活用して製品とエコシステムを連携させ、MCPサーバー-クライアント-ホストの3層システムを構築し、MCPサーバーの形で文庫と網盤の機能を開放しました。MCPクライアントSDKを使用することで、より多くの企業ユーザー、開発者、インテリジェントアプリケーションなどがMCPホストに簡単にアクセスできるようになります。
その中でも最も代表的な事例が、Samsungの携帯電話です。Samsungの携帯電話は、Baidu Wenku Cloud Diskのファイルのアップロード、ダウンロード、検索、共有、コンテンツの理解のために複数のMCPサーバーに接続しています。
一方、ユーザーは、携帯電話の音声アシスタントインターフェースに話しかけるだけで、バックアップ用のネットワークディスクへのファイルのアップロード、クラウドでの共有、ドキュメントの要約やコンテンツのQ&Aなどの機能を直接利用できます。
他方、これらのサーバーは、Samsungの携帯電話システムのクラウドストレージ機能を強化し、携帯電話自体で大量のファイルを一括してバックアップして共有することが難しいという問題を解決することもできます。
例えば、携帯電話のアルバムで、ユーザーは音声アシスタントを呼び出して、「昨日オシャンで撮った写真を百度ネットディスクにバックアップし、シャオミンの写真を彼に送ってください」と言うことができます。関連する写真はユーザーの承認されたクラウドディスクアカウントにアップロードされ、共有リンクが生成されます。すると、携帯電話アシスタントがアドレス帳を呼び出し、このリンクをテキストメッセージで相手の携帯電話に送信します。リンクをクリックするだけで、ユーザーはBaidu Cloud Diskに直接アクセスして写真を閲覧したり転送したりできます。
OSの基盤となる機能が信頼できるかどうかをテストする基準は、単なるツールの積み重ねや目新しい技術の量ではありません。トップレベルのアプリケーションサービスのエコシステムが使いやすく、成熟していて、機能が豊富であるかどうかこそが、OSの能力に対する最高の評価基準なのです。
03. OSの物語に終わりはない
資本市場において、投資家に最も評価される企業タイプは、「時間の友」と呼ばれています。
いわゆる「時間の友」とは、企業が正しい方向に向かって努力を続ければ、その業績は永続的に成長し、エコシステムの開発者は利益を得続けるという意味です。
オペレーティングシステムは、典型的な永久機関市場です。コンピューターと携帯電話の市場が存在する限り、Microsoft、Apple、Googleのオペレーティングシステムの物語が終わることはありません。
大規模モデルも同様です。「深い思考+深い伝達+公開・非公開データ+MCPエコロジー」が組み合わさることで、未来は新時代の全能かつ遍在的なAIとなり、カンブリア爆発のように、次々と新しい種類のアプリケーションが登場するでしょう。
このプロセスにおいて、足元を見れば、百度文庫、百度網盤、そしてその他のプラットフォームが、それぞれの持つ能力を解放していることがわかります。エコシステムを積極的に受け入れることで、私たちは新しい種類の大きなモデルの創造者となり、新しいルールの創造者となるのです。
将来を見据えると、「Cangzhou OS」を基盤として、無数の新しいエージェントが誕生し、広大な新しいアプリケーションサービスのエコシステムが形成されています。
Huawei、Alibaba、Xiaomi、Tensentと比べて目立たないBaiduが、動き始める。