エンジニアの思い立ったが吉日

このブログでは、「あ、これ面白い!」「明日から仕事で使えそう!」と感じたIT関連のニュースやサービスを、難しい言葉を使わずに分かりやすく紹介しています。ITに詳しくない方にも楽しんでもらえるような情報を発信していくので、ぜひ「継続的な情報収集」の場としてご活用ください。

OpenAI発「MRC」とは何か?AIモデルを速くする新ネットワーク技術を徹底解説

週9億人が使うChatGPTは、どうやって毎日あれだけ大量のリクエストをさばいているのか。そして、次世代モデルをより速く・より賢く開発するために、OpenAIが裏側で何をやっているのか。

2026年5月、OpenAIはAMD、Broadcom、Intel、Microsoft、NVIDIAと共同で「MRC(Multipath Reliable Connection)」という新しいネットワークプロトコルを公開した。発表の舞台はOpen Compute Project(OCP)。つまりオープンソース的な形で業界全体に向けて仕様を公開した、という点が特徴だ。

「プロトコル?ネットワーク?自分には関係ない話では?」と感じた方もいると思う。でも少し待ってほしい。

このMRCは、AIモデルの学習スピードに直結する技術だ。ChatGPTや将来の高性能AIが「どれだけ早く、どれだけ賢く」なれるかは、こういったインフラの進化にかかっている。エンジニアとしてAIを使う立場でも、AIを業務に活かしたいビジネスパーソンにとっても、「なぜAIがここまで速く進化しているのか」を理解する上で欠かせない話だ。

そもそもなぜネットワークがAIの課題になるのか

大規模AIトレーニングの実態

GPT-4やo3のような大規模言語モデルを訓練するとき、数万台ものGPUが一斉に動く。それぞれのGPUが担当する計算を終えたら、結果をほかのGPUと共有して、全体の学習を進める。この「データのやり取り」が膨大な量になる。

一回の学習ステップに何百万件もの転送が発生する。しかも、全GPUが同じリズムで動く「同期学習(Synchronous Training)」では、どれか一つの転送が遅れただけで、全員が待たされる。まるで引っ越し作業で、一人がトラックに乗り遅れると全員が出発できないのと同じ構造だ。

これが大規模になればなるほど、影響が増幅される。10万台のGPUが動いているなら、どこかで必ず通信の遅延や機器の不具合が起きる。1台の問題が全体を止めかねない。

従来技術の限界

これまでのGPUクラスタネットワークで広く使われてきた方式に「RoCEv2(RDMA over Converged Ethernet v2)」がある。GPUとCPUの間でデータを高速に直接やり取りするための規格だが、巨大なスケールになると問題が出てくる。

一番の問題は、パケット(データのひとかたまり)が一本道しか通れないこと。同じルートにたくさんの転送が集まると渋滞が起きる。そして渋滞が起きた場合、解消するまでに数秒から十数秒かかることがある。学習を数万台のGPUで同期させているとき、数秒の停止は致命的だ。

さらに、ネットワーク内のスイッチや回線が一本壊れると、ルートを再計算するまでトレーニングが止まったり、最後にセーブしたチェックポイントからやり直しになる。これはGPU時間の無駄であり、コストの無駄でもある。


MRCとは何か:仕組みをわかりやすく解説

「一本道」から「何百本もの道を同時に使う」へ

MRC(Multipath Reliable Connection)の核心は、一言でいえば「一本道をやめる」ことだ。

荷物(パケット)を配送するとき、従来は一本のルートにまとめて送っていた。MRCは同じ荷物を何百本もの道に分けてバラまく。バラバラになって届いた荷物は、到着先のGPUが正しい順番に組み立て直す。

この方式を「パケットスプレー(Packet Spraying)」と呼ぶ。道路に渋滞が起きても、別の道を使えばいい。一本壊れても、残りの道を使う。ミクロ秒(100万分の1秒)単位で経路を切り替えられるため、従来の「数秒待って再起動」という問題がなくなる。

OpenAIによると、従来のネットワークは障害発生後に安定するまで数秒〜数十秒かかっていたが、MRCではミクロ秒単位で対応できる。

マルチプレーン構成:ネットワークを8つの並行路に分ける

MRCはネットワーク機器の設計も変える。

従来は1台のネットワークインターフェースを「800Gb/sの1本の回線」として扱っていた。MRCではこれを「100Gb/sの8本の回線」に分割し、8つの独立したネットワーク(プレーン)を並列で走らせる。

これによって何が変わるか。64ポートのスイッチが、従来なら64台のGPUとしか繋がれなかったのが、512台と繋がれる。さらに、10万台超えのGPUを従来の3〜4段ではなく2段構成のスイッチで接続できる

段数が減ることで、消費電力も機器コストも下がる。故障しうる部品の数も減る。シンプルであることは強さだ。

SRv6:「どの道を通るか」をパケット自身に書き込む

従来のネットワークでは、BGP(Border Gateway Protocol)というプロトコルが常に「今どのルートが使えるか」を計算していた。これは複雑なソフトウェアで動いており、障害時に予測不能な挙動をすることがある。

MRCは「SRv6(IPv6 Segment Routing)」を使ってこの問題を解消した。SRv6では、パケットの宛先アドレスに「経由するスイッチのID」を埋め込んでおく。スイッチは自分のIDが含まれていたら次の宛先を見て転送するだけ。動的な経路計算が要らなくなる。

ルーターやスイッチが複雑な計算をしなくていい分、シンプルで壊れにくい。経路決定がGPU側(送信元)で行われるため、故障経路を素早く避けながら送り続けられる。


実際の運用でどう変わったか:OpenAIの実績

スイッチ再起動もトレーニングを止めない

MRCをOpenAIが実際に使って何が変わったか。公式ブログに具体例が書かれている。

ChatGPTやCodexの最新フロンティアモデルを訓練中、1段目のスイッチを4台再起動する必要があった。従来なら、スイッチ再起動のタイミングをトレーニングチームと慎重に調整しなければならなかった。

MRC導入後は、トレーニングチームへの連絡なしにスイッチを再起動できた。MRCがリアルタイムで経路を切り替えてくれるため、影響がほぼゼロだったからだ。

回線の修理も同様だ。以前は「この回線をメンテするために学習を止めていいか」と調整が必要だった。今は回線が動いている状態のままメンテでき、使えない回線はMRCが自動で避ける。

1分ごとに複数のリンク障害が起きても学習が続く

スターゲート(OpenAIの超大規模スーパーコンピュータプロジェクト)では、tier-0とtier-1スイッチ間で1分あたり複数のリンク瞬断が観測されることがある。これは数万台の機器が動いている以上、避けられない現実だ。

MRC導入後、これらの瞬断は学習パフォーマンスに計測可能な影響を与えなかった。OpenAIいわく「影響が小さすぎて、リンク修理を最優先にする必要がなくなった」という状況だ。

GPUインターフェースの8ポートのうち1ポートが死んでも、MRCは自動で残り7ポートへ経路を再計算する。失ったのは8分の1の帯域のはずだが、実際のパフォーマンス低下はそれより小さくなることが多いという。


MRC・InfiniBand・既存Ethernetの比較

AIクラスタのネットワーク技術は現在、大きく3つのアプローチに分かれている。

項目 従来RoCEv2 InfiniBand MRC(新方式)
パケット転送 単一経路 単一経路(RDMA) 数百経路に分散(パケットスプレー)
障害回復速度 数秒〜数十秒 数秒 マイクロ秒単位
必要スイッチ段数 3〜4段 2〜3段 2段(10万GPU超え)
対応GPU規模 〜数万台 〜数万台 10万台超え
オープン仕様 ○(IBTA標準) △(NVIDIA主導) ○(OCP公開)
経路制御方式 動的(BGP等) 動的 静的SRv6
主要採用企業 広く普及 多くのHPCクラスタ OpenAI、Microsoft等
帯域速度 〜400Gb/s 〜400Gb/s(NDR) 800Gb/s対応

InfiniBandは長らくHPC(高性能計算)の標準だったが、NVIDIAが中心のクローズドなエコシステムと高コストが課題だった。Broadcomの2026年3月の決算発表によると、新規AIインフラ導入のおよそ70%がEthernet系(RoCEv2含む)を選んでいるという。MRCはこのEthernet系をさらに大規模AIに特化させた進化形として位置づけられる。


MRCが業界に与えるインパクト

Ethernetの「再定義」とオープン化の流れ

MRCの重要な側面は、技術そのものより「誰でも使えるオープン仕様として公開した」という点にある。

InfiniBandはNVIDIAが中核を握る独自エコシステムだった。ベンダーロックイン(特定メーカーへの依存)リスクがあり、専門スキルが必要で、コストも高い。

MRCはOpen Compute Project経由でフリーに使える。AMD、Broadcom、Intel、Microsoft、NVIDIAという競合関係にある企業が横断的に協力したのは、「業界の共通インフラ」としての性格を持たせるためだ。

Dell'Oroグループのアナリストは「MRCはEthernetが汎用技術から大規模AI専用インフラへと進化するための重要な一歩」と評価している。

AI研究の速度に直結する話

「インフラの話は自分には関係ない」と思うかもしれないが、これはAIモデルの進化スピードに直結する。

GPUが増えても、GPUを繋ぐネットワークがボトルネックになれば計算効率が上がらない。逆にネットワークが改善されると、同じGPU台数でより大きなモデルをより速く訓練できる。

MRCによって「10万台超えのGPUクラスタを現実的なコストで動かせる」ようになった。これは今後のChatGPTや新モデルの開発コスト・スピードに直接影響する。


注意点・現実的な課題

利用には対応ハードウェアが必要

MRCは最新の800Gb/sネットワークインターフェースに組み込まれている技術だ。既存のデータセンターに「今すぐ導入」というわけにはいかない。新規の大規模インフラ構築が前提になる。

OpenAIが実際に使っているのはNVIDIA GB200を搭載したスーパーコンピュータ群であり、Oracle Cloud Infrastructure(テキサス州アビリン)やMicrosoftのFairwaterスーパーコンピュータ群に展開済みだ。既存の一般的なクラウドサービスに即座に反映されるわけではない。

「受信側が並べ直す」負荷がかかる

パケットスプレーで何百もの経路にバラまいた場合、受け取った側のGPUが正しい順序にデータを並べ直す処理が発生する。MRCではパケットに最終メモリアドレスを埋め込む設計でこれを軽減しているが、従来の順序保証方式と比べると受信側の処理に違いが出る。規模や実装によって影響が異なるため、単純な「速い/遅い」比較は難しい面もある。

OCP公開でも「すぐに普及」は過大評価

仕様がオープンになったとはいえ、実装するにはNICやスイッチのハードウェアレベルの対応が必要だ。クラウドプロバイダやデータセンター事業者が本格採用するまでには、ハードウェア世代の交代サイクルが必要で、数年のタイムラインになる。


エンジニア・ビジネス担当者が今できること

エンジニアへ

今すぐMRCを自分の環境に導入できるわけではないが、この動向を知っておく意味はある。

AIクラスタを社内で構築する機会がある場合、ネットワーク設計は「GPU台数」と同じくらい重要な要素だ。InfiniBandかEthernet(RoCEv2)かの選択で、コストと運用複雑性が大きく変わる。MRCを念頭に置きながらベンダーの技術ロードマップを追っておくと、調達や設計判断に活きる。

OCPのMRC仕様書や、OpenAIが共著した論文「Resilient AI Supercomputer Networking using MRC and SRv6」は公開されているので、ネットワーク技術に興味があれば一次資料として読む価値がある。

ビジネス担当者へ

このニュースが意味するのは、「AIの進化は計算チップだけでなく、インフラ全体の設計が鍵になっている」ということだ。

クラウドAIサービスの性能改善、新モデルのリリースサイクル短縮、そしてAPI料金の変化。これらの背景にはこうしたインフラの進化がある。サービスを選ぶ際や、AIベンダーと交渉する際に「インフラに何が起きているか」を知っていると、評価の解像度が上がる。


まとめ

OpenAIが公開したMRCは、大規模AIトレーニングのネットワーク設計を根本から変える技術だ。

  • 1つの転送を数百の経路に分散させて渋滞をなくす(パケットスプレー)
  • マルチプレーン構成で10万台超のGPUを2段構成のスイッチで接続できる
  • SRv6で静的経路制御を行い、障害をミクロ秒単位で迂回する
  • これらすべてをオープン仕様としてOCPで公開した

個人的に印象的だったのは、AMDとNVIDIAというライバル関係の企業が、MicrosoftやBroadcomと一緒に同じ仕様を作り上げたという事実だ。AI基盤のネットワーク層は、もはや競争の場ではなく「共通インフラ」として整備する段階に入ったということだろう。

ChatGPTが9億人に使われるサービスになった今、その裏側のインフラも「個別最適」から「産業標準」へとシフトしている。MRCはその一つの象徴だと思っている。

engineer-kichizitsu.net

engineer-kichizitsu.net

engineer-kichizitsu.net

engineer-kichizitsu.net

engineer-kichizitsu.net

engineer-kichizitsu.net

engineer-kichizitsu.net

engineer-kichizitsu.net

当サイトは、アフィリエイト広告を使用しています。