SONiC/Open Networking

オープンネットワーキングを実現する次世代ネットワークOS

Open Networkingとは

Open Networkingは、ネットワーク機器のハードウェアとソフトウェア(NOS:Network Operating System)を分離し、 自由に組み合わせて利用できるネットワークアーキテクチャです。 従来のネットワーク機器は専用ハードウェアと専用OSが一体となって提供されており、 利用できる機能や拡張性はベンダーに依存していました。

Open Networkingでは、ホワイトボックススイッチとオープンなネットワークOSを組み合わせることで、 ベンダーロックインを排除しながら、高性能・高可用性・高い拡張性を実現できます。 現在ではクラウドデータセンターやAI/HPC基盤を支えるネットワーク技術として広く採用されています。

導入

Bare-Metal Switch

OSを搭載していないホワイトボックススイッチ。 BroadcomやNVIDIAなどの高性能ASICを搭載し、 自由にネットワークOSを導入できます。

ブート環境

ONIE

Open Network Install Environment。 スイッチに標準搭載されるブート環境で、 SONiCなどのネットワークOSを容易に導入できます。

ネットワークOS

SONiC

Microsoft Azureから生まれたオープンソースNOS。 コンテナベースの柔軟な設計により、 大規模データセンターで高い運用性を実現します。

スイッチASIC

ASIC

パケット転送を高速処理する専用チップ。 SAIによりBroadcom、NVIDIA、Intelなど 複数ベンダーのASICを共通制御できます。

SONiCとは

SONiC(Software for Open Networking in the Cloud)は、 MicrosoftがAzureデータセンターのネットワークスイッチOS向けに開発し、2016年にオープンソースとして公開した Linux(Debian)ベースのOS(NOS)です。
現在はLinux Foundationのもとで開発が進められており、 オープンネットワーキングを支えるデファクトスタンダードなNOSとして広く採用されています。

従来のネットワークOSは、特定ベンダーのハードウェア専用に設計されることが一般的でした。 これに対してSONiCは、標準化されたインターフェースを利用することで、 BroadcomやNVIDIAなど異なるベンダーのASIC上で同一のソフトウェアスタックを動作させることができます。
これにより、ハードウェアに依存しない柔軟なネットワーク基盤を実現します。

また、SONiCはクラウドネイティブな設計を採用しており、 BGPやLLDPなどのネットワーク機能をDockerコンテナとして独立して実行します。
サービス単位でのアップデートや再起動が可能なため、 大規模データセンターやAI/HPC環境に求められる高い可用性と運用性を提供します。

SONiCの特長

SONiCはオープンソース、マルチベンダー対応、コンテナベース設計、 そして大規模クラウドで実証された高い拡張性を備えています。 これらの特徴により、データセンターやAI/HPC環境に求められる 柔軟性・可用性・運用性を実現します。

オープンソース

Open Source

Linux Foundation主導で開発される オープンソースNOS。 世界中のコミュニティと企業によって 継続的に機能強化されています。

マルチベンダー

Multi Vendor

SAIを利用することで、 Broadcom、NVIDIA、Intelなど 複数ベンダーのASICを 共通のソフトウェアで制御できます。

コンテナ

Container Based

BGPやLLDPなどの機能を Dockerコンテナとして分離。 サービス単位で更新や再起動が可能です。

クラウドスケール

Cloud Scale

Microsoft Azureで培われた 大規模運用実績を持ち、 クラウドやAI基盤に最適です。

SONiCを支える2つの技術

SONiCがクラウドデータセンターやAI/HPC環境のハイパースケーラーなネットワークで広く採用されている理由は、 ハードウェアの違いを吸収する「SAI」と、高い運用性を実現する「コンテナベースアーキテクチャ」にあります。 これらの技術により、マルチベンダー環境での柔軟な運用と、 大規模ネットワークに求められる可用性を実現しています。

Hardware Abstraction

SAI

SAI(Switch Abstraction Interface)は、OCPが策定した標準APIです。 ASIC固有の違いを吸収することで、Broadcom、NVIDIA、Intelなど異なるベンダーの スイッチASICを同一のSONiC環境で利用できます。

これにより、ハードウェアに依存しないマルチベンダー構成を実現し、ベンダーロックインを回避できます。

Cloud Native

Container Architecture

SONiCではBGP、LLDP、SNMP、管理サービスなどの機能が、 それぞれ独立したDockerコンテナとして動作します。

サービス単位でのアップデートや再起動が可能なため、 ネットワーク全体を停止することなく保守作業を実施でき、 24時間365日稼働するクラウド基盤に適した運用を実現します。

SONiC Architecture

SONiCは各ネットワーク機能をコンテナとして分離し、Redis Databaseを中心に状態管理を行います。 また、SAIによってASICを抽象化することで、異なるハードウェア上でも共通のソフトウェアスタックを提供します。

構築

SONiCの導入手順は一般的なLinuxサーバーのセットアップに近く、管理ポート設定、インターフェース設定、VLAN構成、 ルーティング設定などをCLIから実施します。
設定情報はconfig_db.jsonに保存され、再起動後も永続化されます。

設定はCLIのほかAnsibleやAutomation Frameworkを利用した自動展開にも対応しています。

MLAG

MLAG(Multi-Chassis Link Aggregation)は、2台の物理スイッチを論理的に1台のスイッチとして動作させる技術です。 サーバー側は標準的なLACPを設定するだけで、複数リンクを1つの論理リンクとして利用できます。

従来のスパニングツリー(STP)ベースの冗長構成では片方の回線が待機していましたが、MLAGではすべてのリンクをActive-Activeで利用できるため、 高い可用性と帯域利用効率を両立できます。

MLAGのメリット

SONiCによるMLAGの実現

MLAGはCiscoのvPCやArista MLAGなど、従来はネットワークベンダー独自機能として提供されてきました。 SONiCでは、こうした高度な冗長化機能をオープンソースベースで実現できることが大きな特徴です。

MLAGの構成は、ドメインIDやピアリンク、管理IPアドレスなどを設定することで構築します。 標準的なCLIコマンド体系を利用して設定できるため、既存のネットワーク運用ノウハウを活かしながら導入できます。

AIクラスタやHPC環境では、1本のリンク障害がジョブ全体の性能や可用性に影響を与える場合があります。 MLAGは全リンクを有効活用しながら冗長性を確保できるため、高帯域・高可用性が求められるデータセンターネットワークにおいて重要な技術となっています。

EVPN/VXLAN

EVPN/VXLANは、データセンター全体を1つの巨大な仮想スイッチのように扱うためのネットワーク技術です。 物理的なラックや配線構成に依存することなく、柔軟かつ大規模な仮想ネットワークを構築できます。

AIクラスタやマルチテナント環境では、数百から数千台規模のサーバーを効率的に接続しながら、 高い拡張性と運用性を維持することが求められます。 EVPN/VXLANは、そのような大規模データセンターネットワークを支える標準技術として広く利用されています。

L2延伸

ラックを越えるL2ネットワーク

物理的な配置に依存せず、複数ラックにまたがるサーバーへ同一セグメントを提供できます。

マルチテナント

大規模マルチテナント

VNIを利用することで最大約1,600万個の仮想ネットワークを構築可能。大規模環境でも柔軟に分離できます。

最適化

トラフィック最適化

EVPNによる経路情報共有により、不要なブロードキャスト通信を削減し、効率的なネットワーク運用を実現します。

オープンファブリック

オープンなネットワーク基盤

標準技術を採用することで、異なるベンダーのハードウェアを組み合わせた柔軟なファブリックを構築できます。

EVPN/VXLANがもたらす価値

EVPN/VXLANを利用することで、サーバーの物理配置に依存しないL2ネットワークを実現できます。 GPUノードや仮想マシンを別ラックへ移設しても、同一セグメント上で継続利用できます。

VXLANではVNI(VXLAN Network Identifier)を利用することで、 従来のVLANが持つ約4,000個という制限を超え、 最大約1,600万個の仮想ネットワークを構築できます。 これにより大規模なマルチテナント環境にも対応できます。

さらにEVPNではBGPを利用してMACアドレスやIPアドレスの情報を共有するため、 ブロードキャストトラフィックを削減し、 効率的なネットワーク運用を実現します。

SONiCでは標準化されたEVPN/VXLANを採用することで、 ベンダーロックインのないオープンなネットワークファブリックを構築できます。 異なるASICやハードウェアが混在する環境でも、 統一された運用が可能です。

SONiCによるEVPN/VXLANの実装

SONiCでは、アンダーレイネットワークに標準的なBGPルーティングを採用し、 その上にEVPN/VXLANによるオーバーレイネットワークを構築します。 VLANとVNI(VXLAN Network Identifier)をマッピングすることで、 物理構成に依存しない柔軟な仮想ネットワークを実現できます。

設定はSONiC標準のCLIを利用して行います。 例えば、VLAN 10をVXLANの仮想ネットワーク(VNI 10010)へマッピングする場合、 以下のようなコマンドで構成できます。


# VLAN 10 を VNI 10010 にマッピング
sudo config vxlan add vlan-mapping 10 10010

EVPN/VXLANはCisco ACIなどの高価な専用ネットワーク基盤で利用されることが一般的でした。 しかしSONiCでは、ホワイトボックススイッチとオープンソースソフトウェアの組み合わせにより、 同等クラスのアーキテクチャを実現できます。

ベンダーロックインのないオープンなネットワークファブリックを構築できること、 そして大規模AIクラスタやデータセンターに求められる拡張性・柔軟性・可用性を 低コストで実現できることが、SONiCによるEVPN/VXLANの大きな価値です。

Supported Hardware

SONiCはBroadcom、NVIDIA、Intelなど複数ベンダーのASICに対応しており、 ホワイトボックススイッチを活用した柔軟なネットワーク基盤を構築できます。 データセンター、AIクラスタ、HPC環境など用途に応じて最適なプラットフォームを選択できます。

Leaf / ToR

Edgecore DCS200 Series

Broadcom Trident ASICを搭載した、 オープンネットワーキング市場の定番プラットフォームです。 EVPN/VXLANを活用したクラウド基盤やエンタープライズ向け データセンターネットワークに適しています。

  • Broadcom Trident 3 / 4
  • 25GbE / 100GbE サーバー接続
  • 100GbE / 400GbE アップリンク
AI / HPC / Spine

NVIDIA Spectrum Series

AI学習基盤やHPC向けに設計された 超低レイテンシ・高スループットスイッチです。 RoCEv2環境との親和性が高く、 GPUクラスタのインターコネクトに最適です。

  • NVIDIA Spectrum ASIC
  • 100GbE / 200GbE / 400GbE
  • RoCEv2対応
Spine

Celestica Seastone Series

Broadcom Tomahawk ASICを搭載した 大規模データセンター向けスパインスイッチです。 高密度ポートと大容量スループットにより、 EVPN/VXLANファブリックの中核を担います。

  • Broadcom Tomahawk 3 / 4 / 5
  • 400GbE / 800GbE
  • 大規模ファブリック向け

Why SONiC?

SONiCはオープンソース、マルチベンダー対応、 コンテナベースアーキテクチャを採用した 次世代ネットワークOSです。

MLAGによる高可用性、 EVPN/VXLANによる大規模ネットワーク仮想化、 そしてホワイトボックススイッチによる柔軟なハードウェア選択を実現し、 AIクラスタやデータセンターに求められる スケーラブルなネットワーク基盤を提供します。