NECは、AIの開発競争において優位性を維持・強化するため、AI研究用スーパーコンピュータの構築を開始。2023年3月に、国内で処理性能580PFLOPS超となるシステムの稼働を予定していると発表した。
なお、すでに一部のシステム(100PFLOPS)については、同社の数百名のAI研究者が利用を開始しており、今後構築する480PFLPOSのシステムを加えることで、AIに特化した研究開発環境による、より高度な先進AIの開発に役立てるという。
また、将来的には顧客やパートナーとの共創により、社会価値を産み出すAI研究のセンター・オブ・エクセレンスの実現を目指すとしている。
AIスーパーコンピュータの設計・構築には、数十億円を投資。同システムは、1ノード当たり8基のハイエンドGPU「NVIDIA A100 80GB Tensor コア GPU」を搭載したGPUサーバー116台(スーパーマイクロ社製)と、16PB超のEXAScaler高性能並列ファイルシステム(データダイレクト・ネットワークス社製)を搭載した、ストレージアプライアンスで構成されるという。
理論上の処理性能は580 PFLOPS超となり、数千万枚の画像を数分間で学習可能。また、ネットワークには高速イーサネットスイッチ「NVIDIA Spectrum SN3700」を採用し、全サーバーを200GbEで接続してRoCE(RDMA over Converged Ethernet)v2による高速・低遅延での通信を行うことで、高速での分散学習を実現すると述べている。
同社は、オープンソースのコンテナ管理技術である「Kubernetes」を中核とした独自の構築技術により、これらのハードウェアとソフトウェア群を密に結合することで、高性能かつ利便性の高いシステムを実現するとしている。