5つのブレークスルー・テクノロジを備えた新しいNVIDIA Pascal GPUアーキテクチャをベースとする「Tesla P100」は、計算処理上の要求が最も高いアプリケーションを動かすための、比類なきパフォーマンスと効率を提供するという。
Cognitive SolutionsおよびIBM Researchのシニア・バイス・プレジデント、ジョン・ケリー3世博士は、「コンピューティングの新時代に突入する今、AIとコグニティブのメリットを十分に享受するには、基本的なテクノロジに対するまったく新しいアプローチが必要となります。NVIDIA GPUとOpenPOWERのテクノロジの組み合わせにより、Watsonにおいては既に新しいスキルの習得が加速しています。IBMのPowerアーキテクチャと、NVLinkを搭載したNVIDIAのPascalアーキテクチャが合わさることで、コグニティブ・ワークロードのパフォーマンスはさらに加速し、人工知能産業は発展します」と述べている。
「Tesla P100」は、次のような5つのブレークスルーをベースに、前例のないパフォーマンス、拡張性、プログラミング効率を実現するという。
・NVIDIA Pascalアーキテクチャによるパフォーマンスの飛躍的な向上:Pascalベースの「Tesla P100」ソリューションでは、前世代のNVIDIA Maxwellベースのソリューションに比べ、12倍を超すニューラル・ネットワーク・トレーニング・パフォーマンスを提供。
・NVIDIA NVLinkにより最大化されたアプリケーションの拡張性:NVIDIA NVLink高速GPUインターコネクトでは、複数のGPU間にアプリケーションを拡張し、今日のクラス最高のソリューションに比べ5倍の帯域幅での高速化を実現。単一のノードでのアプリケーションのパフォーマンスを最大化するために、最大で8台の「Tesla P100」GPUをNVLinkとインターコネクトでき、IBMでは、CPU、GPU間の通信の高速化のためにNVLinkをPOWER8 CPUに搭載。
・16nm FinFETによる前例のないエネルギー効率:16ナノメートルのFinFET製造技術によって作られた153億のトランジスタを備えたPascal GPUは、これまでに作られた世界最大のFinFETチップ。
・ビッグデータのワークロードのためのHBM2 搭載CoWoS:Pascalアーキテクチャは、前例のない計算効率を実現するために、プロセッサとデータを単一のパッケージに統合。メモリ・デザインへの革新的なアプローチであるHBM2を搭載したCoWoS(チップ・オン・ウェハ・オン・サブストレート)では、Maxwellアーキテクチャに比べ、3倍のメモリ帯域幅のパフォーマンス、すなわち720GB/秒を実現。
・ピーク・パフォーマンスのための新たなAIアルゴリズム:新しい半精度命令により、ディープ・ラーニング時に21テラフロップス以上のピーク・パフォーマンスを実現。