Hardware
NVLink umožní úzké propojení CPU s GPU

NVIDIA dne 25. března 2014 uvedla, že do svých budoucích GPU plánuje integrovat vysokorychlostní propojení s názvem NVIDIA® NVLink™, které umožní sdílení dat mezi GPU a CPU pět až dvanáctkrát rychleji než je to možné dnes.

Eliminuje to dlouhodobý problém propustnosti a pomůže vývoji exascale superpočítačů, které jsou 50-100 krát rychlejší než nejvýkonnější systémy současnosti.

 

NVIDIA přidá technologii NVLink do své Pascal GPU architektury (s očekávaným uvedením v roce 2016), která naváže na v letošním roce uvedenou architekturu NVIDIA Maxwell. Nové propojení bylo vyvíjeno ve spolupráci se společností IBM, která jej zapracovává do budoucích verzí svých POWER CPU.

 

“Technologie NVLink naplno otevře potenciál GPU (grafického procesoru) zásadním zrychlením výměny dat mezi CPU a GPU, a minimalizováním času, po který musí GPU čekat, než jsou data zpracována,” říká pan Brian Kelleher, senior víceprezident divize GPU Engineering ve společnosti  NVIDIA.

 

“NVLink umožní rychlou výměnu dat mezi CPU a GPU, čímž vylepší datovou průchodnost skrze výpočetní systém a překoná klíčové zúžené hrdlo akcelerovaných výpočtů dneška,” říká pan  Bradley McCredie, víceprezident a IBM Fellow ze společnosti IBM. “NVLink usnadní vývojářům modifikovat programy a aplikace v oblastech high-performance a zpracování dat, tak aby byly schopné využít výhody akcelerovaných CPU-GPU systémů. Stojíme si za tím, že tato technologie je dalším významným přispěvkem do našeho OpenPOWER ekosystému.”

 

 

S technologií NVLink, pevně spojující IBM POWER CPU a NVIDIA Tesla® GPU, bude ekosystém datových center POWER schopen naplno využít GPU akcelerace v širokém a spektru aplikačních sad v oborech jako jsou high performance computing, zpracování dat a machine learning.

 

Výhody oproti PCI Express 3.0

Dnešní grafické procesory (GPU) jsou s centrálními procesory (CPU) na bázi x86 propojeny pomocí rozhraní PCI Express (PCIe), které omezuje schopnost GPU přistupovat do paměťového systému CPU, a je v těchto operacích čtyřikrát až pětkrát pomalejší než běžný CPU paměťový systém. PCIe předsatvuje ještě užší hrdlo v případě komunikace mezi GPU a IBM POWER CPU, které má vyšší propustnost než x86 procesory. Jelikož NVLink rozhraní nabídne propustnost typického CPU paměťového systému, umožní GPU přístup do paměti CPU v plné propustnosti.

 

Toto vysokopropustné propojení zásadně zvýší výkon akcelerovaných programových aplikací.  Kvůli rozdílům v práci s pamětí - GPU mají rychlé, ale malé paměti, kdežto CPU operují s velkou, ale pomalou pamětí - akcelerované programové aplikace typicky přesouvají data ze sítě či pevného disku do paměti CPU a potom je kopírují do GPU paměti, kde jsou následně připravena na rychlé operace. S NVLinkem se data dostanou z CPU do GPU paměti mnohem rychleji, což přináší onen kýžený efekt GPU-akcelerovaných aplikací, běžících zásadně rychleji.

 

Unified Memory vlastnost

Rychlejší přenos dat, spolu s další vlastností známou jako Unified Memory, usnadní programování GPU akcelerátoru. Unified Memory umožňuje programátorovi pracovat s CPU a GPU pamětí jako s jedním blokem paměti. Může s daty pracovat bez ohledu na to, jestli se nachází v paměti CPU nebo GPU.

 

Přestože budoucí NVIDIA GPU budou i nadále podporovat PCIe, technologie NVLink bude sloužit k propojení GPU s procesory (CPU), které jej budou podporovat, stejně jako k vysokopropustnému spojení mezi více GPU. Dále je dobré vědět, že i přes vysokou rychlost přenosu dat je NVLink mnohem méně náročný na spotřebu energie počítané na přenos bitu v porovnání s PCIe. 

 

NVIDIA vyvinula pro umístění GPU založeného na Pascal architektuře s NVLinkem speciální modul. Tento nový GPU modul je velikostí třikrát menší než dnes používané moduly pro GPU na běžných PCIe deskách. Konektory na spodní straně modulu architektury Pascal umožní zasunutí karty do základní desky  a vylepší design systému a integritu signálu. 

 

Vysokorychlostní propojení NVLink umožní stavbu úzce spolupracujících systémů, což představuje cestu ke skutečně energeticky úsporným a škálovatelným exascale superpočítačům, běžícím na 1 000 petaflopech (1 x 1018operací s plovoucí desetinnou čárkou za vteřinu), nebo chcete-li 50 až 100 krát rychlejších, než dnešní nejvýkonnější systémy.

ZDROJ:NVIDIA Blog

Komentáře uživatelů

987x
0
Sdílet odkaz na článek:
reklama
ISSN 1801-0539