Xilinx: PCIe Gen4 Beschleuniger-Karte

08.08.2019 PRODUKT NEWS FPGA-EDA

Xilinx erweitert sein Alveo Portfolio an Beschleuniger-Karten für Datenzentren mit der Einführung der Alveo U50. Die U50 Karte ist laut Xilinx der industrieweit erste adaptierbare Low-Profile Beschleuniger mit Unterstützung von PCIe Gen 4. Sie ist zur Leistungsmaximierung eines breiten Bereichs von kritischen Rechner-, Netzwerk- und Speicher-Workloads vorgesehen.

Auf Basis der Xilinx UltraScale+ Architektur ist die Alveo U50 Karte das erste Produkt im Alveo Portfolio, das im Half-Height-/Half-Length-Formfaktor mit einem Leistungsverbrauch von 75W angeboten wird. Die Karte bietet einen breitbandigen Speicher (HBM2), Netzwerk-Konnektivität mit 100 Gb/s, sowie Unterstützung von PCIe Gen-4 und CCIX Interconnect.

Mit 8 GB an HBM2 sind laut Hersteller Datentransfers mit mehr als 400 Gb/s möglich, wobei die QSFP-Ports bis zu 100 Gb/s an Netzwerk-Konnektivität bieten. Die High-Speed Netzwerk I/O-Auslegung unterstützt außerdem Applikationen, wie NVMe-oF (NVM Express over Fabrics), disaggregierte Rechnerspeicher und spezielle Applikationen wie Finanz-Dienstleistungen.

Anders als die Alternativen mit fester Architektur erlaubt die Software- und Hardware-Programmierbarkeit von Alveo U50 den Anwendern die Erfüllung von häufig wechselnden Anforderungen und die Optimierung der Performance ihrer Applikationen.

Die Beschleunig mit Alveo U50 für ausgewählte Applikationen:

Beschleunigung der Deep Learning Inferenz (für Sprachübersetzung): mit bis zu 25-fach geringer Latenz, zehnfach höherem Durchsatz und signifikant verbesserter Leistungseffizienz pro Node im Vergleich zu GPUs für die Performance von Sprachbersetzungen¹;
Beschleunigung von Data-Analytics (Database Query): durch Einsatz des TPC-H Query Benchmark. Alveo U50 liefert einen vierfach höheren Durchsatz pro Stunde, bei um den Faktor Drei reduzierten Betriebskosten gegenüber In-Memory CPUs²;
Beschleunigung der Rechnerspeicherung (Kompression): liefert den zwanzigfachen Kompressions-/Dekompressions-Durchsatz, schnellere Hadoop- und Big-Data Analytik, sowie um mehr als 30 Prozent geringere Kosten pro Node im Vergleich zu reinen CPU-Nodes³;
Netzwerk-Beschleunigung (elektronische Handelssysteme): erzielt eine um den Faktor 20 niedrigere Latenz bei Handelszeiten von weniger als 500 ns im Vergleich zur reinen CPU-Latenz von 10 µs⁴;
Finanzmodellierung (Grid Computing): Durch Einsatz der Monte Carlo Simulation erzielt Alveo U50 die siebenfache Leistungseffizienz im Vergleich zur reinen GPU-Performance5 und realisiert schnelleren Erkenntnisgewinn, deterministische Latenz und reduzierte Betriebskosten⁵.

Alveo U50 ist derzeit verfügbar in Sample-Stückzahlen. Die allgemeine Verfügbarkeit ist für den Herbst 2019 vorgesehen.

Fußnoten

Performance von Alveo U50, mit Alveo U50 und Nvidia Tesla T4 zugleich in Betrieb (B=2, L=8), Tesla T4 (B=8, L=8) (geschätzte Daten).
Alveo U50 = 24 ms, 150k Query/hr / CPU Query Time = 210 ms, 34k Query/hr. auf Basis des Intel Xeon Platinum 8260 Prozessors (35.75M Cache, 2.40 GHz) 24 Core.
Intel Skylake-SP 6152 @2.10GHz CPU (Ubuntu 16.04) CPU Query Time = 210 ms, 34k Query/hr. Alveo U50 = 24 ms, 150k Query/hr Xilinx Alveo U50 SDAccel 2018.3 (geschätzt) GB/s Kompression pro CPU Core = 0,0229. Alveo U50 = 10 GB/s (geschätzt).
Alveo U50 Latenz ist <0,5 µs, CPU-Latenz ist 10 µs. Gemessen vom Start von Packet-in on Tick (Marktdaten) zum Start of Packet-out on the order to Start of Packet Out on the Order (geschätzt).
Intel Xeon E5-2697 v4 GCC 5.4.0 Nvidia Tesla V100 16 GB PCIe CUDA 10.1 / GCC 5.4.0 Intel Skylake-SP 6152 @2.10 GHz CPU (Ubuntu 16.04) CPU Query Time = 210 ms, 34k Query/hr. Alveo U50 = 24 ms, 150k Query/hr Xilinx Alveo U50 SDAccel 2018.3 (geschätzte Daten).

Fachartikel

Weitere Meldungen

BRANCHEN-NEWS 25.04.2024

Vertriebskooperation von Rutronik und ADLINK

Bei Rutronik sind jetzt Produkte von ADLINK Technology erhältlich. Dazu haben beide Unternehmen einen Kooperationsvertrag unterzeichnet.

STROMVERSORGUNG 25.04.2024

Automotive-Gate-Treiber für 24 bis 72V

Der Motor-Gate-Treiber MOTIX TLE9140EQW von Infineon für die Migration von 12-V- zu 48-V-Systemen unterstützt funktionale Sicherheitsanforderungen.

MESSTECHNIK 25.04.2024

1-kV-Hochspannungs-PXI-Multiplexer

Eine 1-kV-Multiplexer-Serie mit Reed-Relais und einem Sicherheitskreis mit Hardware-Verriegelung hat Pickering Interfaces in PXI- und PXIe-Ausführung…

STROMVERSORGUNG 24.04.2024

Flex Power Designer Version 4.6 kostenfrei verfügbar

Von Flex Power Modules gibt es die aktuelle Version 4.6 seiner kostenlosen Software "Flex Power Designer". Mit dem Tool lassen sich…

LADETECHNIK 24.04.2024

Signalübertrager zur Isolation von Batteriemanagementsystemen mit 1500 VDC

Würth Elektronik erweitert seine Übertragerserie WE-BMS für Batteriemanagementsysteme um Versionen für eine Betriebsspannung von 1500 VDC.

Funkmodul 24.04.2024

Industrielle WLAN-Client-Module gemäß Wi-Fi 6

Phoenix Contact erweitert sein industrielles Netzwerkportfolio um WLAN-Client-Module gemäß dem Technologiestandard Wi-Fi 6 (IEEE 802.11ax). Die Module…

24.04.2024

Federkontaktstifte und PCB-Pins

Die Interconnect Group von CUI Devices bringt Federkontaktstifte (Pogo-Pins) und PCB-Pins. Die CPG-Familie von Pogo- und PCB-Pins bietet vergoldete…

BRANCHEN-NEWS 24.04.2024

Schneider Electric ernennt VP Service für die Region DACH

Seit April 2024 ist Marco Geiser als Vice President Service der Region DACH bei Schneider Electric tätig. Er kam 2022 als Service Director Schweiz ins…