Xilinx: Versal-Plattform mit skalierbarer KI-Inferenz

PRODUKT NEWS FPGA-EDA

Xilinx stellate seine Adaptive Compute Acceleration Platform (ACAP) namens Versal vor, die Scalar Processing Engines, Adaptable Hardware Engines und Intelligent Engines mit Speicher- und Interface-Technologien kombiniert. Die Hardware/Software-Plattform wird mit Tools, Software, Bibliotheken, IP, Middleware und Frameworks komplettiert.



Xilinx Versal basiert auf der 7-nm FinFET Prozesstechnologie von TSMC. Versal ist eine Plattform, die Software-Programmierbarkeit mit Domain-spezifischer Hardware-Beschleunigung und Adaptierbarkeit kombiniert. Das Portfolio besteht aus sechs Baustein-Serien, die dafür ausgelegt sind, Skalierbarkeit und KI-Inferenz (KI: künstliche Intelligenz; engl. AI) zu ermöglichen – von Cloud-Diensten über die Netzwerk- und Mobilfunk-Kommunikation bis zum Edge- und Endpoint Computing.


Das Portfolio besteht aus der Versal Prime Serie, der Premium-Serie und der HBM-Serie. Außerdem die AI Core Serie, die AI Edge Serie und die AI RF Serie, welche die AI Engine enthalten. Die AI Engine ist ein Hardware-Block, der den Bedarf an KI-Inferenz mit geringer Latenz über einen weiten Bereich von Applikationen adressiert. Sie unterstützt auch DSP-Implementierungen in Funk- und Radarsystemen.


Die AI Engine ist eng gekoppelt mit den Versal Adaptable Hardware Engines. Das ermöglicht die Beschleunigung der gesamten Applikation und die Abstimmung von Hardware und Software. Als erstes sind die Versal Prime Serie und die Versal AI Core Serie verfügbar.



Die Versal AI Core Serie ist …

für Cloud-, Netzwerk- und autonome Technologien optimiert. Sie besteht aus fünf Bausteinen, die jeweils 128 bis 400 AI Engines umfassen. Die Serie enthält Dual-Core Arm Cortex-A72 Applikationsprozessoren, Dual-Core Arm Cortex-R5 Real-Time-Prozessoren, 256 KB Onchip-Speicher mit ECC, sowie mehr als 1900 DSP Engines, die für Gleitpunkt-Operation mit niedriger Latenz optimiert sind.


Außerdem stehen mehr als 1,9 Millionen Logikzellen in Kombination mit 130MB an UltraRAM, bis zu 34MB Block-RAM, sowie 28MB an verteiltem RAM und 32MB an neuen Accelerator RAM-Blocks zur Verfügung. Sie können von jeder Engine adressiert werden. Diese Funktionalität dient der Unterstützung kundenspezifischer Speicher-Hierarchien.


Die Serie enthält außerdem 8-Lane- und 16-lane PCIe Gen4- und CCIX Host Interfaces, ein leistungsoptimiertes 32-GBit/s-SerDes, bis zu vier integrierte DDR4-Speicher-Controller, bis zu vier Multi-Rate Ethernet MACs, 650 High-Performance I/Os für MIPI D-PHY, NAND, Storage-Class Speicher-Schnittstellen und LVDS. Hinzu kommen 78 Multiplex I/Os zum Anschluss externer Komponenten und mehr als 40 HD-I/Os für 3,3V. Alles mit Interconnect über einen State-of-the-Art NoC (network-on-chip) mit bis zu 28 Master/Slave Ports, Multi-Terabit/s Bandbreite mit niedriger Latenz und hoher Leistungs-Effizienz, sowie nativer Software-Programmierbarkeit.



Die Versal Prime Serie …

ist für den breiten Einsatz in diversen Märkten ausgelegt. Sie ist optimiert in Bezug auf die Konnektivität und In-line-Beschleunigung der verschiedenen Workloads. Ausgelegt als Mid-Range Serie besteht sie aus neun Bausteinen. Jeder enthält Dual-Core Arm Cortex-A72 Applikationsprozessoren, Dual-Core Arm Cortex-R5 Real-Time-Prozessoren, 256 KB On-chip Speicher mit ECC, sowie mehr als 4000 DSP Engines, die für High-Precision Gleitpunktverarbeitung mit niedriger Latenz optimiert sind.


Sie enthält außerdem mehr als 2 Millionen Systemlogikzellen in Verbindung mit mehr als 200MB an UltraRAM, mehr als 90MB Block-RAM und 30MB verteiltem RAM zur Unterstützung kundenspezifischer Speicher-Hierarchien.


Ebenfalls in der Serie enthalten sind 8-Lane und 16-Lane PCIe Gen4- und CCIX Host Interfaces, ein leistungsoptimiertes 32-Gigabit/s-SerDes und ein 58-Gigabit/s PAM4 Mainstream SerDes, bis zu sechs integrierte DDR4 Speicher-Controller, bis zu vier Multi-Rate Ethernet MACs, 700 High-Performance I/Os für MIPI D-PHY, NAND, Storage-Class Speicher-Schnittstellen und LVDS, außerdem 78 Multiplex-I/Os zum Anschluss externer Komponenten und mehr als 40 HD-I/O für 3,3V.


Alles mit Interconnect über einen State-of-the-Art NoC (network-on-chip) mit bis 28 Master/Slave-Ports. Das ergibt eine Bandbreite von mehreren Terabit/s mit niedriger Latenz, hohe Leistungs-Effizienz und native Software-Programmierbarkeit.



Tools und Software

Das Xilinx Versal Portfolio wird durch eine Entwicklungsumgebung mit Software-Stack einschließlich Treibern, Middleware, Bibliotheken und Software Framework Support unterstützt. Xilinx steht gegenwärtig über sein Early Access Program mit zahlreichen Schlüsselkunden in Verbindung. Die Versal Prime Serie und die Versal AI Core Serie werden in der zweiten Jahreshälfte 2019 allgemein verfügbar sein.

Fachartikel