Intel-Logo

AN 872 Programmierbare Beschleunigungskarte mit Intel Arria 10 GX FPGA

AN 872-Programmierbare-Beschleunigungskarte-Intel-Arria-10-GX-FPGA-Produkt

Einführung

Über dieses Dokument

Dieses Dokument bietet Methoden zum Schätzen und Validieren der Leistungs- und Wärmeleistung Ihres AFU-Designs unter Verwendung der Intel® Programmable Acceleration Card mit Intel Arria® 10 GX FPGA in der Zielserverplattform.

Leistungsvorgabe

Der Board Management Controller überwacht und verwaltet thermische und strombezogene Ereignisse auf dem Intel FPGA PAC. Wenn das Board oder FPGA überhitzt oder zu viel Strom zieht, schaltet der Board Management Controller zum Schutz die FPGA-Stromversorgung ab. Anschließend wird auch die PCIe-Verbindung unterbrochen, was zu einem unerwarteten Systemabsturz führen kann. Weitere Einzelheiten zu den Kriterien, die das Herunterfahren des Boards auslösen, finden Sie unter „Automatisches Herunterfahren“. Im Normalfall sind die Temperatur und der Stromverbrauch des FPGA bei weitem die Hauptursache für das Herunterfahren. Um Ausfallzeiten zu minimieren und die Systemstabilität sicherzustellen, empfiehlt Intel, dass die Gesamtleistung des Boards 66 W und die des FPGAs 45 W nicht überschreitet. Die Leistung einzelner Komponenten und Boardbaugruppen variiert. Daher sind die Nennwerte niedriger als die Grenzwerte, um sicherzustellen, dass das Board in einem System mit unterschiedlichen Arbeitslasten und Eingangstemperaturen nicht zufällig heruntergefahren wird.

Leistungsvorgabe

 

System

Gesamtleistung der Platine (Watt)  

FPGA-Leistung (Watt)

Ein System mit einem FPGA Interface Manager (FIM) und AFU, das mit der schlimmsten Drosselungsarbeitslast für mindestens 15 Minuten bei einer Kerntemperatur von 95 °C läuft.  

66

 

45

Die Gesamtleistung der Platine variiert je nach Design Ihrer Accelerator Functional Unit (AFU) (Menge und Häufigkeit des Logik-Umschaltens), Eingangstemperatur, Systemtemperatur und Luftstrom des Zielsteckplatzes für den Intel FPGA PAC. Um diese Variabilität zu bewältigen, empfiehlt Intel, diese Leistungsspezifikation einzuhalten, um eine Stromabschaltung durch den Board Management Controller zu verhindern.

Zugehörige Informationen

Automatisches Herunterfahren.

Voraussetzungen

Der Originalgerätehersteller (OEM) des Servers muss bestätigen, dass jede Intel FPGA PAC, die mit einem PCIe-Steckplatz in einer Zielserverplattform verbunden ist, die thermischen Grenzwerte einhält, selbst wenn die Karte die maximal zulässige Leistung (66 W) verbraucht. Weitere Informationen finden Sie in den Intel PAC mit Intel Arria 10 GX FPGA-Plattform-Qualifizierungsrichtlinien(1).

Werkzeuganforderungen

Zum Abschätzen und Bewerten der Leistung und Wärmeleistung müssen Sie über die folgenden Tools verfügen.

  • Software:
    • Intel Acceleration Stack für die Entwicklung
    • BWtoolkit
    • AFU-Design(2)
    • Tcl-Skript (Download) – Wird zum Formatieren der Programmierung benötigt file zur Analyse
    • Early Power Estimator für Intel Arria 10-Geräte
    • Intel FPGA PAC Power Estimator-Datenblatt (Download)
  • Hardware:
    • Intel FPGA-PAC
    • Micro-USB-Kabel(3)
    • Zielserver für Intel FPGA PAC(4)

Intel empfiehlt, dass Sie bei der Softwareinstallation der Kurzanleitung zum Intel Acceleration Stack für die Intel Programmable Acceleration Card mit Intel Arria 10 GX FPGA folgen.

Zugehörige Informationen

Kurzanleitung zum Intel Acceleration Stack für die programmierbare Intel-Beschleunigungskarte mit Intel Arria 10 GX FPGA.

  1. Wenden Sie sich an Ihren Intel-Supportmitarbeiter, um auf dieses Dokument zuzugreifen.
  2. Das Verzeichnis build_synth wird erstellt, nachdem Sie Ihr AFU kompiliert haben.
  3. Im Acceleration Stack 1.2 erfolgt die Kartenüberwachung über PCIe.
  4. Stellen Sie sicher, dass Ihr OEM die gewünschten PCIe-Steckplätze gemäß den Plattformqualifizierungsrichtlinien für Ihren Intel FPGA PAC validiert hat.

Verwenden des Board Management Controllers

Automatische Abschaltung

Der Board Management Controller überwacht und steuert Resets, verschiedene Stromschienen, FPGA- und Platinentemperaturen. Wenn der Board Management Controller Bedingungen erkennt, die die Platine möglicherweise beschädigen können, schaltet er zum Schutz automatisch die Platinenstromversorgung ab.

Notiz: Wenn das FPGA keinen Strom mehr hat, ist die PCIe-Verbindung zwischen dem Intel FPGA PAC und dem Host unterbrochen. In vielen Systemen kann der Ausfall der PCIe-Verbindung zu einem Systemabsturz führen.

Kriterien für die automatische Abschaltung

In der folgenden Tabelle sind die Kriterien aufgelistet, bei deren Überschreitung der Board Management Controller die Stromversorgung des Boards abschaltet.

Parameter Grenzwert
Bordleistung 66 Watt
12-V-Backplane-Strom 6 A
12-V-Rückwandplatine Voltage 14 V
1.2 V Strom 16 A
1.2 V Voltage 1.4 V
1.8 V Strom 8 A
1.8 V Voltage 2.04 V
3.3 V Strom 8 A
3.3 V Voltage 3.96 V
FPGA-Core Voltage 1.08 V
FPGA-Kernstrom 60 A
FPGA-Kerntemperatur 100°C
Kernversorgungstemperatur 120°C
Platinentemperatur 80°C
QSFP Temperatur 90°C
QSFP-Voltage 3.7 V

Wiederherstellung nach automatischem Herunterfahren

Der Board Management Controller hält die Stromversorgung bis zum nächsten Ein- und Ausschalten abgeschaltet. Wenn die Stromversorgung einer Intel FPGA PAC-Karte abgeschaltet wird, müssen Sie daher den Server aus- und wieder einschalten, um die Stromversorgung der Intel FPGA PAC wiederherzustellen.

Die häufigste Ursache für Stromausfälle ist eine Überhitzung des FPGA (wenn die Kerntemperatur über 100 °C liegt) oder eine übermäßige Stromaufnahme des FPGA. Dies geschieht normalerweise, wenn das AFU-Design die von Intel FPGA PAC definierten Leistungsgrenzen überschreitet oder die Luftzirkulation unzureichend ist. In diesem Fall müssen Sie den Stromverbrauch Ihrer AFU reduzieren.

Überwachen Sie On-Board-Sensoren mit OPAE

Verwenden Sie das Befehlszeilenprogramm fpgainfo, um die Temperatur- und Leistungssensordaten vom Board Management Controller zu erfassen. Sie können dieses Programm mit dem Acceleration Stack 1.2 und höher verwenden. Verwenden Sie für Acceleration Stack 1.1 oder älter das Tool BWMonitor, wie im nächsten Abschnitt beschrieben.

So erfassen Sie die Temperaturdaten:

  • bash-4.2$ fpgainfo temp

Sample Ausgabe

AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 2

So erfassen Sie die Leistungsdaten

  • bash-4.2$ fpgainfo Leistung

Sample Ausgabe

AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 4AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 5

Überwachen Sie Bordsensoren mit BWMonitor

  • BWMonitor ist ein BittWare-Tool, mit dem Sie die Temperatur, Lautstärke und den Stromverbrauch von FPGAs/Boards messen können.tage und aktuell.

Voraussetzung: Sie müssen ein Micro-USB-Kabel zwischen dem Intel FPGA PAC und dem Server installieren.

  1. Installieren Sie die entsprechende BittWorks II Toolkit-Lite-Software, Firmware und den Bootloader.

Betriebssystemkompatible BittWorks II ToolkitLite-Version

Betriebssystem Freigeben BittWorks II Toolkit - Lite-Version Befehl installieren
CentOS 7.4/RHEL 7.4 2018.6 Enterprise Linux 7 (64 Bit) bw2tk-

lite-2018.6.el7.x86_64.rpm

sudo yum installiere bw2tk-\ lite-2018.6.el7.x86_64.rpm
Ubuntu 16.04 2018.6 Ubuntu 16.04 (64-Bit) bw2tk-

lite-2018.6.u1604.amd64.deb

sudo dpkg -i bw2tk-\ 2018.6.u1604.amd64.deb

Siehe Erste Schritte webSeite zum Herunterladen der BMC-Firmware und -Tools

  • BMC-Firmware-Version: 26889
  • BMC Bootloader-Version: 26879

Speichern Sie die files an einen bekannten Speicherort auf dem Hostcomputer. Das folgende Skript fordert diesen Speicherort an.

Fügen Sie das Bittware-Tool zu PATH hinzu:

  • export PATH=/opt/bwtk/2018.6.0L/bin/:$PATH

Sie können den BWMonitor starten mit

  • /opt/bwtk/2018.6L/bin/bwmonitor-gui&

Sample Messungen

AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 10

AFU-Design-Leistungsüberprüfung

Leistungsmessfluss

Um die Leistung Ihres AFU-Designs zu bewerten, erfassen Sie die folgenden Messwerte:

  • Gesamtleistung der Platine und FPGA-Temperatur
    • (nachdem Sie die Worst-Case-Datenmuster 15 Minuten lang auf Ihrem Design ausgeführt haben)
  • Statische Leistung und Temperatur
    • (unter Verwendung eines statischen Leistungsmessdesigns)
  • Worst-Case-Statikleistung
    • (vorhergesagte Werte mithilfe des Early Power Estimator für Intel Arria 10-Geräte)

Verwenden Sie dann das Intel FPGA PAC Power Estimator Sheet (Download) mit diesen aufgezeichneten Messwerten, um zu überprüfen, ob Ihr AFU-Design die Spezifikation erfüllt.

Messen der Gesamtleistung der Platine

Führen Sie die folgenden Schritte aus

  1. Installieren Sie den Intel PAC mit Intel Arria 10 GX FPGA in einem geeigneten PCIe-Steckplatz im Server. Wenn Sie BWMonitor zur Messung verwenden, verbinden Sie das Micro-USB-Kabel von der Rückseite der Karte mit einem beliebigen USB-Anschluss des Servers.
  2. Laden Sie Ihre AFU und betreiben Sie sie mit maximaler Leistung.
    • Wenn die AFU Ethernet verwendet, stellen Sie sicher, dass das Netzwerkkabel oder -modul eingesteckt und mit dem Verbindungspartner verbunden ist und der Netzwerkverkehr in der AFU aktiviert ist.
    • Führen Sie bei Bedarf kontinuierlich DMA aus, um das integrierte DDR4 zu testen.
    • Führen Sie Ihre Anwendungen auf dem Host aus, um die AFU mit dem Worst-Case-Datenverkehr zu versorgen und das FPGA voll auszulasten. Stellen Sie sicher, dass Sie das FPGA mit dem stärkstem Datenverkehr belasten. Führen Sie diesen Schritt mindestens 15 Minuten lang aus, damit sich die Kerntemperatur des FPGA stabilisieren kann.
      • Notiz: Überwachen Sie während des Tests die Gesamtleistung der Platine, die FPGA-Leistung und die FPGA-Kerntemperatur, um sicherzustellen, dass sie innerhalb der Spezifikation bleiben. Wenn die Grenzwerte 66 W, 45 W oder 100 °C erreicht werden, brechen Sie den Test sofort ab.
  3. Nachdem sich die FPGA-Kerntemperatur stabilisiert hat, verwenden Sie das Programm fpgainfo oder das Tool BWMonitor, um die Gesamtplatinenleistung und die FPGA-Kerntemperatur aufzuzeichnen. Tragen Sie diese Werte in Zeile Schritt 1: Messung der Gesamtplatinenleistung des Intel FPGA PAC Power Estimator Sheet ein.

Intel FPGA PAC Power Estimator - Datenblatt Sample

AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 11

Messung der tatsächlichen statischen Leistung

Leckstrom ist eine der Hauptursachen für Schwankungen im Stromverbrauch von Platine zu Platine. Die Leistungsmessungen im obigen Abschnitt umfassen die Leistung aufgrund von Leckstrom (statische Leistung) und die Leistung aufgrund der AFU-Logik (dynamische Leistung). In diesem Abschnitt messen Sie die statische Leistung der zu testenden Platine, um die dynamische Leistung zu ermitteln.

Bevor Sie die statische Leistung des FPGA messen, verwenden Sie das Skript disable-gpio-input-bufferintelpac-arria10-gx.tcl (Download), um die FPGA-Programmierung durchzuführen file, (*.sof file), das ein FIM- und AFU-Design enthält. Das Tcl-Skript deaktiviert alle FPGA-Eingangspins, um sicherzustellen, dass innerhalb des FPGA kein Umschalten stattfindet (was bedeutet, dass keine dynamische Leistung bereitgestellt wird). Siehe Minimal Flow ExampDatei zum Kompilieren alsampDie generierte *.sof file befindet sich in:

  • cd $OPAE_PLATFORM_ROOT/hw/samples/ $ OPAE_PLATFORM_ROOT/hw/samples/ build_synth/build/ausgabe_files/ afu_*.sof

Sie müssen die Datei disable-gpio-input-buffer-intel-pac-arria10-gx.tcl im obigen Verzeichnis speichern und dann den folgenden Befehl ausführen

  • # quartus_asm -t deaktivieren-gpio-input-buffer-intel-pac-arria10-gx.tclafu_*.sof
Sample Ausgabe

Info: ******************************************************************* Die Info:
Ausführen von Quartus Prime Assembler
Info: Version 17.1.1 Build 273 12 SJ Pro Edition
Info: Copyright (C) 2017 Intel Corporation. Alle Rechte vorbehalten. Info: Ihre Nutzung
von Intel Corporations Design-Tools, Logikfunktionen Info: und anderer Software und Tools, und seine AMPP Partnerlogik Info: Funktionen und ggf. Ausgabe files aus einer der vorgenannten Informationen: (einschließlich Geräteprogrammierung oder Simulation files) und alle zugehörigen Dokumentationen oder Informationen unterliegen ausdrücklich den Bedingungen des Intel-Programmlizenz-Abonnementvertrags, des Intel Quartus Prime-Lizenzvertrags,

AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 15

Nach erfolgreicher Ausführung des Tcl-Skripts wird die Datei afu_*.sof file ist aktualisiert und bereit für die FPGA-Programmierung.

Befolgen Sie diese Schritte, um die tatsächliche statische Leistung zu messen

  1. Verwenden Sie den Intel Quartus® Prime-Programmierer zum Programmieren der *.sof file. Ausführliche Schritte finden Sie unter „Verwendung des Intel Quartus Prime Programmer“ auf Seite 12.
  2. Überwachen Sie die FPGA-Kerntemperatur, Voltage und Strom mit dem Tool BWMonitor. Tragen Sie diese Werte in Zeile Schritt 2: Statische Leistungsmessung des FPGA-Kerns des Intel FPGA PAC Power Estimator Sheet ein.

Zugehörige Informationen

  • Intel Acceleration Stack Quick Start Guide für Intel Programmable Acceleration Card mit Intel Arria 10 GX FPGA
  • Überwachen Sie Bordsensoren mit BWMonitor.

Verwenden des Intel Quartus Prime Programmer

Um diese Schritte auszuführen, müssen Sie das Micro-USB-Kabel zwischen dem Intel FPGA PAC und dem Server angeschlossen haben:

  1. Suchen Sie den Root-Port und den Endpunkt der Intel FPGA PAC-Karte: $ lspci -tv | grep 09c4

Example Ausgabe 1 zeigt, dass der Root-Port d7:0.0 und der Endpunkt d8:0.0 ist.

  • -+-[0000:d7]-+-00.0-[d8]—-00.0 Intel Corporation Gerät 09c4

ExampAusgabe 2 zeigt, dass der Root-Port 0:1.0 und der Endpunkt 3:0.0 ist.

  • +-01.0-[03]—-00.0 Intel Corporation Gerät 09c4

ExampAusgabe 3 zeigt, dass der Root-Port 85:2.0 und der Endpunkt 86:0.0 ist und

  • +-[0000:85]-+-02.0-[86]—-00.0 Intel Corporation Gerät 09c4

Notiz: Keine Ausgabe weist auf einen Fehler bei der PCIe*-Geräteaufzählung hin und darauf, dass der Flash nicht programmiert ist.

  • #Maskieren Sie nicht korrigierbare Fehler und korrigierbare Fehler von FPGA
    • $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
    • $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
  • # Nicht korrigierbare Fehler maskieren und korrigierbare Fehler von RP maskieren
    • $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
    • $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0xFFFFFFFF

Führen Sie den folgenden Intel Quartus Prime Programmer-Befehl aus:

  • sudo $QUARTUS_HOME/bin/quartus_pgm -m JTAG -o 'pvbi;afu_*.sof'

AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 16 AN 872-Programmierbare-Beschleunigungskarte -Intel-Arria-10-GX-FPGA-Abb. 17

  1. Um nicht korrigierbare Fehler zu demaskieren und korrigierbare Fehler zu maskieren, führen Sie die folgenden Befehle aus
    • # Demaskieren Sie nicht korrigierbare Fehler und maskieren Sie korrigierbare Fehler des FPGA
      • $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0x00000000
      • $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0x00000000
    • # Nicht korrigierbare Fehler demaskieren und korrigierbare Fehler von RP maskieren:
      • $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0x00000000
      • $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0x00000000
  2. Neustart.

Zugehörige Informationen

Intel Acceleration Stack Quick Start Guide für Intel Programmable Acceleration Card mit Intel Arria 10 GX FPGA

Abschätzung der schlimmsten statischen Kernleistung

Befolgen Sie diese Schritte, um die statische Leistung im schlimmsten Fall abzuschätzen

  1. Siehe Minimal Flow ExampDatei zum Kompilieren alsampdie AFU befindet sich in:
    • /hw/samples/ /
  2. Klicken Sie in der Intel Quartus Prime Pro Edition-Software auf File > Öffnen Sie das Projekt und wählen Sie Ihre .qpf file um das AFU-Syntheseprojekt über den folgenden Pfad zu öffnen:
    • /hw/samples/ /build_synth/bauen
  3. Klicken Sie auf Projekt > EPE generieren File um die erforderliche .csv zu erstellen file.
    • Schritt 2 AbbildungAN-872 -Beschleunigungskarte-mit-Intel-Arria-10-GX-FPGA-Abb. 1
  4. Öffnen Sie das Tool Early Power Estimator (5) und klicken Sie auf das Symbol CSV importieren. Wählen Sie die oben generierte CSV-Datei aus. file.
    • Notiz: Sie können die Warnung beim Importieren der CSV-Datei ignorieren. file.
  5. Eingabeparameter werden automatisch ausgefüllt.
  • Ändern Sie den Wert im Feld Junction Temp. TJ in User Entered. Und setzen Sie das Feld Junction Temp. TJ (°C) auf 95
  • Ändern Sie das Feld „Leistungseigenschaften“ von „Typisch“ in „Maximal“.
  • Im EPE-Tool ist PSTATIC die gesamte statische Leistung in Watt. Sie können die statische Kernleistung im schlimmsten Fall auf der Registerkarte Bericht berechnen.

EPE Werkzeug Sample Ausgabe

AN-872 -Beschleunigungskarte-mit-Intel-Arria-10-GX-FPGA-Abb. 2

Registerkarte „Bericht“.

AN-872 -Beschleunigungskarte-mit-Intel-Arria-10-GX-FPGA-Abb. 3

Im ExampWie oben gezeigt, ist der gesamte statische Strom des FPGA-Kerns die Summe aller statischen Ströme und des Standby-Stroms bei 0.9 V (VCC, VCCP, VCCERAM). Tragen Sie diese Werte in Zeile Schritt 3 ein: Schlechteste statische Leistung von EPE des Intel FPGA PAC Power Estimator Sheet. Beachten Sie die Zeile „Berechnete Ausgabe“ für den maximalen Stromverbrauch Ihrer AFU.

Dokumentrevisionsverlauf für Wärme- und Leistungsrichtlinien für Intel PAC mit Intel Arria 10 GX FPGA

Dokumentversion Änderungen
2019.08.30 Erstveröffentlichung.

Intel Corporation. Alle Rechte vorbehalten. Intel, das Intel-Logo und andere Intel-Marken sind Marken der Intel Corporation oder ihrer Tochtergesellschaften. Intel garantiert die Leistung seiner FPGA- und Halbleiterprodukte gemäß den aktuellen Spezifikationen gemäß Intels Standardgewährleistung, behält sich jedoch das Recht vor, jederzeit ohne Vorankündigung Änderungen an Produkten und Diensten vorzunehmen. Intel übernimmt keine Verantwortung oder Haftung, die sich aus der Anwendung oder Verwendung von hierin beschriebenen Informationen, Produkten oder Diensten ergeben, es sei denn, Intel hat ausdrücklich schriftlich zugestimmt. Intel-Kunden wird empfohlen, die neueste Version der Gerätespezifikationen zu beschaffen, bevor sie sich auf veröffentlichte Informationen verlassen und bevor sie Produkte oder Dienstleistungen bestellen.

Bei anderen Namen und Marken kann es sich um das Eigentum Dritter handeln.

ISO

  • 9001:2015
    Eingetragen

AUSWEIS: 683795
Version: 2019.08.30

Dokumente / Ressourcen

Programmierbare Beschleunigungskarte Intel AN 872 mit Intel Arria 10 GX FPGA [pdf] Benutzerhandbuch
AN 872 Programmierbare Beschleunigungskarte mit Intel Arria 10 GX FPGA, AN 872, Programmierbare Beschleunigungskarte mit Intel Arria 10 GX FPGA

Verweise

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind markiert *