Carte d'accélération programmable AN 872 avec FPGA Intel Arria 10 GX
Introduction
À propos de ce document
Ce document fournit des méthodes pour estimer et valider la puissance et les performances thermiques de votre conception AFU à l'aide de la carte d'accélération programmable Intel® avec FPGA Intel Arria® 10 GX dans la plate-forme de serveur cible.
Puissance Specification
Le contrôleur de gestion de carte surveille et gère les événements thermiques et d'alimentation sur le FPGA PAC d'Intel. Lorsque la carte ou le FPGA surchauffe ou tire un courant excessif, le contrôleur de gestion de la carte coupe l'alimentation du FPGA pour la protection. Par la suite, cela interrompt également la liaison PCIe, ce qui peut provoquer un plantage inattendu du système. Reportez-vous à Arrêt automatique pour plus de détails sur les critères qui déclenchent l'arrêt de la carte. Dans des cas normaux, la température et la puissance du FPGA sont de loin la principale cause d'arrêt. Pour minimiser les temps d'arrêt et assurer la stabilité du système, Intel recommande que la puissance totale de la carte ne dépasse pas 66 W et que la puissance du FPGA ne dépasse pas 45 W. Les composants individuels et les assemblages de cartes ont une variabilité de puissance. Par conséquent, les valeurs nominales sont inférieures aux limites pour garantir que la carte ne subit pas d'arrêt aléatoire dans un système avec des charges de travail et des températures d'entrée variables.
Puissance Specification
Système | Puissance totale de la carte (watts) | Puissance FPGA (watts) |
Un système avec un gestionnaire d'interface FPGA (FIM) et une AFU qui s'exécute avec la charge de travail de limitation dans le pire des cas pendant au moins 15 minutes à une température centrale de 95 °C. | 66 | 45 |
La puissance totale de la carte varie en fonction de la conception de votre unité fonctionnelle d'accélérateur (AFU) (quantité et fréquence de basculement logique), de la température d'entrée, de la température du système et du débit d'air de l'emplacement cible pour le FPGA PAC d'Intel. Pour gérer cette variabilité, Intel vous recommande de respecter cette spécification d'alimentation pour empêcher l'arrêt de l'alimentation par le contrôleur de gestion de carte.
Informations connexes
Extinction automatique.
Prérequis
Le fabricant d'équipement d'origine (OEM) du serveur doit valider que chaque PAC Intel FPGA interfaçant avec un emplacement PCIe dans une plate-forme de serveur cible peut rester dans les limites thermiques même lorsque la carte consomme la puissance maximale autorisée (66 W). Pour plus d'informations, reportez-vous aux directives de qualification de la plate-forme Intel PAC avec Intel Arria 10 GX FPGA(1).
Outils requis
Vous devez disposer des outils suivants pour estimer et évaluer la puissance et les performances thermiques.
- Logiciel:
- Pile d'accélération Intel pour le développement
- Boîte à outils BW
- Conception AFU(2)
- Script Tcl (téléchargement) – Requis pour formater la programmation file pour analyse
- Estimateur de puissance précoce pour les appareils Intel Arria 10
- Feuille d'estimateur de puissance Intel FPGA PAC (télécharger)
- Matériel:
- Processeur Intel FPGA
- Câble micro-USB(3)
- Serveur cible pour Intel FPGA PAC(4)
Intel vous recommande de suivre le Guide de démarrage rapide Intel Acceleration Stack pour la carte d'accélération programmable Intel avec FPGA Intel Arria 10 GX pour l'installation du logiciel.
Informations connexes
Guide de démarrage rapide de la pile d'accélération Intel pour la carte d'accélération programmable Intel avec FPGA Intel Arria 10 GX.
- Contactez votre représentant du support Intel pour accéder à ce document.
- Le répertoire build_synth est créé après la compilation de votre AFU.
- Dans Acceleration Stack 1.2, la surveillance de la carte est effectuée via PCIe.
- Assurez-vous que votre OEM a validé le ou les emplacements PCIe ciblés conformément aux directives de qualification de la plate-forme pour votre Intel FPGA PAC.
Utilisation du contrôleur de gestion de carte
Extinction automatique
Le contrôleur de gestion de carte surveille et contrôle les réinitialisations, les différents rails d'alimentation, les températures du FPGA et de la carte. Lorsque le contrôleur de gestion de carte détecte des conditions susceptibles d'endommager la carte, il coupe automatiquement l'alimentation de la carte pour la protection.
Note: Lorsque le FPGA perd de l'alimentation, la liaison PCIe entre le PAC Intel FPGA et l'hôte est interrompue. Dans de nombreux systèmes, la liaison PCIe peut provoquer une panne du système.
Critères d'arrêt automatique
Le tableau suivant répertorie les critères au-delà desquels le contrôleur de gestion de carte coupe l'alimentation de la carte.
Paramètre | Seuil limite |
Puissance du tableau | 66 W |
Courant de fond de panier 12v | 6 A |
Volume du fond de panier 12vtage | 14 V |
Courant 1.2v | 16 A |
Vol. 1.2vtage | 1.4 V |
Courant 1.8v | 8 A |
Vol. 1.8vtage | 2.04 V |
Courant 3.3v | 8 A |
Vol. 3.3vtage | 3.96 V |
Volume de base FPGAtage | 1.08 V |
Courant de cœur FPGA | 60 A |
Température du cœur du FPGA | 100°C |
Température d'alimentation du cœur | 120°C |
Température de la carte | 80°C |
Température QSFP | 90°C |
Volume QSFPtage | 3.7 V |
Récupération après l'arrêt automatique
Le contrôleur de gestion de carte maintient l'alimentation hors tension jusqu'au prochain cycle d'alimentation. Par conséquent, lorsqu'une carte Intel FPGA PAC est mise hors tension, vous devez redémarrer le serveur pour rétablir l'alimentation de la carte Intel FPGA PAC.
La cause la plus fréquente d'arrêt de l'alimentation est la surchauffe du FPGA (lorsque la température du cœur est supérieure à 100 °C) ou le courant excessif du FPGA. Cela se produit généralement lorsque la conception AFU dépasse les enveloppes de puissance définies par Intel FPGA PAC ou que le débit d'air est insuffisant. Dans ce cas, vous devez réduire la consommation électrique de votre AFU.
Surveiller les capteurs embarqués à l'aide d'OPAE
Utilisez le programme de ligne de commande fpgainfo pour collecter les données des capteurs de température et d'alimentation à partir du contrôleur de gestion de carte. Vous pouvez utiliser ce programme avec Acceleration Stack 1.2 et au-delà. Pour Acceleration Stack 1.1 ou version antérieure, utilisez l'outil BWMonitor comme décrit dans la section suivante.
Pour collecter les données de température :
- bash-4.2$ fpgainfo temp
Sampla sortie
Pour recueillir les données de puissance
- bash-4.2$ fpgainfo puissance
Sampla sortie
Surveiller les capteurs embarqués à l'aide de BWMonitor
- BWMonitor est un outil BittWare qui vous permet de mesurer la température FPGA/carte, voltage, et actuel.
Condition préalable: Vous devez installer un câble micro-USB entre l'Intel FPGA PAC et le serveur.
- Installez le logiciel, le micrologiciel et le chargeur de démarrage BittWorks II Toolkit-Lite appropriés.
Version BittWorks II Toolkit Lite compatible avec le système d'exploitation
Système opérateur | Libérer | Version Lite de la boîte à outils BittWorks II | Commande d'installation | |
CentOS 7.4/RHEL 7.4 | 2018.6 Entreprise Linux 7 (64 bits) | bw2tk- lite-2018.6.el7.x86_64.rpm | ||
sudo yum installer bw2tk-\ lite-2018.6.el7.x86_64.rpm | ||||
Ubuntu 16.04 | 2018.6Ubuntu 16.04 (64 bits) | bw2tk- lite-2018.6.u1604.amd64.deb | ||
sudo dpkg -i bw2tk-\ 2018.6.u1604.amd64.deb |
Reportez-vous à la mise en route webpage pour télécharger le firmware et les outils BMC
- Version du micrologiciel BMC : 26889
- Version du chargeur de démarrage BMC : 26879
Sauver le files vers un emplacement connu sur la machine hôte. Le script suivant demande cet emplacement.
Ajoutez l'outil Bittware à PATH :
- export PATH=/opt/bwtk/2018.6.0L/bin/:$PATH
Vous pouvez lancer le BWMonitor en utilisant
- /opt/bwtk/2018.6L/bin/bwmonitor-gui&
Sample Mesures
Vérification de la puissance de conception AFU
Flux de mesure de puissance
Pour évaluer la puissance de votre conception AFU, capturez les métriques suivantes :
- Puissance totale de la carte et température du FPGA
- (après avoir exécuté les modèles de données les plus défavorables sur votre conception pendant 15 minutes)
- Puissance statique et température
- (en utilisant une conception de mesure de puissance statique)
- Puissance statique dans le pire des cas
- (valeurs prédites à l'aide de Early Power Estimator pour les appareils Intel Arria 10)
Ensuite, utilisez la feuille d'estimateur de puissance Intel FPGA PAC (téléchargement) avec ces métriques enregistrées pour vérifier si votre conception AFU répond aux spécifications.
Mesure de la puissance totale de la carte
Suivez ces étapes
- Installez le PAC Intel avec FPGA Intel Arria 10 GX dans un emplacement PCIe qualifié du serveur. Si vous utilisez BWMonitor pour la mesure, connectez le câble micro-USB à l'arrière de la carte à n'importe quel port USB du serveur.
- Chargez votre AFU et courez à sa puissance maximale.
- Si l'AFU utilise Ethernet, assurez-vous que le câble ou le module réseau est inséré et connecté au partenaire de liaison et que le trafic réseau est activé dans l'AFU.
- Le cas échéant, exécutez DMA en continu pour tester la mémoire DDR4 intégrée.
- Exécutez vos applications sur l'hôte pour alimenter l'AFU avec le trafic le plus défavorable et pour exercer pleinement le FPGA. Assurez-vous de stresser le FPGA avec le trafic de données le plus stressant. Exécutez cette étape pendant au moins 15 minutes pour permettre à la température du cœur du FPGA de se stabiliser.
- Note: Pendant les tests, surveillez la puissance totale de la carte, la puissance du FPGA et la température du cœur du FPGA pour vous assurer qu'elles restent conformes aux spécifications. Si les limites de 66 W, 45 W ou 100 °C sont atteintes, arrêtez immédiatement le test.
- Une fois que la température du cœur du FPGA est devenue stable, utilisez le programme fpgainfo ou l'outil BWMonitor pour enregistrer la puissance totale de la carte et la température du cœur du FPGA. Entrez ces valeurs dans la ligne Étape 1 : mesure de la puissance totale de la carte de la feuille d'estimation de la puissance Intel FPGA PAC.
Feuille d'estimateur de puissance Intel FPGA PAC Sample
Mesure de la puissance statique réelle
Le courant de fuite est l'une des principales causes de variation de la consommation d'énergie d'une carte à l'autre. Les mesures de puissance de la section ci-dessus incluent la puissance due au courant de fuite (puissance statique) et la puissance due à la logique AFU (puissance dynamique). Dans cette section, vous allez mesurer la puissance statique de la carte sous test afin de comprendre la puissance dynamique.
Avant de mesurer la puissance statique du FPGA, utilisez le script disable-gpio-input-bufferintelpac-arria10-gx.tcl (téléchargement) pour traiter la programmation du FPGA file, (*.sof file) qui contient une conception FIM et AFU. Le script tcl désactive toutes les broches d'entrée FPGA pour s'assurer qu'il n'y a pas de basculement à l'intérieur du FPGA (ce qui signifie qu'il n'y a pas d'alimentation dynamique). Reportez-vous au Débit minimal Example à compiler commeampl'AFU. Le *.sof généré file est situé à:
- cd $OPAE_PLATFORM_ROOT/hw/samples/ $ OPAE_PLATFORM_ROOT/matériel/samples/ build_synth/build/output_files/afu_*.sof
Vous devez enregistrer le disable-gpio-input-buffer-intel-pac-arria10-gx.tcl dans le répertoire ci-dessus, puis exécuter la commande suivante
- # quartus_asm -t Disable-gpio-input-buffer-intel-pac-arria10-gx.tclafu_*.sof
Sampla sortie
Infos : ****************************************************** ***************** Info:
Exécution de Quartus Prime Assembler
Infos : Version 17.1.1 Build 273 12/19/2017 Édition SJ Pro
Infos : Copyright (C) 2017 Intel Corporation. Tous les droits sont réservés. Info : Votre utilisation
des outils de conception d'Intel Corporation, des fonctions logiques Info: et d'autres logiciels et outils, et ses AMPLogique partenaire P Info : fonctions et toute sortie files de l'une des informations précédentes : (y compris la programmation ou la simulation de l'appareil files), et toute documentation ou information associée Info : est expressément soumise aux termes et conditions du contrat de licence du programme Intel Info : contrat d'abonnement, du contrat de licence Intel Quartus Prime, Info :
Lors de l'exécution réussie du script tcl, le fichier afu_*.sof file est mis à jour et prêt pour la programmation FPGA.
Suivez ces étapes pour mesurer la puissance statique réelle
- Utilisez le programmateur Intel Quartus® Prime pour programmer le *.sof file. Reportez-vous à la section Utilisation du programmeur Intel Quartus Prime à la page 12 pour connaître les étapes détaillées.
- Surveiller la température du cœur du FPGA, voltage, et courant à l'aide de l'outil BWMonitor. Entrez ces valeurs dans la ligne Étape 2 : mesure de la puissance statique du cœur FPGA de la feuille d'estimation de la puissance Intel FPGA PAC.
Informations connexes
- Guide de démarrage rapide de la pile d'accélération Intel pour la carte d'accélération programmable Intel avec le FPGA Intel Arria 10 GX
- Surveillez les capteurs embarqués à l'aide de BWMonitor.
Utilisation du programmeur Intel Quartus Prime
Vous devez avoir le câble micro USB connecté entre l'Intel FPGA PAC et le serveur pour exécuter ces étapes :
- Trouvez le port racine et le point de terminaison de la carte Intel FPGA PAC : $ lspci -tv | grep 09c4
Exampla sortie 1 montre que le port racine est d7:0.0 et le point de terminaison est d8:0.0
- -+-[0000:d7]-+-00.0-[d8]—-00.0 Périphérique Intel Corporation 09c4
Exampla sortie 2 montre que le port racine est 0: 1.0 et le point de terminaison est 3: 0.0
- +-01.0-[03]—-00.0 Périphérique Intel Corporation 09c4
Exampla sortie 3 montre que le port racine est 85: 2.0 et le point final est 86: 0.0 et
- +-[0000:85]-+-02.0-[86]—-00.0 Périphérique Intel Corporation 09c4
Note: Aucune sortie indique un échec d'énumération de périphérique PCIe* et que la mémoire flash n'est pas programmée.
- #Masquer les erreurs non corrigibles et les erreurs corrigibles du FPGA
- $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
- $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
- # Masquer les erreurs non corrigibles et Masquer les erreurs corrigibles de RP
- $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
- $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
Exécutez la commande Intel Quartus Prime Programmer suivante :
- sudo $QUARTUS_HOME/bin/quartus_pgm -m JTAG -o 'pvbi;afu_*.sof'
- Pour démasquer les erreurs non corrigibles et masquer les erreurs corrigibles, exécutez les commandes suivantes
- # Démasquer les erreurs non corrigibles et masquer les erreurs corrigibles du FPGA
- $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0x00000000
- $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0x00000000
- # Démasquer les erreurs non corrigibles et masquer les erreurs corrigibles de RP :
- $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0x00000000
- $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0x00000000
- # Démasquer les erreurs non corrigibles et masquer les erreurs corrigibles du FPGA
- Redémarrer.
Informations connexes
Guide de démarrage rapide de la pile d'accélération Intel pour la carte d'accélération programmable Intel avec le FPGA Intel Arria 10 GX
Estimation de la puissance statique du noyau dans le pire des cas
Suivez ces étapes pour estimer la puissance statique dans le pire des cas
- Reportez-vous au Débit minimal Example à compiler commeampl'AFU situé au :
- /hw/samples/ /
- Dans le logiciel Intel Quartus Prime Pro Edition, cliquez sur File > Ouvrez Project et sélectionnez votre .qpf file pour ouvrir le projet de synthèse AFU à partir du chemin suivant :
- /hw/samples/ /build_synth/build
- Cliquez sur Projet > Générer EPE File pour créer le .csv requis file.
- Étape 2 Illustration
- Étape 2 Illustration
- Ouvrez l'outil Early Power Estimator (5) et cliquez sur l'icône Import CSV. Sélectionnez le .csv généré ci-dessus file.
- Note: Vous pouvez ignorer l'avertissement lors de l'importation du .csv file.
- Les paramètres d'entrée sont renseignés automatiquement.
- Remplacez la valeur par User Entered dans Junction Temp. champ TJ. Et réglez la température de jonction. Champ TJ (°C) à 95
- Modifiez le champ Caractéristiques de puissance de Typique à Maximum.
- Dans l'outil EPE, le PSTATIC est la puissance statique totale en watts. Vous pouvez calculer la puissance statique du cœur dans le pire des cas à partir de l'onglet Rapport
Outil EPE Sample Sortie
Onglet Rapport
Dans l'exampComme indiqué ci-dessus, le courant statique total du cœur du FPGA est la somme de tous les courants statiques et du courant de veille à 0.9 V (VCC, VCCP, VCCERAM). Entrez ces valeurs dans la ligne Étape 3 : la pire puissance statique de l'EPE de la feuille d'estimation de la puissance Intel FPGA PAC. Observez la ligne Sortie calculée pour connaître la consommation électrique maximale de votre AFU.
Documenter l'historique de révision des directives thermiques et d'alimentation pour Intel PAC avec FPGA Intel Arria 10 GX
Version du document | Changements |
2019.08.30 | Version initiale. |
Société intel. Tous les droits sont réservés. Intel, le logo Intel et les autres marques Intel sont des marques commerciales d'Intel Corporation ou de ses filiales. Intel garantit les performances de ses produits FPGA et semi-conducteurs selon les spécifications actuelles conformément à la garantie standard d'Intel, mais se réserve le droit d'apporter des modifications à tout produit et service à tout moment et sans préavis. Intel n'assume aucune responsabilité découlant de l'application ou de l'utilisation de toute information, produit ou service décrit dans le présent document, sauf accord exprès et écrit d'Intel. Il est conseillé aux clients d'Intel d'obtenir la dernière version des spécifications de l'appareil avant de se fier aux informations publiées et avant de passer des commandes de produits ou de services.
D’autres noms et marques peuvent être revendiqués comme étant la propriété d’autrui.
ISO
- 9001:2015
Inscrit
IDENTIFIANT: 683795
Version: 2019.08.30
Documents / Ressources
![]() | Carte d'accélération programmable intel AN 872 avec FPGA Intel Arria 10 GX [pdf] Guide de l'utilisateur Carte d'accélération programmable AN 872 avec FPGA Intel Arria 10 GX, AN 872, Carte d'accélération programmable avec FPGA Intel Arria 10 GX |