采用英特尔 Arria 872 GX FPGA 的 AN 10 可编程加速卡
介绍
关于本文档
本文档提供了在目标服务器平台中使用英特尔® 可编程加速卡和英特尔 Arria® 10 GX FPGA 来估计和验证 AFU 设计的功率和热性能的方法。
电源规格
板管理控制器监控和管理英特尔 FPGA PAC 上的热量和电源事件。 当板卡或FPGA过热或电流过大时,板卡管理控制器会关闭FPGA电源进行保护。 随后,它还会关闭 PCIe 链接,这可能会导致意外的系统崩溃。 有关触发电路板关闭的条件的更多详细信息,请参阅自动关闭。 在正常情况下,FPGA 温度和功率是迄今为止关闭的主要原因。 为最大限度地减少停机时间并确保系统稳定性,英特尔建议总板功率不超过 66 W,FPGA 功率不超过 45 W。单个组件和板组件具有功率可变性。 因此,标称值低于限值,以确保电路板不会在具有不同工作负载和入口温度的系统中随机关机。
电源规格
|
系统 |
总板功率(瓦) |
FPGA 功率(瓦) |
| 带有 FPGA 接口管理器 (FIM) 和 AFU 的系统,在 15°C 的核心温度下以最坏情况的节流工作负载运行至少 95 分钟。 |
66 |
45 |
总板功率取决于您的加速器功能单元 (AFU) 设计(逻辑切换的数量和频率)、入口温度、系统温度和英特尔 FPGA PAC 目标插槽的气流。 为管理这种可变性,英特尔建议您满足此电源规格,以防止主板管理控制器关闭电源。
相关信息
自动关机。
先决条件
服务器原始设备制造商 (OEM) 必须验证与目标服务器平台中的 PCIe 插槽接口的每个英特尔 FPGA PAC 都可以保持在热限制内,即使该板消耗最大允许功率(66 W)也是如此。 有关详细信息,请参阅带有英特尔 Arria 10 GX FPGA 平台资格指南的英特尔 PAC(1)。
工具要求
您必须拥有以下工具来估计和评估功率和热性能。
- 软件:
- 面向开发的英特尔加速堆栈
- BW工具包
- AFU设计(2)
- Tcl 脚本(下载)——需要格式化程序 file 用于分析
- 英特尔 Arria 10 设备的早期功耗估算器
- 英特尔 FPGA PAC 功率估算器表(下载)
- 硬件:
- 英特尔 FPGA PAC
- 微型 USB 数据线(3)
- 英特尔 FPGA PAC 的目标服务器(4)
Intel 建议您按照 Intel 加速堆栈快速入门指南使用 Intel Arria 10 GX FPGA 的 Intel Programmable Acceleration Card 进行软件安装。
相关信息
适用于采用英特尔 Arria 10 GX FPGA 的英特尔可编程加速卡的英特尔加速堆栈快速入门指南。
- 请联系您的英特尔支持代表以访问此文档。
- 编译 AFU 后会创建 build_synth 目录。
- 在 Acceleration Stack 1.2 中,板监控是通过 PCIe 执行的。
- 确保您的 OEM 已根据英特尔 FPGA PAC 的平台资格指南验证了目标 PCIe 插槽。
使用板管理控制器
自动关机
电路板管理控制器监视和控制复位、不同的电源轨、FPGA 和电路板温度。 当板管理控制器检测到可能损坏板的情况时,它会自动关闭板电源以进行保护。
笔记: 当 FPGA 断电时,英特尔 FPGA PAC 和主机之间的 PCIe 链路中断。 在许多系统中,PCIe 链路断开可能会导致系统崩溃。
自动关机标准
下表列出了板管理控制器关闭板电源的标准。
| 范围 | 阈值限制 |
| 电路板电源 | 66 瓦 |
| 12v 背板电流 | 6 一 |
| 12v 背板卷tage | 14 伏 |
| 1.2v电流 | 16 一 |
| 1.2v 音量tage | 1.4 伏 |
| 1.8v电流 | 8 一 |
| 1.8v 音量tage | 2.04 伏 |
| 3.3v电流 | 8 一 |
| 3.3v 音量tage | 3.96 伏 |
| FPGA核心卷tage | 1.08 伏 |
| FPGA核心电流 | 60 一 |
| FPGA核心温度 | 100°C |
| 核心供应温度 | 120°C |
| 板温 | 80°C |
| QSFP 温度 | 90°C |
| QSFP卷tage | 3.7 伏 |
自动关机后恢复
板管理控制器保持断电状态,直到下一次电源循环。 因此,当 Intel FPGA PAC 卡电源关闭时,您必须重启服务器以将电源返回给 Intel FPGA PAC。
电源关闭的常见原因是FPGA过热(当核心温度超过100°C时),或者FPGA消耗过大的电流。 当 AFU 设计超出英特尔 FPGA PAC 定义的功率范围或气流不足时,通常会发生这种情况。 在这种情况下,您必须降低 AFU 的功耗。
使用 OPAE 监控板载传感器
使用 fpgainfo 命令行程序从板管理控制器收集温度和功率传感器数据。 您可以将此程序与 Acceleration Stack 1.2 及更高版本一起使用。 对于 Acceleration Stack 1.1 或更早版本,请使用 BWMonitor 工具,如下一节所述。
收集温度数据:
- bash-4.2$ fpgainfo 温度
Samp文件输出

收集功率数据
- bash-4.2$ fpgainfo 电源
Samp文件输出


使用 BWMonitor 监控板载传感器
- BWMonitor 是一种 BittWare 工具,可让您测量 FPGA/电路板温度、voltage、和电流。
先决条件: 您必须在英特尔 FPGA PAC 和服务器之间安装微型 USB 电缆。
- 安装适当的 BittWorks II Toolkit-Lite 软件、固件和引导加载程序。
操作系统兼容的 BittWorks II ToolkitLite 版本
| 操作系统 | 发布 | BittWorks II 工具包精简版 | 安装命令 | |
| 中央操作系统 7.4/RHEL 7.4 | 2018.6 企业版 Linux 7(64 位) | bw2tk-
lite-2018.6.el7.x86_64.rpm |
||
| sudo yum install bw2tk-\lite-2018.6.el7.x86_64.rpm | ||||
| Ubuntu 16.04 | 2018.6 Ubuntu 16.04(64 位) | bw2tk-
lite-2018.6.u1604.amd64.deb |
||
| 须藤 dpkg -i bw2tk-\ 2018.6.u1604.amd64.deb | ||||
请参阅入门 web下载 BMC 固件和工具的页面
- BMC 固件版本:26889
- BMC 引导程序版本:26879
保存 files 到主机上的已知位置。 以下脚本提示输入此位置。
将 Bittware 工具添加到 PATH:
- 导出 PATH=/opt/bwtk/2018.6.0L/bin/:$PATH
您可以使用启动 BWMonitor
- /opt/bwtk/2018.6L/bin/bwmonitor-gui&
Samp乐测量

AFU 设计功率验证
功率测量流程
要评估您的 AFU 设计的功能,请获取以下指标:
- 电路板总功率和 FPGA 温度
- (在您的设计中运行最坏情况数据模式 15 分钟后)
- 静态功率和温度
- (使用静态功率测量设计)
- 最坏情况静态功耗
- (使用英特尔 Arria 10 器件的 Early Power Estimator 的预测值)
然后,使用带有这些记录指标的英特尔 FPGA PAC 功率估算器表(下载)来验证您的 AFU 设计是否符合规范。
测量电路板总功率
请按照以下步骤操作
- 将带有英特尔 Arria 10 GX FPGA 的英特尔 PAC 安装到服务器中合格的 PCIe 插槽中。 如果您使用 BWMonitor 进行测量,请将卡背面的 Micro-USB 电缆连接到服务器的任意 USB 端口。
- 加载您的 AFU 并以其最大功率运行。
- 如果 AFU 使用以太网,则确保网络电缆或模块已插入并连接到链接伙伴,并且 AFU 中的网络流量已打开。
- 如果合适,连续运行 DMA 以运行板载 DDR4。
- 在主机上运行您的应用程序,为 AFU 提供最坏情况下的流量,并充分发挥 FPGA 的作用。 确保用压力最大的数据流量对 FPGA 施加压力。 运行此步骤至少 15 分钟,让 FPGA 核心温度稳定下来。
- 笔记: 在测试期间,监控总电路板功率、FPGA 功率和 FPGA 核心温度值以确保它们保持在规范范围内。 如果达到 66 W、45 W 或 100°C 限制,请立即停止测试。
- FPGA核心温度稳定后,使用fpgainfo程序或BWMonitor工具记录总板功率和FPGA核心温度。 在第 1 步行中输入这些值:英特尔 FPGA PAC 功率估算器表的总电路板功率测量。
英特尔 FPGA PAC 功率估算器表 Sample

测量实际静态功率
漏电流是导致板间功耗变化的主要原因。 上一节中的功率测量包括泄漏电流引起的功率(静态功率)和 AFU 逻辑引起的功率(动态功率)。 在本节中,您将测量被测板的静态功耗以了解动态功耗。
在测量FPGA静态功耗之前,使用disable-gpio-input-bufferintelpac-arria10-gx.tcl脚本(下载)处理FPGA编程 file, (*.软 file) 其中包含 FIM 和 AFU 设计。 tcl 脚本禁用所有 FPGA 输入引脚以确保 FPGA 内部没有切换(这意味着没有动态电源)。 请参阅最小流量示例amp编译为amp乐AFU。 生成的*.sof file 位于:
- cd $OPAE_PLATFORM_ROOT/hw/samp莱斯/ $ OPAE_PLATFORM_ROOT/硬件/秒amp莱斯/ build_synth/build/output_files/afu_*.sof
您必须将 disable-gpio-input-buffer-intel-pac-arria10-gx.tcl 保存在上述目录中,然后运行以下命令
- # quartus_asm -t 禁用-gpio-input-buffer-intel-pac-arria10-gx.tclafu_*.sof
Samp文件输出
信息: ****************************************************** ***************** 信息:
运行 Quartus Prime 汇编器
信息: 版本 17.1.1 Build 273 12/19/2017 SJ 专业版
信息: 版权所有 (C) 2017 英特尔公司。 版权所有。 信息:您的使用
Intel Corporation 的设计工具、逻辑功能信息:以及其他软件和工具,及其 AMPP 合作伙伴逻辑信息:功能和任何输出 file来自上述任何信息的信息:(包括设备编程或模拟 files) 和任何信息:相关文档或信息明确受制于信息:英特尔程序许可信息的条款和条件:订阅协议、英特尔 Quartus Prime 许可协议、信息:

成功执行 tcl 脚本后,afu_*.sof file 已更新并准备好进行 FPGA 编程。
按照以下步骤测量实际静态功率
- 使用英特尔 Quartus® Prime 编程器对 *.sof 进行编程 file. 有关详细步骤,请参阅第 12 页的使用英特尔 Quartus Prime 编程器。
- 监控 FPGA 内核温度,voltage、目前使用的是BWMonitor工具。 在第 2 步行中输入这些值:英特尔 FPGA PAC 功率估算器表的 FPGA 内核静态功率测量。
相关信息
- 适用于采用英特尔 Arria 10 GX FPGA 的英特尔可编程加速卡的英特尔加速堆栈快速入门指南
- 使用 BWMonitor 监控板载传感器。
使用英特尔 Quartus Prime 编程器
您必须在英特尔 FPGA PAC 和服务器之间连接微型 USB 电缆才能执行这些步骤:
- 查找英特尔 FPGA PAC 卡的根端口和端点:$ lspci -tv | grep 09c4
Example 输出 1 显示 Root Port 是 d7:0.0,Endpoint 是 d8:0.0
- -+-[0000:d7]-+-00.0-[d8]—-00.0 英特尔公司设备 09c4
Example 输出 2 显示 Root Port 为 0:1.0,Endpoint 为 3:0.0
- +-01.0-[03]—-00.0 英特尔公司设备 09c4
Example 输出 3 显示 Root Port 是 85:2.0,Endpoint 是 86:0.0 和
- +-[0000:85]-+-02.0-[86]—-00.0 英特尔公司设备 09c4
笔记: 无输出表示 PCIe* 设备枚举失败并且闪存未被编程。
- #屏蔽FPGA的不可纠正错误和可纠正错误
- $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
- $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
- # Mask uncorrectable errors 和 Mask correctable errors of RP
- $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
- $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
运行以下英特尔 Quartus Prime 编程器命令:
- 须藤 $QUARTUS_HOME/bin/quartus_pgm -m JTAG -o 'pvbi;afu_*.sof'

- 要取消屏蔽不可纠正的错误并屏蔽可纠正的错误,请运行以下命令
- # Unmask unmaskable errors 和mask correctable errors of FPGA
- $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0x00000000
- $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0x00000000
- # 取消屏蔽不可纠正的错误并屏蔽 RP 的可纠正错误:
- $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0x00000000
- $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0x00000000
- # Unmask unmaskable errors 和mask correctable errors of FPGA
- 重新启动。
相关信息
适用于采用英特尔 Arria 10 GX FPGA 的英特尔可编程加速卡的英特尔加速堆栈快速入门指南
估计最坏情况下的核心静态功耗
按照以下步骤估算最坏情况下的静态功耗
- 请参阅最小流量示例amp编译为ample AFU 位于:
- /硬件/秒amp莱斯/ /
- 在 Intel Quartus Prime Pro Edition 软件中,点击 File > 打开项目并选择您的 .qpf file 从以下路径打开AFU综合工程:
- /硬件/秒amp莱斯/ /build_synth/构建
- 单击项目 > 生成 EPE File 创建所需的 .csv file.
- 步骤 2 插图

- 步骤 2 插图
- 打开 Early Power Estimator 工具 (5) 并单击 Import CSV 图标。 选择上面生成的.csv file.
- 笔记: 您可以在导入 .csv 时忽略警告 file.
- 输入参数自动填写。
- 在 Junction Temp 中将值更改为 User Entered。 TJ场。 并设置结温。 TJ (°C) 场至 95
- 将 Power Characteristics 字段从 Typical 更改为 Maximum。
- 在 EPE 工具中,PSTATIC 是以瓦为单位的总静态功率。 您可以从“报告”选项卡计算最坏情况下的核心静态功耗
珍珠棉工具Samp输出

报告标签

在前amp如上所示,总 FPGA 内核静态电流是 0.9V 时所有静态电流和待机电流(VCC、VCCP、VCCERAM)的总和。 在第 3 步行中输入这些值:来自英特尔 FPGA PAC 功率估算表的 EPE 的最差静态功率。 观察 AFU 最大功耗的计算输出行。
带有英特尔 Arria 10 GX FPGA 的英特尔 PAC 的热和功率指南的文档修订历史
| 文档版本 | 更改 |
| 2019.08.30 | 初始版本。 |
英特尔公司。 版权所有。 英特尔、英特尔标识和其他英特尔标志是英特尔公司或其子公司的商标。 英特尔保证其 FPGA 和半导体产品的性能符合英特尔的标准保证,符合当前规格,但保留随时更改任何产品和服务的权利,恕不另行通知。 除非英特尔明确书面同意,否则英特尔不承担因应用或使用此处描述的任何信息、产品或服务而产生的任何责任或义务。 建议英特尔客户在依赖任何已发布的信息以及下订单购买产品或服务之前获取最新版本的设备规格。
其他名称和品牌可能属于他人财产。
ISO
- 9001:2015
挂号的
ID: 683795
版本: 2019.08.30
文件/资源
![]() |
带有英特尔 Arria 872 GX FPGA 的英特尔 AN 10 可编程加速卡 [pdf] 用户指南 采用英特尔 Arria 872 GX FPGA 的 AN 10 可编程加速卡,AN 872,采用英特尔 Arria 10 GX FPGA 的可编程加速卡 |






