AN 872 프로그래밍 가능 가속 카드(Intel Arria 10 GX FPGA 포함)
소개
이 문서에 대하여
이 문서는 대상 서버 플랫폼에서 인텔 Arria® 10 GX FPGA와 함께 인텔® 프로그래밍 가능 가속 카드를 사용하여 AFU 설계의 전력 및 열 성능을 추정하고 검증하는 방법을 제공합니다.
전원 사양
보드 관리 컨트롤러는 인텔 FPGA PAC에서 열 및 전원 이벤트를 모니터링하고 관리합니다. 보드 또는 FPGA가 과열되거나 과도한 전류를 소모하는 경우 보드 관리 컨트롤러는 보호를 위해 FPGA 전원을 차단합니다. 결과적으로 예기치 않은 시스템 충돌을 일으킬 수 있는 PCIe 링크도 중단됩니다. 보드 종료를 트리거하는 기준에 대한 자세한 내용은 자동 종료를 참조하십시오. 정상적인 경우에는 FPGA 온도와 전력이 셧다운의 주요 원인입니다. 중단 시간을 최소화하고 시스템 안정성을 보장하기 위해 인텔은 총 보드 전력이 66W를 초과하지 않고 FPGA 전력이 45W를 초과하지 않을 것을 권장합니다. 개별 구성 요소 및 보드 어셈블리에는 전력 가변성이 있습니다. 따라서 공칭 값은 다양한 워크로드 및 입구 온도가 있는 시스템에서 보드가 임의로 종료되지 않도록 하는 제한보다 낮습니다.
전원 사양
체계 |
총 보드 전력(와트) |
FPGA 전력(와트) |
15°C의 코어 온도에서 최소 95분 동안 최악의 스로틀링 워크로드로 실행되는 FIM(FPGA Interface Manager) 및 AFU가 있는 시스템. |
66 |
45 |
총 보드 전력은 가속기 기능 장치(AFU) 설계(로직 토글의 양과 빈도), 입구 온도, 시스템 온도 및 Intel FPGA PAC 대상 슬롯의 공기 흐름에 따라 달라집니다. 이 가변성을 관리하기 위해 인텔은 보드 관리 컨트롤러에 의한 전원 종료를 방지하기 위해 이 전원 사양을 충족할 것을 권장합니다.
관련 정보
자동 종료.
필수 조건
서버 OEM(Original Equipment Manufacturer)은 보드가 최대 허용 전력(66W)을 소비하는 경우에도 대상 서버 플랫폼의 PCIe 슬롯에 인터페이스하는 각 Intel FPGA PAC가 열 제한 내에서 유지될 수 있는지 확인해야 합니다. 자세한 내용은 인텔 Arria 10 GX FPGA 플랫폼 검증 가이드라인(1)이 포함된 인텔 PAC를 참조하십시오.
도구 요구 사항
전력 및 열 성능을 추정하고 평가하려면 다음과 같은 도구가 있어야 합니다.
- 소프트웨어:
- 개발용 인텔 가속 스택
- BW툴킷
- AFU 디자인(2)
- Tcl 스크립트(다운로드) – 프로그래밍 포맷에 필요 file 분석을 위해
- Intel Arria 10 장치용 조기 전력 추정기
- 인텔 FPGA PAC 전력 추정기 시트(다운로드)
- 하드웨어:
- 인텔 FPGA PAC
- 마이크로 USB 케이블(3)
- 인텔 FPGA PAC용 대상 서버(4)
Intel은 소프트웨어 설치를 위해 Intel Arria 10 GX FPGA를 사용하는 Intel Programmable Acceleration Card용 Intel Acceleration Stack Quick Start Guide를 따를 것을 권장합니다.
관련 정보
Intel Arria 10 GX FPGA를 사용하는 Intel 프로그래밍 가능 가속 카드용 Intel 가속 스택 빠른 시작 가이드.
- 이 문서에 액세스하려면 인텔 지원 담당자에게 문의하십시오.
- build_synth 디렉토리는 AFU를 컴파일한 후 생성됩니다.
- Acceleration Stack 1.2에서 보드 모니터링은 PCIe를 통해 수행됩니다.
- OEM이 인텔 FPGA PAC에 대한 플랫폼 검증 지침에 따라 대상 PCIe 슬롯을 검증했는지 확인하십시오.
보드 관리 컨트롤러 사용
자동 종료
보드 관리 컨트롤러는 리셋, 다양한 전원 레일, FPGA 및 보드 온도를 모니터링하고 제어합니다. 보드 관리 컨트롤러는 잠재적으로 보드를 손상시킬 수 있는 조건을 감지하면 보호를 위해 자동으로 보드 전원을 차단합니다.
메모: FPGA의 전원이 꺼지면 Intel FPGA PAC와 호스트 간의 PCIe 링크가 다운됩니다. 많은 시스템에서 PCIe 링크 다운으로 인해 시스템 충돌이 발생할 수 있습니다.
자동 종료 기준
다음 표에는 보드 관리 컨트롤러가 보드 전원을 차단하는 기준이 나열되어 있습니다.
매개변수 | 임계값 제한 |
보드 전원 | 66와트 |
12v 백플레인 전류 | 6아 |
12v 백플레인 볼륨tage | 14V(XNUMXV) |
1.2v 전류 | 16아 |
1.2v 볼륨tage | 1.4V(XNUMXV) |
1.8v 전류 | 8아 |
1.8v 볼륨tage | 2.04V(XNUMXV) |
3.3v 전류 | 8아 |
3.3v 볼륨tage | 3.96V(XNUMXV) |
FPGA 코어 볼륨tage | 1.08V(XNUMXV) |
FPGA 코어 전류 | 60아 |
FPGA 코어 온도 | 100도 |
코어 공급 온도 | 120도 |
보드 온도 | 80도 |
QSFP 온도 | 90도 |
QSFP 볼륨tage | 3.7V(XNUMXV) |
자동 종료 후 복구
보드 관리 컨트롤러는 다음 전원 주기까지 전원이 꺼진 상태를 유지합니다. 따라서 인텔 FPGA PAC 카드 전원이 종료되면 서버 전원을 껐다 켜서 인텔 FPGA PAC에 전원을 다시 공급해야 합니다.
전원 차단의 일반적인 원인은 FPGA 과열(코어 온도가 100°C 이상인 경우) 또는 FPGA가 과도한 전류를 소모하기 때문입니다. 이것은 일반적으로 AFU 설계가 인텔 FPGA PAC 정의 전력 포락선을 초과하거나 공기 흐름이 불충분할 때 발생합니다. 이 경우 AFU에서 전력 소비를 줄여야 합니다.
OPAE를 사용하여 온보드 센서 모니터링
fpgainfo 명령줄 프로그램을 사용하여 보드 관리 컨트롤러에서 온도 및 전력 센서 데이터를 수집합니다. Acceleration Stack 1.2 이상에서 이 프로그램을 사용할 수 있습니다. 가속 스택 1.1 이하의 경우 다음 섹션에 설명된 대로 BWMonitor 도구를 사용하십시오.
온도 데이터를 수집하려면:
- bash-4.2$ fpgainfo 온도
Samp르 출력
전원 데이터를 수집하려면
- bash-4.2$ fpgainfo 전원
Samp르 출력
BWMonitor를 사용하여 온보드 센서 모니터링
- BWMonitor는 FPGA/보드 온도, vol을 측정할 수 있는 BittWare 도구입니다.tage, 그리고 현재.
필수 조건: 인텔 FPGA PAC와 서버 사이에 마이크로 USB 케이블을 설치해야 합니다.
- 적절한 BittWorks II Toolkit-Lite 소프트웨어, 펌웨어 및 부트로더를 설치합니다.
OS 호환 BittWorks II ToolkitLite 버전
운영 체제 | 풀어 주다 | BittWorks II Toolkit-Lite 버전 | 설치 명령 | |
센트OS 7.4/RHEL 7.4 | 2018.6 엔터프라이즈 리눅스 7(64비트) | bw2tk-
라이트-2018.6.el7.x86_64.rpm |
||
sudo yum 설치 bw2tk-\ lite-2018.6.el7.x86_64.rpm | ||||
우분투 16.04 | 2018.6 우분투 16.04(64비트) | bw2tk-
라이트-2018.6.u1604.amd64.deb |
||
sudo dpkg -i bw2tk-\ 2018.6.u1604.amd64.deb |
시작하기를 참조하십시오 webBMC 펌웨어 및 도구 다운로드 페이지
- BMC 펌웨어 버전: 26889
- BMC 부트로더 버전: 26879
저장하다 files 호스트 시스템의 알려진 위치로. 다음 스크립트는 이 위치를 묻는 메시지를 표시합니다.
PATH에 Bittware 도구 추가:
- 내보내기 경로=/opt/bwtk/2018.6.0L/bin/:$PATH
다음을 사용하여 BWMonitor를 시작할 수 있습니다.
- /opt/bwtk/2018.6L/bin/bwmonitor-gui&
Samp르 측정
AFU 설계 전력 검증
전력 측정 흐름
AFU 설계의 성능을 평가하려면 다음 메트릭을 캡처하십시오.
- 총 보드 전력 및 FPGA 온도
- (설계에서 최악의 데이터 패턴을 15분 동안 실행한 후)
- 정적 전력 및 온도
- (정적 전력 측정 설계 사용)
- 최악의 경우 정적 전력
- (Intel Arria 10 장치용 Early Power Estimator를 사용하여 예측한 값)
그런 다음 이러한 기록된 메트릭과 함께 인텔 FPGA PAC 전력 추정기 시트(다운로드)를 사용하여 AFU 설계가 사양을 충족하는지 확인하십시오.
총 보드 전력 측정
다음 단계를 따르세요
- Intel Arria 10 GX FPGA가 포함된 Intel PAC를 서버의 인증된 PCIe 슬롯에 설치합니다. 측정에 BWMonitor를 사용하는 경우 카드 뒷면의 Micro-USB 케이블을 서버의 USB 포트에 연결합니다.
- AFU를 로드하고 최대 전력으로 실행하십시오.
- AFU가 이더넷을 사용하는 경우 네트워크 케이블 또는 모듈이 삽입되어 링크 파트너에 연결되어 있고 네트워크 트래픽이 AFU에서 켜져 있는지 확인하십시오.
- 해당하는 경우 DMA를 계속 실행하여 온보드 DDR4를 실행합니다.
- 호스트에서 애플리케이션을 실행하여 AFU에 최악의 트래픽을 공급하고 FPGA를 완전히 실행하십시오. 가장 스트레스가 많은 데이터 트래픽으로 FPGA에 스트레스를 주도록 하십시오. 이 단계를 최소 15분 동안 실행하여 FPGA 코어 온도가 안정화되도록 합니다.
- 메모: 테스트하는 동안 총 보드 전력, FPGA 전력 및 FPGA 코어 온도 값을 모니터링하여 사양 내에서 유지되도록 합니다. 66W, 45W 또는 100°C 한도에 도달하면 테스트를 즉시 중단하십시오.
- FPGA 코어 온도가 안정되면 fpgainfo 프로그램 또는 BWMonitor 도구를 사용하여 총 보드 전력 및 FPGA 코어 온도를 기록합니다. 1단계: 인텔 FPGA PAC 전력 추정기 시트의 전체 보드 전력 측정 행에 이 값을 입력합니다.
인텔 FPGA PAC 전력 추정기 시트 Sample
실제 정적 전력 측정
누설 전류는 기판 간 전력 소비 변화의 주요 원인입니다. 위 섹션의 전력 측정에는 누설 전류로 인한 전력(정적 전력)과 AFU 로직으로 인한 전력(동적 전력)이 포함됩니다. 이 섹션에서는 동적 전력을 이해하기 위해 테스트 대상 보드의 정적 전력을 측정합니다.
FPGA 정적 전력을 측정하기 전에 disable-gpio-input-bufferintelpac-arria10-gx.tcl 스크립트(다운로드)를 사용하여 FPGA 프로그래밍을 처리합니다. file, (*.소프트 file) FIM 및 AFU 디자인을 포함합니다. tcl 스크립트는 모든 FPGA 입력 핀을 비활성화하여 FPGA 내부에 토글링이 없도록 합니다(즉, 동적 전원이 없음을 의미함). 최소 유량 Ex 참조amp다음과 같이 컴파일하려면amp르 AFU. 생성된 *.sof file 위치:
- CD $OPAE_PLATFORM_ROOT/hw/samp레/ $ OPAE_PLATFORM_ROOT/hw/samp레/ build_synth/빌드/출력_files/ afu_*.sof
위 디렉토리에 disable-gpio-input-buffer-intel-pac-arria10-gx.tcl을 저장한 후 다음 명령을 실행해야 합니다.
- # quartus_asm -t 비활성화-gpio-입력-버퍼-인텔-pac-arria10-gx.tclafu_*.sof
Samp르 출력
정보: ************************************************** ***************** 정보:
Quatus Prime 어셈블러 실행
정보: 버전 17.1.1 빌드 273 12년 19월 2017일 SJ 프로 에디션
정보: Copyright (C) 2017 인텔사. 판권 소유. 정보: 사용
Intel Corporation의 설계 도구, 논리 기능 정보: 및 기타 소프트웨어 및 도구와 AMPP 파트너 로직 정보: 기능 및 모든 출력 file전술한 정보 중 하나에서 s: (장치 프로그래밍 또는 시뮬레이션 포함) files) 및 모든 정보: 관련 문서 또는 정보는 명시적으로 정보: 인텔 프로그램 라이센스의 조건 및 조건에 따릅니다. 정보: 가입 계약, 인텔 Quartus 프라임 라이센스 계약, 정보:
tcl 스크립트를 성공적으로 실행하면 afu_*.sof file 업데이트되어 FPGA 프로그래밍을 위한 준비가 되었습니다.
실제 정적 전력을 측정하려면 다음 단계를 따르십시오.
- Intel Quartus® Prime 프로그래머를 사용하여 *.sof를 프로그래밍하십시오. file. 자세한 단계는 12페이지의 Intel Quartus Prime Programmer 사용을 참조하십시오.
- FPGA 코어 온도, vol 모니터링tage, 현재 BWMonitor 도구를 사용합니다. 행 2단계: 인텔 FPGA PAC 전력 추정기 시트의 FPGA 코어 정적 전력 측정에 이러한 값을 입력합니다.
관련 정보
- Intel Arria 10 GX FPGA가 포함된 Intel 프로그래밍 가능 가속 카드용 Intel 가속 스택 빠른 시작 가이드
- BWMonitor를 사용하여 온보드 센서를 모니터링합니다.
Intel Quartus Prime 프로그래머 사용
다음 단계를 실행하려면 Intel FPGA PAC와 서버 사이에 마이크로 USB 케이블이 연결되어 있어야 합니다.
- Intel FPGA PAC 카드의 루트 포트 및 끝점 찾기: $ lspci -tv | 그렙 09c4
Examp파일 출력 1은 루트 포트가 d7:0.0이고 엔드포인트가 d8:0.0임을 보여줍니다.
- ---[0000:d7]-+-00.0-[d8]—-00.0 인텔사 장치 09c4
Examp파일 출력 2는 루트 포트가 0:1.0이고 엔드포인트가 3:0.0임을 보여줍니다.
- +-01.0-[03]—-00.0 Intel Corporation 장치 09c4
Examp파일 출력 3은 루트 포트가 85:2.0이고 엔드포인트가 86:0.0임을 보여줍니다.
- +-[0000:85]-+-02.0-[86]—-00.0 Intel Corporation 장치 09c4
메모: 출력이 없으면 PCIe* 장치 열거 오류 및 플래시가 프로그래밍되지 않았음을 나타냅니다.
- # FPGA의 수정 불가능 오류 및 수정 가능 오류 마스크
- $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
- $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
- # 수정 불가능한 오류 마스크 및 RP의 수정 가능한 오류 마스크
- $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0xFFFFFFFF
- $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0xFFFFFFFF
다음 Intel Quartus Prime Programmer 명령을 실행합니다.
- sudo $QUARTUS_HOME/bin/quartus_pgm -m JTAG -o 'pvbi;afu_*.sof'
- 수정할 수 없는 오류를 마스크 해제하고 수정 가능한 오류를 마스크하려면 다음 명령을 실행합니다.
- # 수정할 수 없는 오류를 마스크 해제하고 FPGA의 수정 가능한 오류를 마스크합니다.
- $ sudo setpci -s d8:0.0 ECAP_AER+0x08.L=0x00000000
- $ sudo setpci -s d8:0.0 ECAP_AER+0x14.L=0x00000000
- # 수정할 수 없는 오류를 마스크 해제하고 RP의 수정 가능한 오류를 마스크합니다.
- $ sudo setpci -s d7:0.0 ECAP_AER+0x08.L=0x00000000
- $ sudo setpci -s d7:0.0 ECAP_AER+0x14.L=0x00000000
- # 수정할 수 없는 오류를 마스크 해제하고 FPGA의 수정 가능한 오류를 마스크합니다.
- 재부팅.
관련 정보
Intel Arria 10 GX FPGA가 포함된 Intel 프로그래밍 가능 가속 카드용 Intel 가속 스택 빠른 시작 가이드
최악의 경우 코어 정적 전력 추정
최악의 경우 정적 전력을 추정하려면 다음 단계를 따르십시오.
- 최소 유량 Ex 참조amp다음과 같이 컴파일하려면amp르 AFU 위치:
- /hw/samp레/ /
- Intel Quatus Prime Pro Edition 소프트웨어에서 다음을 클릭합니다. File > 프로젝트를 열고 .qpf를 선택합니다. file 다음 경로에서 AFU 합성 프로젝트를 엽니다.
- /hw/samp레/ /build_synth/빌드
- 프로젝트 > EPE 생성을 클릭합니다. File 필요한 .csv를 생성하려면 file.
- 2단계 일러스트레이션
- 2단계 일러스트레이션
- Early Power Estimator 도구(5)를 열고 CSV 가져오기 아이콘을 클릭합니다. 위에서 생성된 .csv를 선택합니다. file.
- 메모: .csv를 가져오는 동안 경고를 무시할 수 있습니다. file.
- 입력 매개변수는 자동으로 채워집니다.
- Junction Temp에서 User Entered로 값을 변경합니다. TJ 필드. 그리고 정션 온도를 설정합니다. TJ(°C) 필드를 95로 설정
- 전력 특성 필드를 일반에서 최대로 변경합니다.
- EPE 도구에서 PSTATIC은 전체 정적 전력(와트)입니다. 보고서 탭에서 최악의 경우 코어 정적 전력을 계산할 수 있습니다.
EPE 도구 Samp르 출력
보고서 탭
예전에는amp위에 표시된 것처럼 총 FPGA 코어 정적 전류는 0.9V(VCC, VCCP, VCCERAM)에서 모든 정적 전류와 대기 전류의 합입니다. Intel FPGA PAC Power Estimator 시트의 행 3단계: EPE의 최악의 정적 전력에 이 값을 입력합니다. AFU의 최대 전력 소비에 대한 계산된 출력 행을 관찰하십시오.
인텔 Arria 10 GX FPGA를 사용하는 인텔 PAC의 열 및 전력 지침에 대한 문서 개정 내역
문서 버전 | 변화 |
2019.08.30 | 최초 출시. |
인텔사. 판권 소유. 인텔, 인텔 로고 및 기타 인텔 마크는 인텔사 또는 그 자회사의 상표입니다. Intel은 Intel의 표준 보증에 따라 FPGA 및 반도체 제품의 성능을 현재 사양으로 보증하지만 언제든지 통지 없이 제품 및 서비스를 변경할 수 있는 권한을 보유합니다. 인텔은 인텔이 서면으로 명시적으로 동의한 경우를 제외하고 여기에 설명된 정보, 제품 또는 서비스의 응용 프로그램 또는 사용으로 인해 발생하는 책임을 지지 않습니다. 인텔 고객은 게시된 정보에 의존하기 전에 그리고 제품이나 서비스를 주문하기 전에 장치 사양의 최신 버전을 확인하는 것이 좋습니다.
다른 이름과 브랜드는 다른 사람의 재산이라고 주장될 수 있습니다.
ISO
- 9001시 2015분
등기
ID: 683795
버전: 2019.08.30
문서 / 리소스
![]() |
인텔 Arria 872 GX FPGA가 있는 인텔 AN 10 프로그래밍 가능 가속 카드 [PDF 파일] 사용자 가이드 Intel Arria 872 GX FPGA가 포함된 AN 10 프로그래밍 가능 가속 카드, AN 872, Intel Arria 10 GX FPGA가 포함된 프로그래밍 가능 가속 카드 |