인텔-VTune-Pro 시작하기filer 로고

인텔 VTune Pro 시작하기filer

인텔® VTune™ 프로 시작하기filer

인텔 VTune 프로 사용filer Windows*, macOS* 및 Linux* 호스트에서 로컬 및 원격 대상 시스템을 분석합니다. 다음 작업을 통해 애플리케이션 및 시스템 성능을 개선합니다.

  • 알고리즘 선택을 분석합니다.
  • 직렬 및 병렬 코드 병목 현상을 찾으십시오.
  • 애플리케이션이 사용 가능한 하드웨어 리소스를 활용할 수 있는 위치와 방법을 이해합니다.
  • 애플리케이션 실행 속도를 높입니다.
    인텔 VTune 프로 다운로드filer 다음 방법 중 하나를 통해 시스템에서:
  • 독립 실행형 버전을 다운로드합니다.
  • 인텔 VTune 프로 받기filer은 Intel® oneAPI 기본 툴킷의 일부입니다.
    VTune Pro 보기file동영상을 위한 r 교육 페이지, web시작하는 데 도움이 되는 더 많은 자료가 있습니다.

메모
인텔® VTune™ Pro 버전 설명서file2021 릴리스 이전의 r은 다운로드만 가능합니다. 제품 버전별로 사용 ​​가능한 설명서 다운로드 목록은 다음 페이지를 참조하십시오.

  • Intel Parallel Studio XE용 문서 다운로드
  • 인텔 시스템 스튜디오용 문서 다운로드

워크플로 이해
인텔 VTune 프로 사용filer에서 프로로file 성능 향상을 위해 응용 프로그램 및 결과를 분석합니다.

일반 워크플로에는 다음 단계가 포함됩니다.

인텔-VTune-Pro 시작하기filer-01

시작할 호스트 시스템 선택
Windows*, Linux* 또는 macOS*용 시스템별 워크플로에 대해 자세히 알아보십시오.

인텔-VTune-Pro 시작하기filer-02

인텔® VTune™ 프로 시작하기filer Windows* OS용

시작하기 전에

  1. 인텔® VTune™ 프로 설치filer Windows* 시스템에서.
  2. 심볼 정보와 모든 최적화가 활성화된 릴리스 모드에서 애플리케이션을 빌드합니다. 컴파일러 설정에 대한 자세한 내용은 VTune Profiler 온라인 사용 설명서.
    행렬 s를 사용할 수도 있습니다.amp에서 사용할 수 있는 응용 프로그램 \VTune\Samples\matrix. 해당 s를 볼 수 있습니다.amp르 결과 \VTune\프로젝트\samp르(매트릭스).
  3. 환경 변수 설정: \setvars.bat 스크립트.
    기본적으로 oneAPI 구성요소의 경우 프로그램입니다. Files (x86)\Intel\oneAPI.
    메모 Intel® VTune™ Pro를 사용하는 경우 setvars.bat를 실행할 필요가 없습니다.filer Microsoft* Visual Studio* 내.

1단계: 인텔® VTune™ 프로 시작filer
인텔 VTune 프로 시작filer 이러한 방법 중 하나를 통해 프로젝트를 설정합니다. 프로젝트는 분석하려는 애플리케이션, 분석 유형 및 데이터 수집 결과에 대한 컨테이너입니다.

소스 / VTune Pro 시작filer

독립형(GUI)

  1. vtune-gui 명령 실행 또는 Intel® VTune™ Pro 실행filer 시작 메뉴에서.
  2. GUI가 열리면 시작 화면을 클릭합니다.
  3. 프로젝트 만들기 대화 상자에서 프로젝트 이름과 위치를 지정합니다.
  4. 프로젝트 만들기를 클릭합니다.

독립형(명령줄)
vtune 명령을 실행합니다.

Microsoft* 비주얼 스튜디오* IDE
Visual Studio에서 솔루션을 엽니다. VTune 프로filer 도구 모음이 자동으로 활성화되고 Visual Studio 프로젝트가 분석 대상으로 설정됩니다.

메모
Intel® VTune™ Pro를 실행할 때 프로젝트를 생성할 필요가 없습니다.filer 명령줄에서 또는 Microsoft* Visual Studio 내에서.

2단계: 분석 구성 및 실행
새 프로젝트를 만든 후 분석 구성 창이 다음 기본값과 함께 열립니다.

인텔-VTune-Pro 시작하기filer-03

  1. 애플리케이션 시작 섹션에서 애플리케이션 실행 파일의 위치를 ​​찾습니다. file.
  2. 애플리케이션에서 성능 스냅샷을 실행하려면 시작을 클릭하십시오. 이 분석은 일반적인 이상을 제시합니다.view 대상 시스템에서 애플리케이션의 성능에 영향을 미치는 문제.

3단계: View 성능 데이터 분석
데이터 수집이 완료되면 VTune Profiler은 요약 창에 분석 결과를 표시합니다. 여기, 당신은 이상의 성능을 참조하십시오view 응용 프로그램의.
오버view 일반적으로 설명과 함께 여러 메트릭이 포함됩니다.

인텔-VTune-Pro 시작하기filer-04

  • A 기여 요인에 대한 자세한 정보를 보려면 각 메트릭을 펼치십시오.
  • B 플래그가 지정된 메트릭은 허용/정상 작동 범위를 벗어난 값을 나타냅니다. 플래그가 지정된 지표를 개선하는 방법을 이해하려면 도구 설명을 사용하십시오.
  • C 다음 실행을 고려해야 하는 다른 분석에 대한 지침을 참조하십시오. 분석 트리는 이러한 권장 사항을 강조 표시합니다.

다음 단계
성능 스냅샷은 VTune Pro를 사용하여 응용 프로그램 성능을 전반적으로 평가할 수 있는 좋은 출발점입니다.file아르 자형. 다음으로 알고리즘에 조정이 필요한지 확인합니다.

  1. 일반적인 성능 병목 현상을 분석하려면 자습서를 따르십시오.
  2. 알고리즘이 잘 조정되면 성능 스냅샷을 다시 실행하여 결과를 보정하고 다른 영역에서 잠재적인 성능 향상을 식별합니다.

또한 참조
마이크로아키텍처 탐색

VTune 프로filer 도움말 둘러보기

Examp르 : 찬성file Windows*의 OpenMP* 응용 프로그램
인텔 VTune 프로 사용fileWindows 머신에서 프로로의 rfile ~처럼ample iso3dfd_omp_offload Intel GPU에 오프로드된 OpenMP 응용 프로그램. GPU 분석을 실행하고 결과를 검토하는 방법을 알아보세요.

필수 조건

  • 시스템이 Microsoft* Windows 10 또는 최신 버전을 실행 중인지 확인하십시오.
  • 다음 인텔 프로세서 그래픽 버전 중 하나를 사용하십시오.
    • 8세대
    • 9세대
    • 11세대
  • 시스템은 다음 인텔 프로세서 중 하나에서 실행되어야 합니다.
    • 7세대 Intel® Core™ i7 프로세서(코드명 Kaby Lake)
    • 8세대 Intel® Core™ i7 프로세서(코드명 Coffee Lake)
    • 10세대 Intel® Core™ i7 프로세서(코드명 Ice Lake)
  • 인텔 VTune 프로 설치filer 다음 출처 중 하나에서 가져옴:
    • 독립형 제품 다운로드
    • 인텔® oneAPI 기본 툴킷
    • 인텔® 시스템 브링업 툴킷
  • 프로에 필요한 인텔® oneAPI DPC++/C++ 컴파일러(icx/icpx)가 포함된 인텔® oneAPI HPC 툴킷을 다운로드하십시오.file OpenMP 응용 프로그램.
  • 환경 변수를 설정합니다. 에 있는 vars.bat 스크립트를 실행합니다. \env 디렉토리.
  • GPU 분석을 위해 시스템을 설정합니다.

메모
인텔 VTune 프로를 설치하려면filer Microsoft* Visual Studio 환경에서는 VTune Pro를 참조하십시오.filer 사용 설명서.

OpenMP 오프로드 애플리케이션 빌드 및 컴파일

  1. iso3dfd_omp_offload OpenMP 오프로드 다운로드amp르.
  2. s에 열려amp르 디렉토리.
    시디 <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. OpenMP 오프로드 애플리케이션을 컴파일합니다.

mkdir 빌드
cd 빌드
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-대상:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

OpenMP 오프로드 애플리케이션에서 GPU 분석 실행
이제 컴파일한 OpenMP 애플리케이션에서 GPU 오프로드 분석을 실행할 준비가 되었습니다.

  1. VTune Pro 열기filer 새 프로젝트를 클릭하여 프로젝트를 생성합니다.
  2. 시작 페이지에서 분석 구성을 클릭하여 분석을 설정합니다.
  3. 분석을 위해 이러한 설정을 선택하십시오.
    • WHERE 창에서 로컬 호스트를 선택합니다.
    • WHAT 창에서 애플리케이션 시작을 선택하고 iso3dfd_omp_offload 바이너리를 프로에 대한 애플리케이션으로 지정합니다.file.
    • 방법 창에서 분석 트리의 가속기 그룹에 있는 GPU 오프로드 분석 유형을 선택합니다.
      인텔-VTune-Pro 시작하기filer-05
  4. 시작 버튼을 클릭하여 분석을 실행합니다.

VTune 프로filer은 GPU 오프로드에서 데이터를 수집하고 분석 결과를 표시합니다. view가리키다.

  • 요약 창에서 CPU 및 GPU 리소스 사용량에 대한 통계를 확인합니다. 이 데이터를 사용하여 애플리케이션이 다음과 같은지 확인하십시오.
    • GPU 바인딩
    • CPU 바운드
    • 시스템의 컴퓨팅 리소스를 비효율적으로 활용
  • 플랫폼 창의 정보를 사용하여 기본 CPU 및 GPU 지표를 확인하십시오.
  • 그래픽 창에서 특정 컴퓨팅 작업을 조사합니다.

더 자세한 분석은 VTune Pro에서 관련 레시피를 참조하십시오.filer 성능 분석 요리책. GPU 컴퓨팅/미디어 핫스팟 분석으로 프로파일링을 계속할 수도 있습니다.

Examp르: 프로file Windows*의 SYCL* 애플리케이션
찬성file ~처럼amp인텔® VTune™ Pro를 사용한 le matrix_multiply SYCL 응용 프로그램file아르 자형. 제품에 익숙해지고 GPU 바인딩 애플리케이션에 대해 수집된 통계를 이해합니다.

필수 조건

  • 시스템에 Microsoft* Visual Studio(v2017 이상)가 설치되어 있는지 확인하십시오.
  • 인텔 VTune 프로 설치filer Intel® oneAPI Base Toolkit 또는 Intel® System Bring-up Toolkit에서 가져옵니다. 이러한 툴킷에는 프로파일링 프로세스에 필요한 인텔® oneAPI DPC++/C++ 컴파일러(icpx -fsycl) 컴파일러가 포함되어 있습니다.
  • 환경 변수를 설정합니다. 에 있는 vars.bat 스크립트를 실행합니다. \env 디렉토리.
  • Intel oneAPI DPC++ Compiler(Intel oneAPI Base 툴킷과 함께 설치됨)가 Microsoft Visual Studio에 통합되었는지 확인하십시오.
  • 인텔 oneAPI DPC++ 컴파일러에 대한 -gline-tables-only 및 -fdebug-info-for-profiling 옵션을 사용하여 코드를 컴파일합니다.
  • GPU 분석을 위해 시스템을 설정합니다.

Intel VTune Pro 설치에 대한 정보filer Microsoft* Visual Studio 환경의 경우 VTune Pro를 참조하십시오.filer 사용 설명서.

매트릭스 앱 구축
matrix_multiply_vtune 코드 다운로드ampIntel oneAPI 툴킷용 파일 패키지. 여기에는 s가 포함됩니다.amp빌드 및 프로용으로 사용할 수 있는 파일file SYCL 애플리케이션.

  1. Microsoft* Visual Studio를 엽니다.
  2. 딸깍 하는 소리 File > 열기 > 프로젝트/솔루션. matrix_multiply_vtune 폴더를 찾아 matrix_multiply.sln을 선택합니다.
  3. 이 구성을 빌드합니다(프로젝트 > 빌드).
  4. 프로그램을 실행합니다(디버그 > 디버깅하지 않고 시작).
  5. s의 DPC++ 또는 스레드 버전을 선택하려면amp파일, 전처리기 정의를 사용합니다.
    1. 프로젝트 속성 > DPC++ > 전처리기 > 전처리기 정의로 이동합니다.
    2. icpx -fsycl 또는 USE_THR을 정의합니다.

GPU 분석 실행
Matrix에서 GPU 분석 실행amp르.

  1. Visual Studio 도구 모음에서 분석 구성 단추를 클릭하십시오.
    분석 구성 창이 열립니다. 기본적으로 VS 프로젝트 설정을 상속하고 pro에 대한 응용 프로그램으로 matrix_multiply.exe를 지정합니다.file.
  2. 분석 구성 창에서인텔-VTune-Pro 시작하기filer-06 HOW 창의 찾아보기 버튼.
  3. 분석 트리의 가속기 그룹에서 GPU 컴퓨팅/미디어 핫스팟 분석 유형을 선택합니다.
    인텔-VTune-Pro 시작하기filer-06
  4. 미리 정의된 옵션으로 분석을 시작하려면 시작 버튼을 클릭합니다.

명령줄에서 GPU 분석 실행:

  1. s를 열어라amp파일 디렉토리:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. 이 디렉토리에서 Visual Studio* 프로젝트를 엽니다. file 이름이 matrix_multiply.sln
  3. 곱하기.cpp file 여러 버전의 행렬 곱셈이 포함되어 있습니다. multiply.hpp에서 해당 #define MULTIPLY 줄을 편집하여 버전을 선택합니다.
  4. 릴리스 구성으로 전체 프로젝트를 빌드합니다.
    그러면 matrix_multiply.exe라는 실행 파일이 생성됩니다.
  5. GPU 분석을 실행하도록 시스템을 준비합니다. GPU 분석을 위한 시스템 설정을 참조하십시오.
  6. VTune Pro 설정file배치를 실행하여 r 환경 변수 file: 내보내다 \env\vars.bat
  7. 분석 명령을 실행합니다.
    vtune.exe -gpu 오프로드 수집 — matrix_multiply.exe

VTune 프로filer은 GPU 컴퓨팅/미디어 핫스팟에서 데이터를 수집하고 분석 결과를 표시합니다. view가리키다. 요약 창에서 CPU 및 GPU 리소스 사용량에 대한 통계를 보고 애플리케이션이 GPU에 바인딩되어 있는지 확인합니다. 그래픽 창으로 전환하여 시간 경과에 따른 코드 실행을 나타내는 기본 CPU 및 GPU 메트릭을 확인합니다.

인텔® VTune™ 프로 시작하기fileLinux* OS용 r

시작하기 전에

  1. 인텔® VTune™ 프로 설치filer Linux* 시스템에서.
  2. 심볼 정보와 모든 최적화가 활성화된 릴리스 모드에서 애플리케이션을 빌드합니다. 컴파일러 설정에 대한 자세한 내용은 VTune Profiler 온라인 사용 설명서.
    행렬 s를 사용할 수도 있습니다.amp에서 사용할 수 있는 응용 프로그램 \에스ample\matrix. 당신은 s를 볼 수 있습니다amp르 결과 \에스amp르(매트릭스).
  3. 환경 변수 설정: 소스 /setvars.sh
    기본적으로 이다:
    • $HOME/intel/oneapi/ 사용자 권한으로 설치한 경우;
    • 루트 권한으로 설치한 경우 /opt/intel/oneapi/.

1단계: VTune Pro 시작filer
VTune Pro 시작filer 다음 방법 중 하나를 사용합니다.

소스 / VTune Pro 시작filer
독립형/IDE(GUI)

  1. vtunegui 명령을 실행합니다. VTune Pro를 시작하려면filer Intel System Studio IDE에서 도구 > VTune Pro를 선택합니다.filer > VTune Pro 실행file아르 자형. 이것은 모든 적절한 환경 변수를 설정하고 제품의 독립 실행형 인터페이스를 시작합니다.
  2. GUI가 열리면 시작 화면에서 새 프로젝트를 클릭합니다.
  3. 프로젝트 만들기 대화 상자에서 프로젝트 이름과 위치를 지정합니다.
  4. 프로젝트 만들기를 클릭합니다.

독립형(명령줄)

  • vtune 명령을 실행합니다.

2단계: 분석 구성 및 실행
새 프로젝트를 만든 후 분석 구성 창이 다음 기본값과 함께 열립니다.

인텔-VTune-Pro 시작하기filer-07

  1. 응용 프로그램 실행 섹션에서 응용 프로그램의 위치를 ​​찾습니다.
  2. 애플리케이션에서 성능 스냅샷을 실행하려면 시작을 클릭하십시오. 이 분석은 일반적인 이상을 제시합니다.view 대상 시스템에서 애플리케이션의 성능에 영향을 미치는 문제.

3단계: View 성능 데이터 분석
데이터 수집이 완료되면 VTune Profiler은 요약 창에 분석 결과를 표시합니다. 여기, 당신은 이상의 성능을 참조하십시오view 응용 프로그램의.
오버view 일반적으로 설명과 함께 여러 메트릭이 포함됩니다.

인텔-VTune-Pro 시작하기filer-08

  • A 기여 요인에 대한 자세한 정보를 보려면 각 메트릭을 펼치십시오.
  • B 플래그가 지정된 메트릭은 허용/정상 작동 범위를 벗어난 값을 나타냅니다. 플래그가 지정된 지표를 개선하는 방법을 이해하려면 도구 설명을 사용하십시오.
  • C 다음 실행을 고려해야 하는 다른 분석에 대한 지침을 참조하십시오. 분석 트리는 이러한 권장 사항을 강조 표시합니다.

다음 단계
성능 스냅샷은 VTune Pro를 사용하여 응용 프로그램 성능을 전반적으로 평가할 수 있는 좋은 출발점입니다.file아르 자형. 다음으로 알고리즘에 조정이 필요한지 확인합니다.

  1. 일반적인 성능 병목 현상을 분석하려면 자습서를 따르십시오.
  2. 알고리즘이 잘 조정되면 성능 스냅샷을 다시 실행하여 결과를 보정하고 다른 영역에서 잠재적인 성능 향상을 식별합니다.

또한 참조
마이크로아키텍처 탐색

VTune 프로filer 도움말 둘러보기

Examp르: 프로file Linux*의 OpenMP 애플리케이션
인텔 VTune 프로 사용filer을 Linux 머신에서 프로로file ~처럼ample iso3dfd_omp_offload Intel GPU에 오프로드된 OpenMP 응용 프로그램. GPU 분석을 실행하고 결과를 검토하는 방법을 알아보세요.

필수 조건

  • 시스템에서 Linux* OS 커널 4.14 이상을 실행 중인지 확인하십시오.
  • 다음 인텔 프로세서 그래픽 버전 중 하나를 사용하십시오.
    • 8세대
    • 9세대
    • 11세대
  • 시스템은 다음 인텔 프로세서 중 하나에서 실행되어야 합니다.
    • 7세대 Intel® Core™ i7 프로세서(코드명 Kaby Lake)
    • 8세대 Intel® Core™ i7 프로세서(코드명 Coffee Lake)
    • 10세대 Intel® Core™ i7 프로세서(코드명 Ice Lake)
  • Linux GUI의 경우 다음을 사용합니다.
    • GTK+ 버전 2.10 이상(2.18 이상 권장)
    • Pango 버전 1.14 이상
    • X.Org 버전 1.0 이상(1.7 이상 권장)
  • 인텔 VTune 프로 설치filer 다음 출처 중 하나에서 가져옴:
    • 독립형 제품 다운로드
    • 인텔® oneAPI 기본 툴킷
    • 인텔® 시스템 브링업 툴킷
  • 프로에 필요한 인텔® oneAPI DPC++/C++ 컴파일러(icx/icpx)가 포함된 인텔® oneAPI HPC 툴킷을 다운로드하십시오.file OpenMP 응용 프로그램.
  • 환경 변수를 설정합니다. vars.sh 스크립트를 실행합니다.
  • GPU 분석을 위해 시스템을 설정합니다.

OpenMP 오프로드 애플리케이션 빌드 및 컴파일

  1. iso3dfd_omp_offload OpenMP 오프로드 다운로드amp르.
  2. s에 열려amp르 디렉토리.
    시디 <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. OpenMP 오프로드 애플리케이션을 컴파일합니다.

mkdir 빌드;
cmake -DVERIFY_RESULTS=0 ..
-j를 만들다

그러면 src/iso3dfd 실행 파일이 생성됩니다.

프로그램을 삭제하려면 다음을 입력하십시오.
깨끗하게 하다

이렇게 하면 실행 파일과 개체가 제거됩니다. filemake 명령으로 만든 s.

OpenMP 오프로드 애플리케이션에서 GPU 분석 실행
이제 컴파일한 OpenMP 애플리케이션에서 GPU 오프로드 분석을 실행할 준비가 되었습니다.

  1. VTune Pro 열기filer 새 프로젝트를 클릭하여 프로젝트를 생성합니다.
  2. 시작 페이지에서 분석 구성을 클릭하여 분석을 설정합니다.
  3. 분석을 위해 이러한 설정을 선택하십시오.
    • WHERE 창에서 로컬 호스트를 선택합니다.
    • WHAT 창에서 애플리케이션 시작을 선택하고 iso3dfd_omp_offload 바이너리를 프로에 대한 애플리케이션으로 지정합니다.file.
    • 방법 창에서 분석 트리의 가속기 그룹에 있는 GPU 오프로드 분석 유형을 선택합니다.
      인텔-VTune-Pro 시작하기filer-09
  4. 시작 버튼을 클릭하여 분석을 실행합니다.

VTune 프로filer은 GPU 오프로드에서 데이터를 수집하고 분석 결과를 표시합니다. view가리키다.

  • 요약 창에서 CPU 및 GPU 리소스 사용량에 대한 통계를 확인합니다. 이 데이터를 사용하여 애플리케이션이 다음과 같은지 확인하십시오.
    • GPU 바인딩
    • CPU 바운드
    • 시스템의 컴퓨팅 리소스를 비효율적으로 활용
  • 플랫폼 창의 정보를 사용하여 기본 CPU 및 GPU 지표를 확인하십시오.
  • 그래픽 창에서 특정 컴퓨팅 작업을 조사합니다.

더 자세한 분석은 VTune Pro에서 관련 레시피를 참조하십시오.filer 성능 분석 요리책. GPU 컴퓨팅/미디어 핫스팟 분석으로 프로파일링을 계속할 수도 있습니다.

Examp르: 프로file Linux*의 SYCL* 애플리케이션
VTune Pro 사용filer을 다음과 같이ample matrix_multiply SYCL 애플리케이션을 사용하여 GPU 바인딩 애플리케이션에 대해 수집된 제품 및 통계에 빠르게 익숙해집니다.

필수 조건

  • VTune 프로 설치filer 및 인텔® oneAPI 기본 툴킷 또는 인텔® 시스템 브링업 툴킷의 인텔® oneAPI DPC++/C++ 컴파일러.
  • vars.sh 스크립트를 실행하여 환경 변수를 설정합니다.
  • GPU 분석을 위해 시스템을 설정합니다.

매트릭스 애플리케이션 구축
matrix_multiply_vtune 코드 다운로드ampIntel oneAPI 툴킷용 파일 패키지. 여기에는 s가 포함됩니다.amp빌드 및 프로용으로 사용할 수 있는 파일file SYCL 애플리케이션.

프로에게file SYCL 애플리케이션인 경우 -gline-tables-only 및 -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler 옵션을 사용하여 코드를 컴파일해야 합니다.

이것을 컴파일하려면amp응용 프로그램에서 다음을 수행하십시오.

  1. S로 이동amp르 디렉토리.
    시디 <sample_dir/VtuneProfiler/matrix_multiply>
  2. 곱하기.cpp file src 폴더에는 여러 버전의 행렬 곱셈이 포함되어 있습니다. multiply.h에서 해당 #define MULTIPLY 줄을 편집하여 버전을 선택합니다.
  3. 기존 Make를 사용하여 앱 빌드file:
    cmake .
    만들다
    이렇게 하면 matrix.icpx -fsycl 실행 파일이 생성됩니다.
    프로그램을 삭제하려면 다음을 입력하십시오.
    깨끗하게 하다
    이렇게 하면 실행 파일과 개체가 제거됩니다. filemake 명령에 의해 생성된 s.

GPU 분석 실행
Matrix에서 GPU 분석 실행amp르.

  1. VTune Pro 실행filer vtune-gui 명령으로.
  2. 시작 페이지에서 새 프로젝트를 클릭합니다.
  3. s의 이름과 위치 지정amp프로젝트를 선택하고 프로젝트 만들기를 클릭합니다.
  4. WHAT 창에서 matrix.icpx-fsycl을 찾습니다. file.
  5. 방법 창에서 인텔-VTune-Pro 시작하기filer-06 찾아보기 버튼을 클릭하고 분석 트리의 가속기 그룹에서 GPU 컴퓨팅/미디어 핫스팟 분석을 선택합니다.
    인텔-VTune-Pro 시작하기filer-10
  6. 미리 선택된 옵션으로 분석을 시작하려면 하단의 시작 버튼을 클릭하십시오.

명령줄에서 GPU 분석 실행:

  1. GPU 분석을 실행하도록 시스템을 준비합니다. GPU 분석을 위한 시스템 설정을 참조하십시오.
  2. 인텔 소프트웨어 도구에 대한 환경 변수 설정:
    소스 $ONEAPI_ROOT/setvars.sh
  3. GPU 컴퓨팅/미디어 핫스팟 분석을 실행합니다.
    vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    요약 보고서를 보려면 다음을 입력하십시오.
    vtune -보고서 요약 -r ./result_gpu-hotspots

VTune 프로filer은 GPU 컴퓨팅/미디어 핫스팟에서 데이터를 수집하고 분석 결과를 표시합니다. view가리키다. 요약 창에서 CPU 및 GPU 리소스 사용량에 대한 통계를 보고 애플리케이션이 GPU에 바인딩되어 있는지 확인합니다. 그래픽 창으로 전환하여 시간 경과에 따른 코드 실행을 나타내는 기본 CPU 및 GPU 메트릭을 확인합니다.

인텔® VTune™ 프로 시작하기filemacOS*용 r

VTune Pro 사용filemacOS 시스템에서 비 macOS 시스템(Linux* 또는 Android*만 해당)에서 원격 대상 분석을 수행합니다.

VTune Pro를 사용할 수 없습니다.filer 이러한 목적을 위해 macOS 환경에서:

  • 찬성file 설치된 macOS 시스템.
  • 원격 macOS 시스템에서 데이터를 수집합니다.

macOS 호스트에서 원격 Linux* 또는 Android* 대상의 성능을 분석하려면 다음 단계 중 하나를 수행하십시오.

  • VTune Pro 실행file원격 시스템이 대상으로 지정된 macOS 시스템에 대한 r 분석. 분석이 시작되면 VTune Profiler은 원격 시스템에 연결하여 데이터를 수집한 다음 결과를 macOS 호스트로 다시 가져옵니다. view주고받음.
  • 대상 시스템에서 로컬로 분석을 실행하고 결과를 macOS 시스템에 복사하여 viewVTune Pro에서 실행filer.

이 문서의 단계에서는 원격 Linux 대상 시스템을 가정하고 VTune Pro에서 SSH 액세스를 사용하여 성능 데이터를 수집합니다.filer macOS 호스트 시스템에서.

시작하기 전에

  1. 인텔® VTune™ 프로 설치filemacOS* 시스템의 r.
  2. 기호 정보를 사용하여 모든 최적화가 활성화된 릴리스 모드에서 Linux 애플리케이션을 빌드합니다. 자세한 내용은 VTune Pro의 컴파일러 설정을 참조하십시오.filer 도움말.
  3. 암호 없는 모드에서 작동하도록 호스트 macOS 시스템에서 대상 Linux 시스템으로의 SSH 액세스를 설정합니다.

1단계: VTune Pro 시작filer

  1. VTune Pro 실행filer vtune-gui 명령으로.
    기본적으로 /opt/intel/oneapi/입니다.
  2. GUI가 열리면 시작 화면에서 새 프로젝트를 클릭합니다.
  3. 프로젝트 만들기 대화 상자에서 프로젝트 이름과 위치를 지정합니다.
  4. 프로젝트 만들기를 클릭합니다.

2단계: 분석 구성 및 실행
새 프로젝트를 생성하면 분석 구성 창이 성능 스냅샷 분석 유형과 함께 열립니다.
이 분석은 끝을 제시합니다view 대상 시스템에서 애플리케이션의 성능에 영향을 미치는 문제.

인텔-VTune-Pro 시작하기filer-11

  1. WHERE 창에서 원격 Linux(SSH)를 선택하고 username@ hostname[:port]를 사용하여 대상 Linux 시스템을 지정합니다.
    VTune 프로filer은 Linux 시스템에 연결하고 대상 패키지를 설치합니다.
  2. WHAT 창에서 대상 Linux 시스템의 애플리케이션 경로를 제공합니다.
  3. 시작 버튼을 클릭하여 애플리케이션에서 성능 스냅샷을 실행합니다.

3단계: View 성능 데이터 분석
데이터 수집이 완료되면 VTune Profiler은 macOS 시스템에서 분석 결과를 표시합니다. 요약 창에서 분석을 시작하십시오. 여기, 당신은 이상의 성능을 참조하십시오view 응용 프로그램의.

오버view 일반적으로 설명과 함께 여러 메트릭이 포함됩니다.

인텔-VTune-Pro 시작하기filer-12

  • A 기여 요인에 대한 자세한 정보를 보려면 각 메트릭을 펼치십시오.
  • B 플래그가 지정된 메트릭은 허용/정상 작동 범위를 벗어난 값을 나타냅니다. 플래그가 지정된 지표를 개선하는 방법을 이해하려면 도구 설명을 사용하십시오.
  • C 다음 실행을 고려해야 하는 다른 분석에 대한 지침을 참조하십시오. 분석 트리는 이러한 권장 사항을 강조 표시합니다.

다음 단계
성능 스냅샷은 VTune Pro를 사용하여 응용 프로그램 성능을 전반적으로 평가할 수 있는 좋은 출발점입니다.filer.
다음으로 알고리즘에 조정이 필요한지 확인합니다.

  1. 애플리케이션에서 핫스팟 분석을 실행합니다.
  2. 핫스팟 튜토리얼을 따르십시오. 핫스팟 분석을 최대한 활용하는 기술을 배웁니다.
  3. 알고리즘이 잘 조정되면 성능 스냅샷을 다시 실행하여 결과를 보정하고 다른 영역에서 잠재적인 성능 향상을 식별합니다.

또한 참조
마이크로아키텍처 탐색

VTune 프로filer 도움말 둘러보기

더 알아보기
문서/설명

  • 사용자 가이드
    사용자 안내서는 VTune Pro의 기본 설명서입니다.filer.
    메모
    VTune Pro의 오프라인 버전을 다운로드할 수도 있습니다.filer 문서.
  • 온라인 교육
    온라인 교육 사이트는 VTune Pro의 기본 사항을 배울 수 있는 훌륭한 리소스입니다.filer 시작하기 가이드, 비디오, 튜토리얼, webinars 및 기술 기사.
  • 자세한 해설서
    VTune Pro의 분석 유형을 사용하여 인기 있는 성능 문제를 식별하고 해결하는 방법이 포함된 성능 분석 요리책filer.
  • Windows용 설치 가이드 | 리눅스 | macOS 호스트
    설치 안내서에는 VTune Pro의 기본 설치 지침이 포함되어 있습니다.filer 및 다양한 드라이버 및 수집기에 대한 설치 후 구성 지침.
  • 튜토리얼
    VTune 프로filer 자습서는 짧은 s로 기본 기능을 통해 새로운 사용자를 안내합니다.amp르 응용 프로그램.
  • 릴리스 노트
    최신 버전의 VTune Pro에 대한 정보 찾기filer에는 새로운 기능, 시스템 요구 사항 및 해결된 기술 문제에 대한 포괄적인 설명이 포함됩니다.
    VTune Pro의 독립 실행형 및 툴킷 버전용filer, 현재 시스템 요구 사항을 이해합니다.

고지 및 면책 사항
인텔 기술은 활성화 된 하드웨어, 소프트웨어 또는 서비스 활성화가 필요할 수 있습니다.
어떤 제품이나 구성 요소도 절대적으로 안전할 수 없습니다.
비용과 결과는 다를 수 있습니다.
© 인텔사. 인텔, 인텔 로고 및 기타 인텔 마크는 인텔사 또는 그 자회사의 상표입니다. 다른 이름과 브랜드는 다른 사람의 자산으로 주장될 수 있습니다.
Intel, Intel 로고, Intel Atom, Intel Core, Intel Xeon Phi, VTune 및 Xeon은 미국 및/또는 기타 국가에서 Intel Corporation의 상표입니다.
*다른 이름과 브랜드는 다른 사람의 재산이라고 주장될 수 있습니다.
Microsoft, Windows 및 Windows 로고는 미국 및/또는 기타 국가에서 Microsoft Corporation의 상표 또는 등록 상표입니다.
Java는 Oracle 및/또는 그 계열사의 등록 상표입니다.
OpenCL 및 OpenCL 로고는 Apple Inc.의 상표이며 Khronos의 허가를 받아 사용됩니다.

인텔 기술은 활성화 된 하드웨어, 소프트웨어 또는 서비스 활성화가 필요할 수 있습니다.
어떤 제품이나 구성 요소도 절대적으로 안전할 수 없습니다.
비용과 결과는 다를 수 있습니다.
© 인텔사. 인텔, 인텔 로고 및 기타 인텔 마크는 인텔사 또는 그 자회사의 상표입니다. 다른 이름과 브랜드는 다른 사람의 자산으로 주장될 수 있습니다.
Intel, Intel 로고, Intel Atom, Intel Core, Intel Xeon Phi, VTune 및 Xeon은 미국 및/또는 기타 국가에서 Intel Corporation의 상표입니다.
*다른 이름과 브랜드는 다른 사람의 재산이라고 주장될 수 있습니다.
Microsoft, Windows 및 Windows 로고는 미국 및/또는 기타 국가에서 Microsoft Corporation의 상표 또는 등록 상표입니다.
Java는 Oracle 및/또는 그 계열사의 등록 상표입니다.
OpenCL 및 OpenCL 로고는 Apple Inc.의 상표이며 Khronos의 허가를 받아 사용됩니다.

문서 / 리소스

인텔 VTune Pro 시작하기filer [PDF 파일] 사용자 가이드
VTune Pro 시작하기filer, VTune Pro 시작하기fileR, VTune 프로filer

참고문헌

댓글을 남겨주세요

이메일 주소는 공개되지 않습니다. 필수 항목은 표시되어 있습니다. *