intel-Get-Start-with-VTune-Profiler-ロゴ

intel VTune Pro を使ってみるfiler

インテル® VTune™ Pro を始めるfiler

インテル VTune プロを使用するfiler Windows*、macOS*、および Linux* ホストからのローカルおよびリモートのターゲット システムを分析します。 次の操作により、アプリケーションとシステムのパフォーマンスを向上させます。

  • アルゴリズムの選択を分析します。
  • シリアル コードとパラレル コードのボトルネックを見つけます。
  • アプリケーションが利用可能なハードウェア リソースをどこでどのように利用できるかを理解します。
  • アプリケーションの実行を高速化します。
    インテル VTune プロをダウンロードfile次のいずれかの方法でシステムにアクセスします。
  • スタンドアロン版をダウンロードします。
  • インテル VTune プロを入手fileインテル® oneAPI Base Toolkit の一部として。
    VTune プロを見るfile動画のトレーニング ページ、 webinars、および開始に役立つその他の資料。

注記
インテル® VTune™ Pro のバージョンに関するドキュメントfiler 2021 リリースより前は、ダウンロードのみで利用できます。 製品バージョンごとにダウンロード可能なドキュメントのリストについては、次のページを参照してください。

  • インテル Parallel Studio XE のドキュメントをダウンロード
  • インテル System Studio のドキュメントをダウンロード

ワークフローを理解する
インテル VTune プロを使用するfileプロへfile アプリケーションを作成し、結果を分析してパフォーマンスを向上させます。

一般的なワークフローには、次の手順が含まれます。

intel-Get-Start-with-VTune-Profiler-01

ホストシステムを選択して始めましょう
Windows*、Linux*、または macOS* のシステム固有のワークフローの詳細をご覧ください。

intel-Get-Start-with-VTune-Profiler-02

インテル® VTune™ Pro を始めるfileWindows* OS の場合

始める前に

  1. インテル® VTune™ Pro をインストールするfileWindows* システムでは r.
  2. シンボル情報を使用して、すべての最適化を有効にしてリリース モードでアプリケーションをビルドします。 コンパイラー設定の詳細については、VTune Pro を参照してください。filer オンライン ユーザー ガイド。
    行列 s を使用することもできますampで利用可能なアプリケーション\VTune\Sampレ\マトリックス。 対応する s を見ることができますampルの結果\VTune\Projects\sampル (行列)。
  3. 環境変数をセットアップします。 \setvars.bat スクリプト。
    デフォルトでは、 oneAPI コンポーネントの場合は Program File(x86)\Intel\oneAPI.
    注記 インテル® VTune™ Pro を使用する場合、setvars.bat を実行する必要はありません。filer Microsoft* Visual Studio* 内。

ステップ 1: インテル® VTune™ Pro を起動するfiler
インテル VTune プロを起動fileこれらの方法のいずれかを実行して、プロジェクトをセットアップします。 プロジェクトは、分析するアプリケーション、分析の種類、およびデータ収集結果のコンテナーです。

VTune Pro のソース / 起動filer

スタンドアロン (GUI)

  1. vtune-gui コマンドを実行するか、インテル® VTune™ Pro を実行します。fileスタートメニューからr.
  2. GUI が開いたら、ようこそ画面で をクリックします。
  3. [プロジェクトの作成] ダイアログ ボックスで、プロジェクトの名前と場所を指定します。
  4. [プロジェクトの作成]をクリックします。

スタンドアロン (コマンドライン)
vtune コマンドを実行します。

Microsoft* Visual Studio* IDE
Visual Studio でソリューションを開きます。 VTune プロfiler ツールバーが自動的に有効になり、Visual Studio プロジェクトが分析対象として設定されます。

注記
インテル® VTune™ Pro を実行する場合、プロジェクトを作成する必要はありませんfileコマンドラインから、または Microsoft* Visual Studio 内で。

ステップ 2: 分析の構成と実行
新しいプロジェクトを作成すると、[分析の構成] ウィンドウが開き、次のデフォルト値が表示されます。

intel-Get-Start-with-VTune-Profiler-03

  1. [アプリケーションの起動] セクションで、アプリケーションの実行可能ファイルの場所を参照します。 file.
  2. [開始] をクリックして、アプリケーションでパフォーマンス スナップショットを実行します。 この分析は、一般的なview ターゲット システムでのアプリケーションのパフォーマンスに影響を与える問題。

ステップ3: View およびパフォーマンス データの分析
データ収集が完了すると、VTune Profiler は、[概要] ウィンドウに分析結果を表示します。 ここで、パフォーマンスが見られますview アプリケーションの。
以上view 通常、いくつかの指標とその説明が含まれています。

intel-Get-Start-with-VTune-Profiler-04

  • A 要因に関する詳細情報については、各指標を展開してください。
  • B フラグが立てられたメトリックは、許容範囲/通常の動作範囲外の値を示します。 ツール ヒントを使用して、フラグが立てられたメトリックを改善する方法を理解します。
  • C 次に実行することを検討する必要があるその他の分析に関するガイダンスを参照してください。 分析ツリーでは、これらの推奨事項が強調表示されます。

次のステップ
パフォーマンス スナップショットは、VTune Pro でのアプリケーション パフォーマンスの全体的な評価を得るための良い出発点です。filer. 次に、アルゴリズムの調整が必要かどうかを確認します。

  1. チュートリアルに従って、一般的なパフォーマンスのボトルネックを分析します。
  2. アルゴリズムが適切に調整されたら、パフォーマンス スナップショットを再度実行して結果を調整し、他の領域での潜在的なパフォーマンスの改善を特定します。

参照
マイクロアーキテクチャの調査

VTune プロfiler ヘルプツアー

Examp上: プロfile Windows* 上の OpenMP* アプリケーション
インテル VTune プロを使用するfileプロへのWindowsマシン上のrfile としてample iso3dfd_omp_offload Intel GPU にオフロードされた OpenMP アプリケーション。 GPU 解析を実行して結果を調べる方法を学びます。

前提条件

  • システムで Microsoft* Windows 10 以降のバージョンが実行されていることを確認してください。
  • インテル プロセッサー グラフィックスの次のバージョンのいずれかを使用します。
    • 第8世代
    • 第9世代
    • 第11世代
  • システムは、次の Intel プロセッサのいずれかで実行されている必要があります。
    • 第 7 世代インテル® Core™ i7 プロセッサー (コードネーム Kaby Lake)
    • 第 8 世代インテル® Core™ i7 プロセッサー (コードネーム Coffee Lake)
    • 第 10 世代インテル® Core™ i7 プロセッサー (コードネーム Ice Lake)
  • インテル VTune プロをインストールするfiler 次のソースのいずれかから:
    • スタンドアロン製品のダウンロード
    • インテル® oneAPI ベース・ツールキット
    • インテル® システム・ブリングアップ・ツールキット
  • プロに必要なインテル® oneAPI DPC++/C++ コンパイラー (icx/icpx) を含むインテル® oneAPI HPC Toolkit をダウンロードします。file OpenMP アプリケーション。
  • 環境変数を設定します。 にある vars.bat スクリプトを実行します。 \env ディレクトリ。
  • GPU 解析用にシステムをセットアップします。

注記
インテル VTune プロをインストールするにはfiler Microsoft* Visual Studio 環境では、VTune Pro を参照してください。fileユーザー ガイド。

OpenMP オフロード アプリケーションのビルドとコンパイル

  1. iso3dfd_omp_offload OpenMP Offload をダウンロードしますampル。
  2. sにオープンampルディレクトリ。
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. OpenMP オフロード アプリケーションをコンパイルします。

mkdir ビルド
CDビルド
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

OpenMP オフロード アプリケーションで GPU 解析を実行する
これで、コンパイルした OpenMP アプリケーションで GPU オフロード分析を実行する準備が整いました。

  1. VTune プロを開くfiler をクリックし、[新しいプロジェクト] をクリックしてプロジェクトを作成します。
  2. ウェルカム ページで、[分析の構成] をクリックして分析を設定します。
  3. 分析用にこれらの設定を選択します。
    • [WHERE] ペインで、[ローカル ホスト] を選択します。
    • [WHAT] ペインで [Launch Application] を選択し、pro にするアプリケーションとして iso3dfd_omp_offload バイナリを指定します。file.
    • HOW ペインで、解析ツリーの Accelerators グループから GPU オフロード解析タイプを選択します。
      intel-Get-Start-with-VTune-Profiler-05
  4. [開始] ボタンをクリックして分析を実行します。

VTune プロfiler はデータを収集し、GPU オフロードで分析結果を表示します viewポイント。

  • [概要] ウィンドウで、CPU および GPU リソースの使用状況に関する統計を確認します。 このデータを使用して、アプリケーションが次のとおりかどうかを判断します。
    • GPUバウンド
    • CPUバウンド
    • システムのコンピューティング リソースを非効率的に利用する
  • プラットフォーム ウィンドウの情報を使用して、基本的な CPU および GPU メトリックを表示します。
  • グラフィックウィンドウで特定の計算タスクを調査します。

詳細な分析については、VTune Pro で関連するレシピを参照してください。filer パフォーマンス分析クックブック。 GPU コンピューティング/メディア ホットスポット分析でプロファイリングを続けることもできます。

Example:プロfile Windows* 上の SYCL* アプリケーション
プロfile としてample matrix_multiply インテル® VTune™ Pro を使用した SYCL* アプリケーションfiler. 製品に慣れ、GPU にバインドされたアプリケーションについて収集される統計を理解します。

前提条件

  • システムに Microsoft* Visual Studio (v2017 以降) がインストールされていることを確認してください。
  • インテル VTune プロをインストールするfiler インテル® oneAPI ベース ツールキットまたはインテル® システム ブリングアップ ツールキットから。 これらのツールキットには、プロファイリング プロセスに必要なインテル® oneAPI DPC++/C++ コンパイラー (icpx -fsycl) コンパイラーが含まれています。
  • 環境変数を設定します。 にある vars.bat スクリプトを実行します。 \env ディレクトリ。
  • Intel oneAPI DPC++ Compiler (Intel oneAPI Base ツールキットと共にインストール) が Microsoft Visual Studio に統合されていることを確認します。
  • Intel oneAPI DPC++ Compiler の -gline-tables-only および -fdebug-info-for-profiling オプションを使用してコードをコンパイルします。
  • GPU 解析用にシステムをセットアップします。

インテル VTune プロのインストールに関する情報filer Microsoft* Visual Studio 環境では、VTune Pro を参照してください。fileユーザー ガイド。

マトリックス アプリを構築する
matrix_multiply_vtune コードをダウンロードします。ampIntel oneAPI ツールキット用のファイル パッケージ。 これには s が含まれます。ampビルドとプロに使用できるファイルfile SYCL アプリケーション。

  1. Microsoft* Visual Studio を開きます。
  2. クリック File > 開く > プロジェクト/ソリューション。 matrix_multiply_vtune フォルダーを見つけて、matrix_multiply.sln を選択します。
  3. この構成をビルドします ([プロジェクト] > [ビルド])。
  4. プログラムを実行します ([デバッグ] > [デバッグなしで開始])。
  5. の DPC++ またはスレッド バージョンを選択するにはampファイル、プリプロセッサ定義を使用します。
    1. [プロジェクト プロパティ] > [DPC++] > [プリプロセッサ] > [プリプロセッサ定義] に移動します。
    2. icpx -fsycl または USE_THR を定義します。

GPU 解析の実行
Matrix で GPU 解析を実行するampル。

  1. Visual Studio ツールバーから、[分析の構成] ボタンをクリックします。
    [分析の構成] ウィンドウが開きます。 デフォルトでは、VS プロジェクトの設定を継承し、matrix_multiply.exe を pro へのアプリケーションとして指定します。file.
  2. [分析の構成] ウィンドウで、intel-Get-Start-with-VTune-Profiler-06 HOW ペインの参照ボタン。
  3. 解析ツリーの Accelerators グループから GPU Compute/Media Hotspots 解析タイプを選択します。
    intel-Get-Start-with-VTune-Profiler-06
  4. [開始] ボタンをクリックして、定義済みのオプションで分析を開始します。

コマンド ラインから GPU 解析を実行します。

  1. sを開くampファイルディレクトリ:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. このディレクトリーで、Visual Studio* プロジェクトを開きます file という名前の matrix_multiply.sln
  3. 乗算.cpp file 行列乗算のいくつかのバージョンが含まれています。 Multiply.hpp の対応する #define MULTIPLY 行を編集して、バージョンを選択します。
  4. リリース構成でプロジェクト全体をビルドします。
    これにより、matrix_multiply.exe という実行可能ファイルが生成されます。
  5. GPU 解析を実行するシステムを準備します。 GPU 解析用のシステムの設定を参照してください。
  6. VTune Pro を設定するfileバッチを実行して環境変数 file: 輸出\env\vars.bat
  7. 分析コマンドを実行します。
    vtune.exe -collect gpu-offload — math_multiply.exe

VTune プロfiler データを収集し、解析結果を GPU コンピューティング/メディア ホットスポットに表示します view点。 [概要] ウィンドウで、CPU と GPU リソースの使用状況に関する統計を確認して、アプリケーションが GPU にバインドされているかどうかを確認します。 グラフィックウィンドウに切り替えて、経時的なコード実行を表す基本的な CPU および GPU メトリックを表示します。

インテル® VTune™ Pro を始めるfileLinux* OS の場合

始める前に

  1. インテル® VTune™ Pro をインストールするfileLinux* システムでは r.
  2. シンボル情報を使用して、すべての最適化を有効にしてリリース モードでアプリケーションをビルドします。 コンパイラー設定の詳細については、VTune Pro を参照してください。filer オンライン ユーザー ガイド。
    行列 s を使用することもできますampで利用可能なアプリケーション\sampル\マトリックス。 あなたが見ることができますampルの結果\sampル (行列)。
  3. 環境変数を設定します: source /setvars.sh
    デフォルトでは、 は:
    • $HOME/intel/oneapi/ (ユーザー権限でインストールした場合);
    • /opt/intel/oneapi/ (ルート権限でインストールした場合)。

ステップ 1: VTune プロを起動するfiler
VTune プロを起動file次のいずれかの方法を使用します。

VTune Pro のソース / 起動filer
スタンドアロン/IDE (GUI)

  1. vtunegui コマンドを実行します。 VTune Pro を起動するにはfileインテル® System Studio IDE から、[ツール] > [VTune Pro] を選択します。filer > VTune Pro を起動filer. これにより、適切な環境変数がすべて設定され、製品のスタンドアロン インターフェイスが起動します。
  2. GUI が開いたら、ようこそ画面で [NEW PROJECT] をクリックします。
  3. [プロジェクトの作成] ダイアログ ボックスで、プロジェクトの名前と場所を指定します。
  4. [プロジェクトの作成]をクリックします。

スタンドアロン (コマンドライン)

  • vtune コマンドを実行します。

ステップ 2: 分析の構成と実行
新しいプロジェクトを作成すると、[分析の構成] ウィンドウが開き、次のデフォルト値が表示されます。

intel-Get-Start-with-VTune-Profiler-07

  1. [アプリケーションの起動] セクションで、アプリケーションの場所を参照します。
  2. [開始] をクリックして、アプリケーションでパフォーマンス スナップショットを実行します。 この分析は、一般的なview ターゲット システムでのアプリケーションのパフォーマンスに影響を与える問題。

ステップ3: View およびパフォーマンス データの分析
データ収集が完了すると、VTune Profiler は、[概要] ウィンドウに分析結果を表示します。 ここで、パフォーマンスが見られますview アプリケーションの。
以上view 通常、いくつかの指標とその説明が含まれています。

intel-Get-Start-with-VTune-Profiler-08

  • A 要因に関する詳細情報については、各指標を展開してください。
  • B フラグが立てられたメトリックは、許容範囲/通常の動作範囲外の値を示します。 ツール ヒントを使用して、フラグが立てられたメトリックを改善する方法を理解します。
  • C 次に実行することを検討する必要があるその他の分析に関するガイダンスを参照してください。 分析ツリーでは、これらの推奨事項が強調表示されます。

次のステップ
パフォーマンス スナップショットは、VTune Pro でのアプリケーション パフォーマンスの全体的な評価を得るための良い出発点です。filer. 次に、アルゴリズムの調整が必要かどうかを確認します。

  1. チュートリアルに従って、一般的なパフォーマンスのボトルネックを分析します。
  2. アルゴリズムが適切に調整されたら、パフォーマンス スナップショットを再度実行して結果を調整し、他の領域での潜在的なパフォーマンスの改善を特定します。

参照
マイクロアーキテクチャの調査

VTune プロfiler ヘルプツアー

Example:プロfile Linux* 上の OpenMP アプリケーション
インテル VTune プロを使用するfileプロへのLinuxマシン上のrfile としてample iso3dfd_omp_offload Intel GPU にオフロードされた OpenMP アプリケーション。 GPU 解析を実行して結果を調べる方法を学びます。

前提条件

  • システムで Linux* OS カーネル 4.14 以降のバージョンが実行されていることを確認してください。
  • インテル プロセッサー グラフィックスの次のバージョンのいずれかを使用します。
    • 第8世代
    • 第9世代
    • 第11世代
  • システムは、次の Intel プロセッサのいずれかで実行されている必要があります。
    • 第 7 世代インテル® Core™ i7 プロセッサー (コードネーム Kaby Lake)
    • 第 8 世代インテル® Core™ i7 プロセッサー (コードネーム Coffee Lake)
    • 第 10 世代インテル® Core™ i7 プロセッサー (コードネーム Ice Lake)
  • Linux GUI の場合は、次を使用します。
    • GTK+ バージョン 2.10 以降 (2.18 以降のバージョンを推奨)
    • Pango バージョン 1.14 以降
    • X.Org バージョン 1.0 以降 (1.7 以降のバージョンを推奨)
  • インテル VTune プロをインストールするfiler 次のソースのいずれかから:
    • スタンドアロン製品のダウンロード
    • インテル® oneAPI ベース・ツールキット
    • インテル® システム・ブリングアップ・ツールキット
  • プロに必要なインテル® oneAPI DPC++/C++ コンパイラー (icx/icpx) を含むインテル® oneAPI HPC Toolkit をダウンロードします。file OpenMP アプリケーション。
  • 環境変数を設定します。 vars.sh スクリプトを実行します。
  • GPU 解析用にシステムをセットアップします。

OpenMP オフロード アプリケーションのビルドとコンパイル

  1. iso3dfd_omp_offload OpenMP Offload をダウンロードしますampル。
  2. sにオープンampルディレクトリ。
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. OpenMP オフロード アプリケーションをコンパイルします。

mkdir ビルド;
cmake -DVERIFY_RESULTS=0 ..
-j を作る

これにより、src/iso3dfd 実行可能ファイルが生成されます。

プログラムを削除するには、次のように入力します。
きれいにする

これにより、実行可能ファイルとオブジェクトが削除されます filemake コマンドで作成した s。

OpenMP オフロード アプリケーションで GPU 解析を実行する
これで、コンパイルした OpenMP アプリケーションで GPU オフロード分析を実行する準備が整いました。

  1. VTune プロを開くfiler をクリックし、[新しいプロジェクト] をクリックしてプロジェクトを作成します。
  2. ウェルカム ページで、[分析の構成] をクリックして分析を設定します。
  3. 分析用にこれらの設定を選択します。
    • [WHERE] ペインで、[ローカル ホスト] を選択します。
    • [WHAT] ペインで [Launch Application] を選択し、pro にするアプリケーションとして iso3dfd_omp_offload バイナリを指定します。file.
    • HOW ペインで、解析ツリーの Accelerators グループから GPU オフロード解析タイプを選択します。
      intel-Get-Start-with-VTune-Profiler-09
  4. [開始] ボタンをクリックして分析を実行します。

VTune プロfiler はデータを収集し、GPU オフロードで分析結果を表示します viewポイント。

  • [概要] ウィンドウで、CPU および GPU リソースの使用状況に関する統計を確認します。 このデータを使用して、アプリケーションが次のとおりかどうかを判断します。
    • GPUバウンド
    • CPUバウンド
    • システムのコンピューティング リソースを非効率的に利用する
  • プラットフォーム ウィンドウの情報を使用して、基本的な CPU および GPU メトリックを表示します。
  • グラフィックウィンドウで特定の計算タスクを調査します。

詳細な分析については、VTune Pro で関連するレシピを参照してください。filer パフォーマンス分析クックブック。 GPU コンピューティング/メディア ホットスポット分析でプロファイリングを続けることもできます。

Example:プロfile Linux* 上の SYCL* アプリケーション
VTune プロを使用するfiler とample matrix_multiply SYCL アプリケーションを使用して、GPU にバインドされたアプリケーション用に収集された製品と統計にすぐに慣れることができます。

前提条件

  • VTune プロをインストールするfiler およびインテル® oneAPI ベース ツールキットまたはインテル® システム ブリングアップ ツールキットからのインテル® oneAPI DPC++/C++ コンパイラー。
  • vars.sh スクリプトを実行して、環境変数をセットアップします。
  • GPU 解析用にシステムをセットアップします。

マトリックス アプリケーションを構築する
matrix_multiply_vtune コードをダウンロードします。ampIntel oneAPI ツールキット用のファイル パッケージ。 これには s が含まれます。ampビルドとプロに使用できるファイルfile SYCL アプリケーション。

プロへfile SYCL アプリケーションの場合、-gline-tables-only および -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler オプションを使用してコードをコンパイルしてください。

これをコンパイルするにはampアプリケーションで、次の手順を実行します。

  1. に移動しますampルディレクトリ。
    cd <sample_dir/VtuneProfiler/matrix_multiply>
  2. 乗算.cpp file src フォルダーには、行列乗算のいくつかのバージョンが含まれています。 Multiply.h の対応する #define MULTIPLY 行を編集して、バージョンを選択します。
  3. 既存の Make を使用してアプリをビルドするfile:
    .cmake 。
    作る
    これにより、matrix.icpx -fsycl 実行可能ファイルが生成されます。
    プログラムを削除するには、次のように入力します。
    きれいにする
    これにより、実行可能ファイルとオブジェクトが削除されます filemake コマンドによって作成された s。

GPU 解析の実行
Matrix で GPU 解析を実行するampル。

  1. VTune Pro を起動filer vtune-gui コマンドで。
  2. [ようこそ] ページから [新しいプロジェクト] をクリックします。
  3. の名前と場所を指定しますampプロジェクトを作成し、[プロジェクトの作成] をクリックします。
  4. WHAT ペインで、matrix.icpx-fsycl を参照します。 file.
  5. HOW ペインで、 intel-Get-Start-with-VTune-Profiler-06 [参照] ボタンをクリックし、解析ツリーのアクセラレータ グループから GPU コンピューティング/メディア ホットスポット解析を選択します。
    intel-Get-Start-with-VTune-Profiler-10
  6. 下部にある [開始] ボタンをクリックして、事前に選択されたオプションで分析を開始します。

コマンド ラインから GPU 解析を実行します。

  1. GPU 解析を実行するシステムを準備します。 GPU 解析用のシステムの設定を参照してください。
  2. インテル ソフトウェア ツールの環境変数を設定します。
    ソース $ONEAPI_ROOT/setvars.sh
  3. GPU コンピューティング/メディア ホットスポット分析を実行します。
    vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    概要レポートを表示するには、次のように入力します。
    vtune -レポートの概要 -r ./result_gpu-hotspots

VTune プロfiler データを収集し、解析結果を GPU コンピューティング/メディア ホットスポットに表示します view点。 [概要] ウィンドウで、CPU と GPU リソースの使用状況に関する統計を確認して、アプリケーションが GPU にバインドされているかどうかを確認します。 グラフィックウィンドウに切り替えて、経時的なコード実行を表す基本的な CPU および GPU メトリックを表示します。

インテル® VTune™ Pro を始めるfilemacOS* の場合

VTune プロを使用するfilemacOS システムで r を実行して、macOS 以外のシステム (Linux* または Android* のみ) でリモートターゲット分析を実行します。

VTune Pro は使用できませんfileこれらの目的のために macOS 環境で r:

  • プロfile インストールされている macOS システム。
  • リモート macOS システムでデータを収集します。

macOS ホストからリモートの Linux* または Android* ターゲットのパフォーマンスを分析するには、次のいずれかの手順を実行します。

  • VTune Pro を実行するfiler ターゲットとして指定されたリモート システムを使用した macOS システムでの分析。 解析が始まると、VTune Profiler はリモート システムに接続してデータを収集し、その結果を macOS ホストに戻します。 viewing。
  • ターゲット システムでローカルに分析を実行し、その結果を macOS システムにコピーして、 viewVTune Pro でfiler.

このドキュメントの手順では、リモートの Linux ターゲット システムを想定し、VTune Pro から SSH アクセスを使用してパフォーマンス データを収集します。filer macOS ホスト システム上。

始める前に

  1. インテル® VTune™ Pro をインストールするfilemacOS* システムでは r.
  2. シンボル情報を使用して Linux アプリケーションをビルドし、すべての最適化を有効にしてリリース モードでビルドします。 詳細については、VTune Pro のコンパイラ設定を参照してください。filer ヘルプ。
  3. ホスト macOS システムからターゲット Linux システムへの SSH アクセスをセットアップして、パスワードなしモードで動作するようにします。

ステップ 1: VTune プロを起動するfiler

  1. VTune Pro を起動filer vtune-gui コマンドで。
    デフォルトでは、 /opt/intel/oneapi/ です。
  2. GUI が開いたら、ようこそ画面で [NEW PROJECT] をクリックします。
  3. [プロジェクトの作成] ダイアログ ボックスで、プロジェクトの名前と場所を指定します。
  4. [プロジェクトの作成]をクリックします。

ステップ 2: 分析の構成と実行
新しいプロジェクトを作成すると、[分析の構成] ウィンドウが開き、パフォーマンス スナップショット分析タイプが表示されます。
この分析は、view ターゲット システムでのアプリケーションのパフォーマンスに影響を与える問題。

intel-Get-Start-with-VTune-Profiler-11

  1. WHERE ペインで、Remote Linux (SSH) を選択し、username@ hostname[:port] を使用してターゲット Linux システムを指定します。
    VTune プロfiler は Linux システムに接続し、ターゲット パッケージをインストールします。
  2. [WHAT] ペインで、ターゲット Linux システム上のアプリケーションへのパスを指定します。
  3. [開始] ボタンをクリックして、アプリケーションでパフォーマンス スナップショットを実行します。

ステップ3: View およびパフォーマンス データの分析
データ収集が完了すると、VTune Profiler は、分析結果を macOS システムに表示します。 [概要] ウィンドウで分析を開始します。 ここで、パフォーマンスが見られますview アプリケーションの。

以上view 通常、いくつかの指標とその説明が含まれています。

intel-Get-Start-with-VTune-Profiler-12

  • A 要因に関する詳細情報については、各指標を展開してください。
  • B フラグが立てられたメトリックは、許容範囲/通常の動作範囲外の値を示します。 ツール ヒントを使用して、フラグが立てられたメトリックを改善する方法を理解します。
  • C 次に実行することを検討する必要があるその他の分析に関するガイダンスを参照してください。 分析ツリーでは、これらの推奨事項が強調表示されます。

次のステップ
パフォーマンス スナップショットは、VTune Pro でのアプリケーション パフォーマンスの全体的な評価を得るための良い出発点です。filer.
次に、アルゴリズムの調整が必要かどうかを確認します。

  1. アプリケーションで Hotspots Analysis を実行します。
  2. ホットスポットのチュートリアルに従います。 ホットスポット分析を最大限に活用するためのテクニックを学びます。
  3. アルゴリズムが適切に調整されたら、パフォーマンス スナップショットを再度実行して結果を調整し、他の領域での潜在的なパフォーマンスの改善を特定します。

参照
マイクロアーキテクチャの調査

VTune プロfiler ヘルプツアー

もっと詳しく知る
ドキュメント / 説明

  • ユーザーガイド
    ユーザーガイドは VTune Pro の主要なドキュメントですfiler.
    注記
    VTune Pro のオフライン バージョンをダウンロードすることもできます。filerドキュメント。
  • オンライントレーニング
    オンライン トレーニング サイトは、VTune Pro の基本を学ぶための優れたリソースです。filer 入門ガイド、ビデオ、チュートリアル、 webinars、および技術記事。
  • 料理本
    VTune Pro の解析タイプを使用して一般的なパフォーマンスの問題を特定して解決するためのレシピを含むパフォーマンス解析クックブックfiler.
  • Windows のインストール ガイド | Linux | Linux | macOS ホスト
    インストール・ガイドには、VTune Pro の基本的なインストール手順が含まれています。filer およびさまざまなドライバーとコレクターのインストール後の構成手順。
  • チュートリアル
    VTune プロfiler チュートリアルでは、短い s を使用して基本的な機能について新しいユーザーをガイドしますampファイルアプリケーション。
  • リリースノート
    VTune Pro の最新バージョンに関する情報を検索するfile新しい機能、システム要件、および解決された技術的な問題の包括的な説明を含みます。
    VTune Pro のスタンドアロンおよびツールキット バージョンの場合filer、現在のシステム要件を理解してください。

通知と免責事項
インテルのテクノロジーでは、有効なハードウェア、ソフトウェア、またはサービスのアクティベーションが必要になる場合があります。
絶対に安全な製品やコンポーネントはありません。
費用と結果は異なる場合があります。
© インテル コーポレーション。 Intel、Intel ロゴ、およびその他の Intel マークは、Intel Corporation またはその子会社の商標です。 他の名前およびブランドは、他者の所有物であると主張される場合があります。
Intel、Intel ロゴ、Intel Atom、Intel Core、Intel Xeon Phi、VTune、および Xeon は、米国およびその他の国における Intel Corporation の商標です。
*その他の名称およびブランドは、一般に各社の所有物である場合があります。
Microsoft、Windows、および Windows ロゴは、米国およびその他の国における Microsoft Corporation の商標または登録商標です。
Javaは、Oracleおよび/またはその関連会社の登録商標です。
OpenCL および OpenCL ロゴは Apple Inc. の商標であり、Khronos の許可を得て使用されています。

インテルのテクノロジーでは、有効なハードウェア、ソフトウェア、またはサービスのアクティベーションが必要になる場合があります。
絶対に安全な製品やコンポーネントはありません。
費用と結果は異なる場合があります。
© インテル コーポレーション。 Intel、Intel ロゴ、およびその他の Intel マークは、Intel Corporation またはその子会社の商標です。 他の名前およびブランドは、他者の所有物であると主張される場合があります。
Intel、Intel ロゴ、Intel Atom、Intel Core、Intel Xeon Phi、VTune、および Xeon は、米国およびその他の国における Intel Corporation の商標です。
*その他の名称およびブランドは、一般に各社の所有物である場合があります。
Microsoft、Windows、および Windows ロゴは、米国およびその他の国における Microsoft Corporation の商標または登録商標です。
Javaは、Oracleおよび/またはその関連会社の登録商標です。
OpenCL および OpenCL ロゴは Apple Inc. の商標であり、Khronos の許可を得て使用されています。

ドキュメント / リソース

intel VTune Pro を使ってみるfiler [pdf] ユーザーガイド
VTune プロを使ってみるfiler, はじめに, VTune Pro でfiler、VTune プロfiler

参考文献

コメントを残す

あなたのメールアドレスは公開されません。 必須項目はマークされています *