intel Erste Schritte mit VTune Profiler
Erste Schritte mit Intel® VTune™ Profiler
Verwenden Sie Intel VTune Profiler zur Analyse lokaler und Remote-Zielsysteme von Windows*-, macOS*- und Linux*-Hosts. Verbessern Sie die Anwendungs- und Systemleistung durch diese Vorgänge:
- Analysieren Sie die Algorithmusauswahl.
- Finden Sie serielle und parallele Code-Engpässe.
- Verstehen Sie, wo und wie Ihre Anwendung von verfügbaren Hardwareressourcen profitieren kann.
- Beschleunigen Sie die Ausführung Ihrer Anwendung.
Intel VTune Pro herunterladenfiler auf Ihrem System auf eine der folgenden Arten: - Laden Sie die Standalone-Version herunter.
- Holen Sie sich Intel VTune Profiler als Teil des Intel® oneAPI Base Toolkit.
VTune Pro ansehenfiler Trainingsseite für Videos, webInars und weiteres Material, das Ihnen den Einstieg erleichtert.
NOTIZ
Dokumentation für Versionen von Intel® VTune™ Profiler vor der Version 2021 stehen nur zum Download zur Verfügung. Eine Liste der verfügbaren Dokumentationsdownloads nach Produktversion finden Sie auf diesen Seiten:
- Dokumentation für Intel Parallel Studio XE herunterladen
- Dokumentation für Intel System Studio herunterladen
Verstehen Sie den Arbeitsablauf
Verwenden Sie Intel VTune Profiler zu profile einer Anwendung und Analysieren der Ergebnisse zur Leistungsverbesserung.
Der allgemeine Arbeitsablauf umfasst die folgenden Schritte:
Wählen Sie Ihr Hostsystem aus, um loszulegen
Erfahren Sie mehr über systemspezifische Workflows für Windows*, Linux* oder macOS*.
Erste Schritte mit Intel® VTune™ Profiler für Windows* OS
Bevor Sie beginnen
- Installieren Sie Intel® VTune™ Profiler auf Ihrem Windows*-System.
- Erstellen Sie Ihre Anwendung mit Symbolinformationen und im Release-Modus mit allen aktivierten Optimierungen. Detaillierte Informationen zu den Compilereinstellungen finden Sie im VTune Profiler Online-Benutzerhandbuch.
Sie können auch die Matrix s verwendenample Anwendung verfügbar in \VTune\Samples\matrix. Sie können entsprechende s sehenample führt zu \VTune\Projekte\sampDatei (Matrix). - Richten Sie die Umgebungsvariablen ein: Führen Sie den \setvars.bat-Skript.
Standardmäßig ist die für oneAPI-Komponenten ist Program Files (x86)\Intel\oneAPI.
NOTIZ Sie müssen setvars.bat nicht ausführen, wenn Sie Intel® VTune™ Pro verwendenfiler innerhalb von Microsoft* Visual Studio*.
Schritt 1: Starten Sie Intel® VTune™ Profiler
Starten Sie Intel VTune Profiler über eine dieser Möglichkeiten und richten Sie ein Projekt ein. Ein Projekt ist ein Container für die Anwendung, die Sie analysieren möchten, den Analysetyp und die Ergebnisse der Datenerfassung.
Quelle / VTune Pro startenfiler
Standalone (GUI)
- Führen Sie den Befehl vtune-gui oder Intel® VTune™ Pro aus.filer aus dem Startmenü.
- Wenn die GUI geöffnet wird, klicken Sie auf den Willkommensbildschirm.
- Geben Sie im Dialogfeld „Projekt erstellen“ den Projektnamen und den Speicherort an.
- Klicken Sie auf „Projekt erstellen“.
Standalone (Befehlszeile)
Führen Sie den Befehl vtune aus.
Microsoft* Visual Studio* IDE
Öffnen Sie Ihre Lösung in Visual Studio. Der VTune ProfileDie Symbolleiste wird automatisch aktiviert und Ihr Visual Studio-Projekt als Analyseziel festgelegt.
NOTIZ
Sie müssen kein Projekt erstellen, wenn Sie Intel® VTune™ Pro ausführenfiler über die Befehlszeile oder innerhalb von Microsoft* Visual Studio.
Schritt 2: Konfigurieren und Ausführen der Analyse
Nach dem Erstellen eines neuen Projekts wird das Fenster „Analyse konfigurieren“ mit diesen Standardwerten geöffnet:
- Navigieren Sie im Abschnitt „Anwendung starten“ zum Speicherort der ausführbaren Datei Ihrer Anwendung. file.
- Klicken Sie auf „Start“, um den Performance Snapshot für Ihre Anwendung auszuführen. Diese Analyse bietet einen allgemeinen Überblickview von Problemen, die die Leistung Ihrer Anwendung auf dem Zielsystem beeinträchtigen.
Schritt 3: View und Leistungsdaten analysieren
Wenn die Datenerfassung abgeschlossen ist, VTune Profiler zeigt die Analyseergebnisse im Fenster Zusammenfassung an. Hier sehen Sie eine Leistung überview Ihrer Bewerbung.
Das Überview enthält normalerweise mehrere Metriken und deren Beschreibungen.
- A Erweitern Sie jede Metrik, um ausführliche Informationen zu den beitragenden Faktoren zu erhalten.
- B Eine markierte Metrik weist auf einen Wert außerhalb des akzeptablen/normalen Betriebsbereichs hin. Verwenden Sie QuickInfos, um zu erfahren, wie Sie eine markierte Metrik verbessern können.
- C Sehen Sie sich Anleitungen zu anderen Analysen an, die Sie als Nächstes ausführen sollten. Der Analysebaum hebt diese Empfehlungen hervor.
Nächste Schritte
Performance Snapshot ist ein guter Ausgangspunkt, um eine Gesamtbewertung der Anwendungsleistung mit VTune Pro zu erhaltenfiler. Überprüfen Sie als Nächstes, ob Ihr Algorithmus optimiert werden muss.
- Folgen Sie einem Tutorial, um häufige Leistungsengpässe zu analysieren.
- Sobald Ihr Algorithmus gut abgestimmt ist, führen Sie den Performance Snapshot erneut aus, um die Ergebnisse zu kalibrieren und potenzielle Leistungsverbesserungen in anderen Bereichen zu identifizieren.
Siehe auch
Mikroarchitektur-Erkundung
VTune Profiler Hilfe-Tour
Exampauf: Profile eine OpenMP*-Anwendung unter Windows*
Verwenden Sie Intel VTune Profiler auf einem Windows-Rechner zu profile alsample iso3dfd_omp_offload OpenMP-Anwendung auf eine Intel-GPU ausgelagert. Erfahren Sie, wie Sie eine GPU-Analyse ausführen und die Ergebnisse untersuchen.
Voraussetzungen
- Stellen Sie sicher, dass auf Ihrem System Microsoft* Windows 10 oder eine neuere Version ausgeführt wird.
- Verwenden Sie eine dieser Versionen der Intel-Prozessorgrafik:
- Generation 8
- Generation 9
- Generation 11
- Ihr System sollte auf einem dieser Intel-Prozessoren laufen:
- Intel® Core™ i7-Prozessoren der 7. Generation (Codename Kaby Lake)
- Intel® Core™ i8-Prozessoren der 7. Generation (Codename Coffee Lake)
- Intel® Core™ i10-Prozessoren der 7. Generation (Codename Ice Lake)
- Installieren Sie Intel VTune Profiler aus einer dieser Quellen:
- Standalone-Produkt-Download
- Intel® oneAPI Basis-Toolkit
- Intel® System Bring-up Toolkit
- Laden Sie das Intel® oneAPI HPC Toolkit herunter, das den Intel® oneAPI DPC++/C++ Compiler(icx/icpx) enthält, den Sie benötigen, umfile OpenMP-Anwendungen.
- Richten Sie Umgebungsvariablen ein. Führen Sie das Skript vars.bat aus, das sich im \env-Verzeichnis.
- Richten Sie Ihr System für die GPU-Analyse ein.
NOTIZ
So installieren Sie Intel VTune Profiler in der Microsoft* Visual Studio-Umgebung finden Sie im VTune Profiler Benutzerhandbuch.
Erstellen und Kompilieren der OpenMP-Offload-Anwendung
- Laden Sie die iso3dfd_omp_offload OpenMP Offload sample.
- Offen für die sample Verzeichnis.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Kompilieren Sie die OpenMP Offload-Anwendung.
mkdir-Build
CD-Build
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-Ziele:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Ausführen einer GPU-Analyse für die OpenMP-Offload-Anwendung
Jetzt können Sie die GPU-Offload-Analyse für die von Ihnen kompilierte OpenMP-Anwendung ausführen.
- Öffnen Sie VTune Profiler und klicken Sie auf Neues Projekt, um ein Projekt zu erstellen.
- Klicken Sie auf der Willkommensseite auf „Analyse konfigurieren“, um Ihre Analyse einzurichten.
- Wählen Sie diese Einstellungen für Ihre Analyse.
- Wählen Sie im Bereich „WHERE“ „Lokaler Host“ aus.
- Wählen Sie im Bereich „WAS“ die Option „Anwendung starten“ und geben Sie die Binärdatei iso3dfd_omp_offload als zu startende Anwendung an.file.
- Wählen Sie im Bereich „WIE“ den Analysetyp „GPU-Offload“ aus der Gruppe „Beschleuniger“ im Analysebaum aus.
- Klicken Sie auf die Schaltfläche „Start“, um die Analyse auszuführen.
VTune Profiler sammelt Daten und zeigt Analyseergebnisse im GPU Offload an viewPunkt.
- Im Übersichtsfenster werden Statistiken zur CPU- und GPU-Ressourcennutzung angezeigt. Verwenden Sie diese Daten, um zu bestimmen, ob Ihre Anwendung:
- GPU-gebunden
- CPU-gebunden
- Die Rechenressourcen Ihres Systems ineffizient nutzen
- Verwenden Sie die Informationen im Plattformfenster, um grundlegende CPU- und GPU-Metriken anzuzeigen.
- Untersuchen Sie spezifische Computeraufgaben im Grafikfenster.
Eine ausführlichere Analyse finden Sie in einem entsprechenden Rezept im VTune Profiler Performance Analysis Cookbook. Sie können Ihr Profiling auch mit der GPU Compute/Media Hotspots-Analyse fortsetzen.
Example: Profile eine SYCL*-Anwendung unter Windows*
Profile alsample matrix_multiply SYCL-Anwendung mit Intel® VTune™ Profiler. Machen Sie sich mit dem Produkt vertraut und verstehen Sie die für GPU-gebundene Anwendungen gesammelten Statistiken.
Voraussetzungen
- Stellen Sie sicher, dass Microsoft* Visual Studio (v2017 oder neuer) auf Ihrem System installiert ist.
- Installieren Sie Intel VTune Profiler vom Intel® oneAPI Base Toolkit oder dem Intel® System Bring-up Toolkit. Diese Toolkits enthalten den für den Profilierungsprozess erforderlichen Intel® oneAPI DPC++/C++ Compiler (icpx -fsycl).
- Richten Sie Umgebungsvariablen ein. Führen Sie das Skript vars.bat aus, das sich im \env-Verzeichnis.
- Stellen Sie sicher, dass der Intel oneAPI DPC++ Compiler (installiert mit dem Intel oneAPI Base Toolkit) in Microsoft Visual Studio integriert ist.
- Kompilieren Sie den Code mit den Optionen -gline-tables-only und -fdebug-info-for-profiling für den Intel oneAPI DPC++ Compiler.
- Richten Sie Ihr System für die GPU-Analyse ein.
Informationen zur Installation von Intel VTune Profiler in der Microsoft* Visual Studio-Umgebung, siehe VTune Profiler Benutzerhandbuch.
Erstellen Sie die Matrix-App
Laden Sie den matrix_multiply_vtune Code herunterampDateipaket für Intel oneAPI-Toolkits. Dieses enthält dieampDatei, die Sie zum Erstellen und Pro verwenden könnenfile eine SYCL-Anwendung.
- Öffnen Sie Microsoft* Visual Studio.
- Klicken File > Öffnen > Projekt/Lösung. Suchen Sie den Ordner matrix_multiply_vtune und wählen Sie matrix_multiply.sln aus.
- Erstellen Sie diese Konfiguration (Projekt > Erstellen).
- Führen Sie das Programm aus (Debuggen > Starten ohne Debuggen).
- Um eine DPC++- oder Thread-Version des s auszuwählenample, verwenden Sie Präprozessordefinitionen.
- Gehen Sie zu Projekteigenschaften > DPC++ > Präprozessor > Präprozessordefinition.
- Definieren Sie icpx -fsycl oder USE_THR.
GPU-Analyse ausführen
Führen Sie eine GPU-Analyse auf der Matrix s durchample.
- Klicken Sie in der Visual Studio-Symbolleiste auf die Schaltfläche „Analyse konfigurieren“.
Das Fenster „Analyse konfigurieren“ wird geöffnet. Standardmäßig übernimmt es Ihre VS-Projekteinstellungen und gibt matrix_multiply.exe als Anwendung an, diefile. - Klicken Sie im Fenster „Analyse konfigurieren“ auf das
Schaltfläche „Durchsuchen“ im Bereich „WIE“.
- Wählen Sie den Analysetyp „GPU Compute/Media Hotspots“ aus der Gruppe „Beschleuniger“ im Analysebaum.
- Klicken Sie auf die Schaltfläche „Start“, um die Analyse mit den vordefinierten Optionen zu starten.
Führen Sie die GPU-Analyse über die Befehlszeile aus:
- Öffnen Sie dieample Verzeichnis:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - Öffnen Sie in diesem Verzeichnis ein Visual Studio*-Projekt file mit dem Namen matrix_multiply.sln
- Die Datei multiply.cpp file enthält mehrere Versionen der Matrixmultiplikation. Wählen Sie eine Version aus, indem Sie die entsprechende Zeile #define MULTIPLY in multiply.hpp bearbeiten.
- Erstellen Sie das gesamte Projekt mit einer Release-Konfiguration.
Dadurch wird eine ausführbare Datei namens matrix_multiply.exe generiert. - Bereiten Sie das System für die Ausführung einer GPU-Analyse vor. Siehe Einrichten des Systems für die GPU-Analyse.
- VTune Pro einrichtenfiler Umgebungsvariablen durch Ausführen der Batch file: Export \env\vars.bat
- Führen Sie den Analysebefehl aus:
vtune.exe -gpu-offload sammeln — matrix_multiply.exe
VTune Profiler sammelt Daten und zeigt Analyseergebnisse in den GPU Compute/Media Hotspots an viewPunkt. Im Übersichtsfenster sehen Sie Statistiken zur CPU- und GPU-Ressourcennutzung, um zu erkennen, ob Ihre Anwendung GPU-gebunden ist. Wechseln Sie zum Grafikfenster, um grundlegende CPU- und GPU-Metriken anzuzeigen, die die Codeausführung im Zeitverlauf darstellen.
Erste Schritte mit Intel® VTune™ Profiler für Linux* OS
Bevor Sie beginnen
- Installieren Sie Intel® VTune™ Profiler auf Ihrem Linux*-System.
- Erstellen Sie Ihre Anwendung mit Symbolinformationen und im Release-Modus mit allen aktivierten Optimierungen. Detaillierte Informationen zu den Compilereinstellungen finden Sie im VTune Profiler Online-Benutzerhandbuch.
Sie können auch die Matrix s verwendenample Anwendung verfügbar in \SampSie können sehen sample führt zu \SampDatei (Matrix). - Richten Sie die Umgebungsvariablen ein: Quelle /setvars.sh
Standardmäßig ist die Ist:- $HOME/intel/oneapi/ bei Installation mit Benutzerberechtigungen;
- /opt/intel/oneapi/ bei Installation mit Root-Berechtigungen.
Schritt 1: Starten Sie VTune Profiler
Starten Sie VTune Profiler auf eine der folgenden Arten:
Quelle / VTune Pro startenfiler
Standalone/IDE (GUI)
- Führen Sie den Befehl vtunegui aus. So starten Sie VTune Profiler Wählen Sie in der Intel System Studio IDE Tools > VTune Profiler > VTune Pro startenfiler. Dadurch werden alle entsprechenden Umgebungsvariablen festgelegt und eine eigenständige Schnittstelle des Produkts gestartet.
- Wenn die GUI geöffnet wird, klicken Sie im Willkommensbildschirm auf NEUES PROJEKT.
- Geben Sie im Dialogfeld „Projekt erstellen“ den Projektnamen und den Speicherort an.
- Klicken Sie auf „Projekt erstellen“.
Standalone (Befehlszeile)
- Führen Sie den Befehl vtune aus.
Schritt 2: Konfigurieren und Ausführen der Analyse
Nach dem Erstellen eines neuen Projekts wird das Fenster „Analyse konfigurieren“ mit diesen Standardwerten geöffnet:
- Navigieren Sie im Abschnitt „Anwendung starten“ zum Speicherort Ihrer Anwendung.
- Klicken Sie auf „Start“, um den Performance Snapshot für Ihre Anwendung auszuführen. Diese Analyse bietet einen allgemeinen Überblickview von Problemen, die die Leistung Ihrer Anwendung auf dem Zielsystem beeinträchtigen.
Schritt 3: View und Leistungsdaten analysieren
Wenn die Datenerfassung abgeschlossen ist, VTune Profiler zeigt die Analyseergebnisse im Fenster Zusammenfassung an. Hier sehen Sie eine Leistung überview Ihrer Bewerbung.
Das Überview enthält normalerweise mehrere Metriken und deren Beschreibungen.
- A Erweitern Sie jede Metrik, um ausführliche Informationen zu den beitragenden Faktoren zu erhalten.
- B Eine markierte Metrik weist auf einen Wert außerhalb des akzeptablen/normalen Betriebsbereichs hin. Verwenden Sie QuickInfos, um zu erfahren, wie Sie eine markierte Metrik verbessern können.
- C Sehen Sie sich Anleitungen zu anderen Analysen an, die Sie als Nächstes ausführen sollten. Der Analysebaum hebt diese Empfehlungen hervor.
Nächste Schritte
Performance Snapshot ist ein guter Ausgangspunkt, um eine Gesamtbewertung der Anwendungsleistung mit VTune Pro zu erhaltenfiler. Überprüfen Sie als Nächstes, ob Ihr Algorithmus optimiert werden muss.
- Folgen Sie einem Tutorial, um häufige Leistungsengpässe zu analysieren.
- Sobald Ihr Algorithmus gut abgestimmt ist, führen Sie den Performance Snapshot erneut aus, um die Ergebnisse zu kalibrieren und potenzielle Leistungsverbesserungen in anderen Bereichen zu identifizieren.
Siehe auch
Mikroarchitektur-Erkundung
VTune Profiler Hilfe-Tour
Example: Profile eine OpenMP-Anwendung unter Linux*
Verwenden Sie Intel VTune Profiler auf einer Linux-Maschine zu profile alsample iso3dfd_omp_offload OpenMP-Anwendung auf eine Intel-GPU ausgelagert. Erfahren Sie, wie Sie eine GPU-Analyse ausführen und die Ergebnisse untersuchen.
Voraussetzungen
- Stellen Sie sicher, dass auf Ihrem System der Linux*-Betriebssystemkernel 4.14 oder eine neuere Version ausgeführt wird.
- Verwenden Sie eine dieser Versionen der Intel-Prozessorgrafik:
- Generation 8
- Generation 9
- Generation 11
- Ihr System sollte auf einem dieser Intel-Prozessoren laufen:
- Intel® Core™ i7-Prozessoren der 7. Generation (Codename Kaby Lake)
- Intel® Core™ i8-Prozessoren der 7. Generation (Codename Coffee Lake)
- Intel® Core™ i10-Prozessoren der 7. Generation (Codename Ice Lake)
- Verwenden Sie für die Linux-GUI:
- GTK+ Version 2.10 oder neuer (2.18 und neuere Versionen werden empfohlen)
- Pango Version 1.14 oder neuer
- X.Org Version 1.0 oder neuer (1.7 und neuere Versionen werden empfohlen)
- Installieren Sie Intel VTune Profiler aus einer dieser Quellen:
- Standalone-Produkt-Download
- Intel® oneAPI Basis-Toolkit
- Intel® System Bring-up Toolkit
- Laden Sie das Intel® oneAPI HPC Toolkit herunter, das den Intel® oneAPI DPC++/C++ Compiler(icx/icpx) enthält, den Sie benötigen, umfile OpenMP-Anwendungen.
- Richten Sie Umgebungsvariablen ein. Führen Sie das Skript vars.sh aus.
- Richten Sie Ihr System für die GPU-Analyse ein.
Erstellen und Kompilieren der OpenMP-Offload-Anwendung
- Laden Sie die iso3dfd_omp_offload OpenMP Offload sample.
- Offen für die sample Verzeichnis.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Kompilieren Sie die OpenMP Offload-Anwendung.
mkdir erstellen;
cmake -DVERIFY_RESULTS=0 ..
machen -j
Dadurch wird eine ausführbare Datei src/iso3dfd generiert.
Um das Programm zu löschen, geben Sie Folgendes ein:
sauber machen
Dadurch werden die ausführbare Datei und das Objekt entfernt. files, die Sie mit dem Befehl „make“ erstellt haben.
Ausführen einer GPU-Analyse für die OpenMP-Offload-Anwendung
Jetzt können Sie die GPU-Offload-Analyse für die von Ihnen kompilierte OpenMP-Anwendung ausführen.
- Öffnen Sie VTune Profiler und klicken Sie auf Neues Projekt, um ein Projekt zu erstellen.
- Klicken Sie auf der Willkommensseite auf „Analyse konfigurieren“, um Ihre Analyse einzurichten.
- Wählen Sie diese Einstellungen für Ihre Analyse.
- Wählen Sie im Bereich „WHERE“ „Lokaler Host“ aus.
- Wählen Sie im Bereich „WAS“ die Option „Anwendung starten“ und geben Sie die Binärdatei iso3dfd_omp_offload als zu startende Anwendung an.file.
- Wählen Sie im Bereich „WIE“ den Analysetyp „GPU-Offload“ aus der Gruppe „Beschleuniger“ im Analysebaum aus.
- Klicken Sie auf die Schaltfläche „Start“, um die Analyse auszuführen.
VTune Profiler sammelt Daten und zeigt Analyseergebnisse im GPU Offload an viewPunkt.
- Im Übersichtsfenster werden Statistiken zur CPU- und GPU-Ressourcennutzung angezeigt. Verwenden Sie diese Daten, um zu bestimmen, ob Ihre Anwendung:
- GPU-gebunden
- CPU-gebunden
- Die Rechenressourcen Ihres Systems ineffizient nutzen
- Verwenden Sie die Informationen im Plattformfenster, um grundlegende CPU- und GPU-Metriken anzuzeigen.
- Untersuchen Sie spezifische Computeraufgaben im Grafikfenster.
Eine ausführlichere Analyse finden Sie in einem entsprechenden Rezept im VTune Profiler Performance Analysis Cookbook. Sie können Ihr Profiling auch mit der GPU Compute/Media Hotspots-Analyse fortsetzen.
Example: Profile eine SYCL*-Anwendung unter Linux*
Verwenden Sie VTune Profiler mit alsampVerwenden Sie die SYCL-Anwendung „le matrix_multiply“, um sich schnell mit dem Produkt und den für GPU-gebundene Anwendungen erfassten Statistiken vertraut zu machen.
Voraussetzungen
- Installieren Sie VTune Profiler und Intel® oneAPI DPC++/C++ Compiler aus dem Intel® oneAPI Base Toolkit oder dem Intel® System Bring-up Toolkit.
- Richten Sie Umgebungsvariablen ein, indem Sie das Skript vars.sh ausführen.
- Richten Sie Ihr System für die GPU-Analyse ein.
Erstellen der Matrix-Anwendung
Laden Sie den matrix_multiply_vtune Code herunterampDateipaket für Intel oneAPI-Toolkits. Dieses enthält dieampDatei, die Sie zum Erstellen und Pro verwenden könnenfile eine SYCL-Anwendung.
Bis zum Profifile Stellen Sie bei einer SYCL-Anwendung sicher, dass Sie den Code mit den Intel oneAPI DPC++-Compileroptionen -gline-tables-only und -fdebug-info-for-profiling kompilieren.
Um dies zu kompilierenampGehen Sie zur Anwendung wie folgt vor:
- Geh zum sample Verzeichnis.
cd <sample_dir/VtuneProfiler/matrix_multiplizieren> - Die Datei multiply.cpp file im Ordner src sind mehrere Versionen der Matrixmultiplikation enthalten. Wählen Sie eine Version aus, indem Sie die entsprechende Zeile #define MULTIPLY in multiply.h bearbeiten.
- Erstellen Sie die App mit dem vorhandenen Makefile:
cmake.
machen
Dies sollte eine ausführbare Datei matrix.icpx -fsycl generieren.
Um das Programm zu löschen, geben Sie Folgendes ein:
sauber machen
Dadurch werden die ausführbare Datei und das Objekt entfernt. files, die durch den Befehl „make“ erstellt wurden.
GPU-Analyse ausführen
Führen Sie eine GPU-Analyse auf der Matrix s durchample.
- Starten Sie VTune Profiler mit dem Befehl vtune-gui.
- Klicken Sie auf der Willkommensseite auf „Neues Projekt“.
- Geben Sie einen Namen und einen Ort für Ihre sample-Projekt und klicken Sie auf Projekt erstellen.
- Navigieren Sie im Bereich „WAS“ zur Datei matrix.icpx-fsycl file.
- Klicken Sie im Bereich „WIE“ auf das
Klicken Sie auf die Schaltfläche „Durchsuchen“ und wählen Sie die Analyse „GPU Compute/Media Hotspots“ aus der Gruppe „Beschleuniger“ im Analysebaum aus.
- Klicken Sie unten auf die Schaltfläche „Start“, um die Analyse mit den vorausgewählten Optionen zu starten.
Führen Sie die GPU-Analyse über die Befehlszeile aus:
- Bereiten Sie das System für die Ausführung einer GPU-Analyse vor. Siehe Einrichten des Systems für die GPU-Analyse.
- Richten Sie Umgebungsvariablen für Intel-Softwaretools ein:
Quelle $ONEAPI_ROOT/setvars.sh - Führen Sie die GPU Compute/Media Hotspots-Analyse aus:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
Um den zusammenfassenden Bericht anzuzeigen, geben Sie Folgendes ein:
vtune -report summary -r ./result_gpu-hotspots
VTune Profiler sammelt Daten und zeigt Analyseergebnisse in den GPU Compute/Media Hotspots an viewPunkt. Im Übersichtsfenster sehen Sie Statistiken zur CPU- und GPU-Ressourcennutzung, um zu erkennen, ob Ihre Anwendung GPU-gebunden ist. Wechseln Sie zum Grafikfenster, um grundlegende CPU- und GPU-Metriken anzuzeigen, die die Codeausführung im Zeitverlauf darstellen.
Erste Schritte mit Intel® VTune™ Profiler für macOS*
Verwenden Sie VTune Profiler auf einem macOS-System, um eine Remote-Zielanalyse auf einem Nicht-macOS-System durchzuführen (nur Linux* oder Android*).
Sie können VTune Pro nicht verwendenfiler in einer macOS-Umgebung für diese Zwecke:
- Profile das macOS-System, auf dem es installiert ist.
- Sammeln Sie Daten auf einem Remote-MacOS-System.
Um die Leistung eines Remote-Linux*- oder Android*-Ziels vom macOS-Host aus zu analysieren, führen Sie einen der folgenden Schritte aus:
- Führen Sie VTune Pro ausfiler-Analyse auf dem macOS-System mit einem als Ziel angegebenen Remote-System. Wenn die Analyse beginnt,filer stellt eine Verbindung zum Remote-System her, um Daten zu sammeln, und überträgt die Ergebnisse dann zurück an den macOS-Host für viewing.
- Führen Sie eine Analyse lokal auf dem Zielsystem durch und kopieren Sie die Ergebnisse auf ein macOS-System für viewin VTune Profiler.
Die Schritte in diesem Dokument gehen von einem Remote-Linux-Zielsystem aus und erfassen Leistungsdaten mithilfe des SSH-Zugriffs von VTune Profiler auf einem macOS-Hostsystem.
Bevor Sie beginnen
- Installieren Sie Intel® VTune™ Profiler auf Ihrem macOS*-System.
- Erstellen Sie Ihre Linux-Anwendung mit Symbolinformationen und im Release-Modus mit allen aktivierten Optimierungen. Detaillierte Informationen finden Sie in den Compilereinstellungen im VTune Profiler Hilfe.
- Richten Sie den SSH-Zugriff vom macOS-Hostsystem auf das Linux-Zielsystem ein, um im passwortlosen Modus zu arbeiten.
Schritt 1: Starten Sie VTune Profiler
- Starten Sie VTune Profiler mit dem Befehl vtune-gui.
Standardmäßig ist die ist /opt/intel/oneapi/. - Wenn die GUI geöffnet wird, klicken Sie im Willkommensbildschirm auf NEUES PROJEKT.
- Geben Sie im Dialogfeld „Projekt erstellen“ den Projektnamen und den Speicherort an.
- Klicken Sie auf „Projekt erstellen“.
Schritt 2: Konfigurieren und Ausführen der Analyse
Nachdem Sie ein neues Projekt erstellt haben, wird das Fenster „Analyse konfigurieren“ mit dem Analysetyp „Leistungsschnappschuss“ geöffnet.
Diese Analyse stellt eineview von Problemen, die die Leistung Ihrer Anwendung auf dem Zielsystem beeinträchtigen.
- Wählen Sie im WHERE-Bereich „Remote Linux (SSH)“ aus und geben Sie das Ziel-Linux-System mit Benutzername@Hostname[:Port] an.
VTune Profiler stellt eine Verbindung zum Linux-System her und installiert das Zielpaket. - Geben Sie im Bereich „WAS“ den Pfad zu Ihrer Anwendung auf dem Linux-Zielsystem an.
- Klicken Sie auf die Schaltfläche „Start“, um Performance Snapshot für die Anwendung auszuführen.
Schritt 3: View und Leistungsdaten analysieren
Wenn die Datenerfassung abgeschlossen ist, VTune Profiler zeigt Analyseergebnisse auf dem macOS-System an. Starten Sie Ihre Analyse im Fenster Zusammenfassung. Hier sehen Sie eine Leistung überview Ihrer Bewerbung.
Das Überview enthält normalerweise mehrere Metriken und deren Beschreibungen.
- A Erweitern Sie jede Metrik, um ausführliche Informationen zu den beitragenden Faktoren zu erhalten.
- B Eine markierte Metrik weist auf einen Wert außerhalb des akzeptablen/normalen Betriebsbereichs hin. Verwenden Sie QuickInfos, um zu erfahren, wie Sie eine markierte Metrik verbessern können.
- C Sehen Sie sich Anleitungen zu anderen Analysen an, die Sie als Nächstes ausführen sollten. Der Analysebaum hebt diese Empfehlungen hervor.
Nächste Schritte
Performance Snapshot ist ein guter Ausgangspunkt, um eine Gesamtbewertung der Anwendungsleistung mit VTune Pro zu erhaltenfiler.
Überprüfen Sie als Nächstes, ob Ihr Algorithmus optimiert werden muss.
- Führen Sie eine Hotspot-Analyse für Ihre Anwendung durch.
- Folgen Sie einem Hotspots-Tutorial. Lernen Sie Techniken, um das Beste aus Ihrer Hotspots-Analyse herauszuholen.
- Sobald Ihr Algorithmus gut abgestimmt ist, führen Sie den Performance Snapshot erneut aus, um die Ergebnisse zu kalibrieren und potenzielle Leistungsverbesserungen in anderen Bereichen zu identifizieren.
Siehe auch
Mikroarchitektur-Erkundung
VTune Profiler Hilfe-Tour
Mehr erfahren
Dokumentbeschreibung
- Benutzerhandbuch
Das Benutzerhandbuch ist die Hauptdokumentation für VTune Profiler.
NOTIZ
Sie können auch eine Offline-Version von VTune Pro herunterladenfiler-Dokumentation. - Online Training
Die Online-Schulungsseite ist eine hervorragende Ressource, um die Grundlagen von VTune Pro zu erlernenfiler mit Erste-Schritte-Anleitungen, Videos, Tutorials, webinars und technische Artikel. - Kochbuch
Kochbuch zur Leistungsanalyse mit Rezepten zum Identifizieren und Lösen gängiger Leistungsprobleme mithilfe von Analysetypen in VTune Profiler. - Installationshandbuch für Windows | Linux | macOS-Hosts
Das Installationshandbuch enthält grundlegende Installationsanweisungen für VTune Profiler und Konfigurationsanweisungen nach der Installation für die verschiedenen Treiber und Collector. - Anleitungen
VTune Profiler Tutorials führen einen neuen Benutzer durch die grundlegenden Funktionen mit einem kurzen sample Anwendung. - Versionshinweise
Hier finden Sie Informationen zur neuesten Version von VTune Profiler, einschließlich einer umfassenden Beschreibung der neuen Funktionen, Systemanforderungen und behobenen technischen Probleme.
Für die Standalone- und Toolkit-Versionen von VTune Profiler, verstehen Sie die aktuellen Systemanforderungen.
Hinweise und Haftungsausschlüsse
Für Intel-Technologien ist möglicherweise eine aktivierte Hardware-, Software- oder Dienstaktivierung erforderlich.
Kein Produkt oder keine Komponente kann absolut sicher sein.
Ihre Kosten und Ergebnisse können variieren.
© Intel Corporation. Intel, das Intel-Logo und andere Intel-Marken sind Marken der Intel Corporation oder ihrer Tochtergesellschaften. Andere Namen und Marken können als Eigentum anderer beansprucht werden.
Intel, das Intel-Logo, Intel Atom, Intel Core, Intel Xeon Phi, VTune und Xeon sind Marken der Intel Corporation in den USA und/oder anderen Ländern.
*Andere Namen und Marken können Eigentum Dritter sein.
Microsoft, Windows und das Windows-Logo sind Marken oder eingetragene Marken der Microsoft Corporation in den Vereinigten Staaten und/oder anderen Ländern.
Java ist eine eingetragene Marke von Oracle und/oder seinen verbundenen Unternehmen.
OpenCL und das OpenCL-Logo sind Marken von Apple Inc. und werden mit Genehmigung von Khronos verwendet.
Für Intel-Technologien ist möglicherweise eine aktivierte Hardware-, Software- oder Dienstaktivierung erforderlich.
Kein Produkt oder keine Komponente kann absolut sicher sein.
Ihre Kosten und Ergebnisse können variieren.
© Intel Corporation. Intel, das Intel-Logo und andere Intel-Marken sind Marken der Intel Corporation oder ihrer Tochtergesellschaften. Andere Namen und Marken können als Eigentum anderer beansprucht werden.
Intel, das Intel-Logo, Intel Atom, Intel Core, Intel Xeon Phi, VTune und Xeon sind Marken der Intel Corporation in den USA und/oder anderen Ländern.
*Andere Namen und Marken können Eigentum Dritter sein.
Microsoft, Windows und das Windows-Logo sind Marken oder eingetragene Marken der Microsoft Corporation in den Vereinigten Staaten und/oder anderen Ländern.
Java ist eine eingetragene Marke von Oracle und/oder seinen verbundenen Unternehmen.
OpenCL und das OpenCL-Logo sind Marken von Apple Inc. und werden mit Genehmigung von Khronos verwendet.
Dokumente / Ressourcen
![]() |
intel Erste Schritte mit VTune Profiler [pdf] Benutzerhandbuch Erste Schritte mit VTune Profiler, Erste Schritte, mit VTune Profiler, VTune Profiler |