intel-Get-Started-mei-VTune-Profiler-logo

intel Te begjinnen mei VTune Profiler

Te begjinnen mei Intel® VTune™ Profiler

Brûk Intel VTune Profiler om lokale en op ôfstân doelsystemen te analysearjen fan Windows*, macOS*, en Linux* hosts. Ferbetterje applikaasje- en systeemprestaasjes troch dizze operaasjes:

  • Analysearje algoritme karren.
  • Fine serial en parallel koade bottlenecks.
  • Begryp wêr't en hoe't jo applikaasje profitearje kin fan beskikbere hardwareboarnen.
  • Fersnelle de útfiering fan jo applikaasje.
    Download Intel VTune Profiler op jo systeem fia ien fan dizze manieren:
  • Download de Standalone ferzje.
  • Krij Intel VTune Profiler as ûnderdiel fan de Intel® oneAPI Base Toolkit.
    Sjoch de VTune Profiler training side foar fideo's, webinars, en mear materiaal te helpen jo te begjinnen.

NOAT
Dokumintaasje foar ferzjes fan Intel® VTune™ Profiler foarôfgeand oan de 2021-release binne allinich beskikber foar download. Sjoch dizze siden foar in list mei beskikbere dokumintaasjedownloads per produktferzje:

  • Download dokumintaasje foar Intel Parallel Studio XE
  • Download dokumintaasje foar Intel System Studio

Begryp de Workflow
Brûk Intel VTune Profiler oan profile in applikaasje en analysearje resultaten foar prestaasjes ferbetterings.

De algemiene workflow befettet dizze stappen:

intel-Get-Started-mei-VTune-Profiler-01

Selektearje jo hostsysteem om te begjinnen
Learje mear oer systeemspesifike workflows foar Windows*, Linux*, of macOS*.

intel-Get-Started-mei-VTune-Profiler-02

Te begjinnen mei Intel® VTune™ Profiler foar Windows* OS

Foardat jo begjinne

  1. Ynstallearje Intel® VTune™ Profiler op jo Windows* systeem.
  2. Bou jo applikaasje mei symboalynformaasje en yn Release-modus mei alle optimalisaasjes ynskeakele. Foar detaillearre ynformaasje oer kompilerynstellingen, sjoch de VTune Profiler online brûkersgids.
    Jo kinne ek gebrûk meitsje fan de matrix sample applikaasje beskikber yn \VTune\Samples\matrix. Jo kinne sjen oerienkommende sampde resultaten yn \VTune\Projects\sample (matrix).
  3. Stel de omjouwingsfariabelen yn: Run de \setvars.bat skript.
    Standert is de foar oneAPI-komponinten is Program Files (x86)\Intel\oneAPI.
    NOAT Jo hoege net in run setvars.bat by it brûken fan Intel® VTune™ Profiler binnen Microsoft * Visual Studio *.

Stap 1: Start Intel® VTune™ Profiler
Start Intel VTune Profiler troch ien fan dizze manieren en opsetten fan in projekt. In projekt is in kontener foar de applikaasje dy't jo wolle analysearje, it type analyse en resultaten fan gegevenssammeling.

Boarne / Start VTune Profiler

Standalone (GUI)

  1. Rin it kommando vtune-gui út of rinne Intel® VTune™ Profiler út it Startmenu.
  2. As de GUI iepenet, klikje jo op it Wolkom skerm.
  3. Spesifisearje de projektnamme en lokaasje yn it dialoochfinster Project oanmeitsje.
  4. Klik Project oanmeitsje.

Standalone (opdrachtrigel)
Run it kommando vtune.

Microsoft* Visual Studio* IDE
Iepenje jo oplossing yn Visual Studio. De VTune Profiler arkbalke wurdt automatysk ynskeakele en jo Visual Studio projekt wurdt ynsteld as in analyze doel.

NOAT
Jo hoege gjin projekt oan te meitsjen as jo Intel® VTune™ Pro útfierefiler fan 'e kommandorigel of binnen Microsoft * Visual Studio.

Stap 2: Konfigurearje en útfiere Analyse
Nei it oanmeitsjen fan in nij projekt iepenet it finster Analysis konfigurearje mei dizze standertwearden:

intel-Get-Started-mei-VTune-Profiler-03

  1. Blêdzje yn 'e seksje Launch Applikaasje nei de lokaasje fan jo útfierbere applikaasje file.
  2. Klikje op Start om Performance Snapshot op jo applikaasje út te fieren. Dizze analyze presintearret in algemiene oerview fan problemen dy't de prestaasjes fan jo applikaasje op it doelsysteem beynfloedzje.

Stap 3: View en Analysearje Performance Data
As gegevenssammeling foltôge, VTune Profiler toant analyze resultaten yn de Gearfetting finster. Hjir sjogge jo in optreden foarbyview fan jo applikaasje.
De oerview omfettet typysk ferskate metriken tegearre mei har beskriuwingen.

intel-Get-Started-mei-VTune-Profiler-04

  • A Wreidzje elke metrik út foar detaillearre ynformaasje oer bydragende faktoaren.
  • B In markearre metrysk jout in wearde oan bûten akseptabel / normaal wurkbereik. Brûk arktips om te begripen hoe't jo in markearre metrik ferbetterje kinne.
  • C Sjoch begelieding oer oare analyzes dy't jo moatte beskôgje om folgjende te rinnen. De Analysis Tree markearret dizze oanbefellings.

Folgjende stappen
Performance Snapshot is in goed begjinpunt om in algemiene beoardieling te krijen fan applikaasjeprestaasjes mei VTune Profiler. Kontrolearje dan as jo algoritme tuning fereasket.

  1. Folgje in tutorial om mienskiplike knelpunten yn prestaasjes te analysearjen.
  2. Sadree't jo algoritme goed ôfstimd is, útfiere Performance Snapshot opnij om resultaten te kalibrearjen en potensjele prestaasjesferbetteringen op oare gebieten te identifisearjen.

Sjoch ek
Microarchitecture Exploration

VTune Profiler Help Tour

Example: Profile in OpenMP*-applikaasje op Windows*
Brûk Intel VTune Profiler op in Windows masine nei profile asample iso3dfd_omp_offload OpenMP-applikaasje ôfladen op in Intel GPU. Learje hoe't jo in GPU-analyse útfiere en resultaten ûndersykje.

Betingsten

  • Soargje derfoar dat jo systeem Microsoft* draait Windows 10 of in nijere ferzje.
  • Brûk ien fan dizze ferzjes fan Intel Processor Graphics:
    • Gen 8
    • Gen 9
    • Gen 11
  • Jo systeem moat rinne op ien fan dizze Intel-processors:
    • 7e generaasje Intel® Core™ i7 Prozessoren (koadenamme Kaby Lake)
    • 8e generaasje Intel® Core™ i7 Prozessoren (koadenamme Coffee Lake)
    • 10e generaasje Intel® Core™ i7 Prozessoren (koadenamme Ice Lake)
  • Ynstallearje Intel VTune Profiler út ien fan dizze boarnen:
    • Standalone produkt download
    • Intel® Oneapi Base Toolkit
    • Intel® System Bring-up Toolkit
  • Download de Intel® oneAPI HPC Toolkit dy't de Intel® oneAPI DPC++/C++-kompiler (icx/icpx) befettet dy't jo moatte profile OpenMP applikaasjes.
  • Omjouwingsfariabelen ynstelle. Utfiere de vars.bat skript leit yn de \env triemtafel.
  • Stel jo systeem yn foar GPU-analyze.

NOAT
Om Intel VTune Pro te ynstallearjenfiler yn 'e Microsoft * Visual Studio-omjouwing, sjoch de VTune Profiler Brûkersgids.

Bou en kompilearje de OpenMP Offload-applikaasje

  1. Download de iso3dfd_omp_offload OpenMP Offload sample.
  2. Iepenje foar de sample map.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. Kompilearje de OpenMP Offload-applikaasje.

mkdir bouwe
cd boud
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

Run in GPU-analyze op 'e OpenMP Offload-applikaasje
Jo binne no ree om de GPU Offload Analysis út te fieren op 'e OpenMP-applikaasje dy't jo kompilearre hawwe.

  1. Iepenje VTune Profiler en klikje op Nij projekt om in projekt te meitsjen.
  2. Klikje op 'e wolkomside op Analysis ynstelle om jo analyse yn te stellen.
  3. Selektearje dizze ynstellings foar jo analyse.
    • Selektearje yn it WHERE-paniel Lokale host.
    • Selektearje yn it WAT-paniel Launch Application en spesifisearje de binary iso3dfd_omp_offload as de applikaasje foar profile.
    • Selektearje yn it HOE-paniel it type GPU Offload-analyse fan 'e groep Accelerators yn' e Analysis Tree.
      intel-Get-Started-mei-VTune-Profiler-05
  4. Klikje op de Start knop om de analyze út te fieren.

VTune Profiler sammelet gegevens en toant analyse resultaten yn de GPU Offload viewpunt.

  • Sjoch yn it Gearfettingsfinster statistyk oer CPU- en GPU-boarnegebrûk. Brûk dizze gegevens om te bepalen as jo applikaasje is:
    • GPU-bûn
    • CPU-bûn
    • It brûken fan de berekkeningsboarnen fan jo systeem net effisjint
  • Brûk de ynformaasje yn it platfoarmfinster om basis CPU- en GPU-metriken te sjen.
  • Ûndersykje spesifike kompjûter taken yn de Grafiken finster.

Foar in djippere analyze, sjoch in relatearre resept yn 'e VTune Profiler Performance Analysis Cookbook. Jo kinne jo profilearring ek trochgean mei de GPU Compute / Media Hotspots-analyse.

Example: profile in SYCL*-applikaasje op Windows*
Profile asample matrix_multiply SYCL-applikaasje mei Intel® VTune™ Profiler. Wês bekend mei it produkt en begryp de statistiken sammele foar GPU-bûne applikaasjes.

Betingsten

  • Soargje derfoar dat jo Microsoft * Visual Studio (v2017 of nijer) hawwe ynstalleare op jo systeem.
  • Ynstallearje Intel VTune Profiler fan de Intel® oneAPI Base Toolkit of de Intel® System Bring-up Toolkit. Dizze toolkits befetsje de Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) kompilator dy't nedich is foar it profilearringsproses.
  • Omjouwingsfariabelen ynstelle. Utfiere de vars.bat skript leit yn de \env triemtafel.
  • Soargje derfoar dat de Intel oneAPI DPC++-kompiler (ynstalleare mei de Intel oneAPI Base-ark) is yntegreare yn Microsoft Visual Studio.
  • Kompilearje de koade mei de -gline-tables-only en -fdebug-info-for-profiling opsjes foar Intel oneAPI DPC++ Compiler.
  • Stel jo systeem yn foar GPU-analyze.

Foar ynformaasje oer it ynstallearjen fan Intel VTune Profiler yn 'e Microsoft * Visual Studio-omjouwing, sjoch VTune Profiler Brûkersgids.

Bou de Matrix-app
Download de matrix_multiply_vtune-koade sample pakket foar Intel oneAPI toolkits. Dit befettet de sample dy't jo kinne brûke om te bouwen en profile in SYCL applikaasje.

  1. Iepenje Microsoft* Visual Studio.
  2. Klikje File > Iepenje > Projekt/oplossing. Fyn de map matrix_multiply_vtune en selektearje matrix_multiply.sln.
  3. Bou dizze konfiguraasje (Projekt> Bouwe).
  4. Run it programma (Debug> Begjin sûnder debuggen).
  5. Om in DPC++ of threaded ferzje fan de s te kiezenample, brûke preprocessor definysjes.
    1. Gean nei Project Properties> DPC++> Preprocessor> Preprocessor Definition.
    2. Definiearje icpx -fsycl of USE_THR.

Run GPU Analysis
Run in GPU analyze op de Matrix sample.

  1. Fan de Visual Studio-arkbalke, klikje op de knop Analysis ynstelle.
    It finster Analyse konfigurearje iepenet. Standert erft it jo VS-projektynstellingen en spesifisearret de matrix_multiply.exe as in applikaasje foar profile.
  2. Klikje yn it finster Analysis konfigurearje op deintel-Get-Started-mei-VTune-Profiler-06 Blêdzje knop yn it HOE-paniel.
  3. Selektearje it analysetype GPU Compute / Media Hotspots út 'e Accelerators-groep yn' e Analysis Tree.
    intel-Get-Started-mei-VTune-Profiler-06
  4. Klikje op de knop Start om de analyse te starten mei de foarôf definieare opsjes.

GPU-analyze útfiere fan kommandorigel:

  1. Iepenje de sampde map:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. Iepenje yn dizze map in Visual Studio * -projekt file neamd matrix_multiply.sln
  3. De multiply.cpp file befettet ferskate ferzjes fan matrix fermannichfâldigjen. Selektearje in ferzje troch it bewurkjen fan de oerienkommende #define MULTIPLY line yn multiply.hpp
  4. Bou it hiele projekt mei in Release-konfiguraasje.
    Dit genereart in útfierber mei de namme matrix_multiply.exe.
  5. Tariede it systeem om in GPU-analyze út te fieren. Sjoch Systeem ynstelle foar GPU-analyze.
  6. Stel VTune Pro ynfiler omjouwingsfariabelen troch it útfieren fan de batch file: eksportearje \env\vars.bat
  7. Utfiere it analyze kommando:
    vtune.exe -collect gpu-offload - matrix_multiply.exe

VTune Profiler sammelet gegevens en toant analyse resultaten yn de GPU Compute / Media Hotspots viewpunt. Sjoch yn it finster Gearfetting statistiken oer CPU- en GPU-boarnegebrûk om te begripen as jo applikaasje GPU-bûn is. Wikselje nei it Graphics-finster om basis CPU- en GPU-metriken te sjen dy't de útfiering fan koade oer de tiid fertsjintwurdigje.

Te begjinnen mei Intel® VTune™ Profiler foar Linux* OS

Foardat jo begjinne

  1. Ynstallearje Intel® VTune™ Profiler op jo Linux * systeem.
  2. Bou jo applikaasje mei symboalynformaasje en yn Release-modus mei alle optimalisaasjes ynskeakele. Foar detaillearre ynformaasje oer kompilerynstellingen, sjoch de VTune Profiler online brûkersgids.
    Jo kinne ek gebrûk meitsje fan de matrix sample applikaasje beskikber yn \sample \ matrix. Jo kinne sjen sampde resultaten yn \sample (matrix).
  3. Stel de omjouwingsfariabelen yn: boarne /setvars.sh
    Standert is de is:
    • $HOME/intel/oneapi/ as ynstallearre mei brûkersrjochten;
    • /opt/intel/oneapi/ as ynstalleare mei root tagongsrjochten.

Stap 1: Start VTune Profiler
Start VTune Profiler troch ien fan dizze manieren:

Boarne / Start VTune Profiler
Standalone/IDE (GUI)

  1. Run it kommando vtunegui. Om VTune Pro te begjinnenfiler fan de Intel System Studio IDE, selektearje Tools> VTune Profiler > Launch VTune Profiler. Dit stelt alle passende omjouwingsfariabelen yn en lanseart in standalone ynterface fan it produkt.
  2. As de GUI iepenet, klikje jo op NIJE PROJEKT yn it Wolkom skerm.
  3. Spesifisearje de projektnamme en lokaasje yn it dialoochfinster Project oanmeitsje.
  4. Klik Project oanmeitsje.

Standalone (opdrachtrigel)

  • Run it kommando vtune.

Stap 2: Konfigurearje en útfiere Analyse
Nei it oanmeitsjen fan in nij projekt iepenet it finster Analysis konfigurearje mei dizze standertwearden:

intel-Get-Started-mei-VTune-Profiler-07

  1. Blêdzje yn 'e seksje Launch Applikaasje nei de lokaasje fan jo applikaasje.
  2. Klikje op Start om Performance Snapshot op jo applikaasje út te fieren. Dizze analyze presintearret in algemiene oerview fan problemen dy't de prestaasjes fan jo applikaasje op it doelsysteem beynfloedzje.

Stap 3: View en Analysearje Performance Data
As gegevenssammeling foltôge, VTune Profiler toant analyze resultaten yn de Gearfetting finster. Hjir sjogge jo in optreden foarbyview fan jo applikaasje.
De oerview omfettet typysk ferskate metriken tegearre mei har beskriuwingen.

intel-Get-Started-mei-VTune-Profiler-08

  • A Wreidzje elke metrik út foar detaillearre ynformaasje oer bydragende faktoaren.
  • B In markearre metrysk jout in wearde oan bûten akseptabel / normaal wurkbereik. Brûk arktips om te begripen hoe't jo in markearre metrik ferbetterje kinne.
  • C Sjoch begelieding oer oare analyzes dy't jo moatte beskôgje om folgjende te rinnen. De Analysis Tree markearret dizze oanbefellings.

Folgjende stappen
Performance Snapshot is in goed begjinpunt om in algemiene beoardieling te krijen fan applikaasjeprestaasjes mei VTune Profiler. Kontrolearje dan as jo algoritme tuning fereasket.

  1. Folgje in tutorial om mienskiplike knelpunten yn prestaasjes te analysearjen.
  2. Sadree't jo algoritme goed ôfstimd is, útfiere Performance Snapshot opnij om resultaten te kalibrearjen en potensjele prestaasjesferbetteringen op oare gebieten te identifisearjen.

Sjoch ek
Microarchitecture Exploration

VTune Profiler Help Tour

Example: profile in OpenMP-applikaasje op Linux *
Brûk Intel VTune Profiler op in Linux masine nei profile asample iso3dfd_omp_offload OpenMP-applikaasje ôfladen op in Intel GPU. Learje hoe't jo in GPU-analyse útfiere en resultaten ûndersykje.

Betingsten

  • Soargje derfoar dat jo systeem Linux * OS kernel 4.14 of in nijere ferzje draait.
  • Brûk ien fan dizze ferzjes fan Intel Processor Graphics:
    • Gen 8
    • Gen 9
    • Gen 11
  • Jo systeem moat rinne op ien fan dizze Intel-processors:
    • 7e generaasje Intel® Core™ i7 Prozessoren (koadenamme Kaby Lake)
    • 8e generaasje Intel® Core™ i7 Prozessoren (koadenamme Coffee Lake)
    • 10e generaasje Intel® Core™ i7 Prozessoren (koadenamme Ice Lake)
  • Foar de Linux GUI, brûk:
    • GTK+ ferzje 2.10 of nijer (2.18 en nijere ferzjes wurde oanrikkemandearre)
    • Pango ferzje 1.14 of nijer
    • X.Org ferzje 1.0 of nijer (1.7 en nijere ferzjes wurde oanrikkemandearre)
  • Ynstallearje Intel VTune Profiler út ien fan dizze boarnen:
    • Standalone produkt download
    • Intel® Oneapi Base Toolkit
    • Intel® System Bring-up Toolkit
  • Download de Intel® oneAPI HPC Toolkit dy't de Intel® oneAPI DPC++/C++-kompiler (icx/icpx) befettet dy't jo moatte profile OpenMP applikaasjes.
  • Omjouwingsfariabelen ynstelle. Fier it vars.sh-skript út.
  • Stel jo systeem yn foar GPU-analyze.

Bou en kompilearje de OpenMP Offload-applikaasje

  1. Download de iso3dfd_omp_offload OpenMP Offload sample.
  2. Iepenje foar de sample map.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. Kompilearje de OpenMP Offload-applikaasje.

mkdir build;
cmake -DVERIFY_RESULTS=0 ..
meitsje -j

Dit genereart in src/iso3dfd útfierber.

Om it programma te wiskjen, typ:
skjinmeitsje

Dit ferwideret de útfierbere en it objekt files dy't jo makke hawwe mei it kommando meitsje.

Run in GPU-analyze op 'e OpenMP Offload-applikaasje
Jo binne no ree om de GPU Offload Analysis út te fieren op 'e OpenMP-applikaasje dy't jo kompilearre hawwe.

  1. Iepenje VTune Profiler en klikje op Nij projekt om in projekt te meitsjen.
  2. Klikje op 'e wolkomside op Analysis ynstelle om jo analyse yn te stellen.
  3. Selektearje dizze ynstellings foar jo analyse.
    • Selektearje yn it WHERE-paniel Lokale host.
    • Selektearje yn it WAT-paniel Launch Application en spesifisearje de binary iso3dfd_omp_offload as de applikaasje foar profile.
    • Selektearje yn it HOE-paniel it type GPU Offload-analyse fan 'e groep Accelerators yn' e Analysis Tree.
      intel-Get-Started-mei-VTune-Profiler-09
  4. Klikje op de Start knop om de analyze út te fieren.

VTune Profiler sammelet gegevens en toant analyse resultaten yn de GPU Offload viewpunt.

  • Sjoch yn it Gearfettingsfinster statistyk oer CPU- en GPU-boarnegebrûk. Brûk dizze gegevens om te bepalen as jo applikaasje is:
    • GPU-bûn
    • CPU-bûn
    • It brûken fan de berekkeningsboarnen fan jo systeem net effisjint
  • Brûk de ynformaasje yn it platfoarmfinster om basis CPU- en GPU-metriken te sjen.
  • Ûndersykje spesifike kompjûter taken yn de Grafiken finster.

Foar in djippere analyze, sjoch in relatearre resept yn 'e VTune Profiler Performance Analysis Cookbook. Jo kinne jo profilearring ek trochgean mei de GPU Compute / Media Hotspots-analyse.

Example: profile in SYCL * Applikaasje op Linux *
Brûk VTune Profiler mei asample matrix_multiply SYCL-applikaasje om gau fertroud te wurden mei it produkt en statistiken sammele foar GPU-bûne applikaasjes.

Betingsten

  • Ynstallearje VTune Profiler en Intel® oneAPI DPC++/C++ Compiler út de Intel® oneAPI Base Toolkit of de Intel® System Bring-up Toolkit.
  • Stel omjouwingsfariabelen yn troch it vars.sh-skript út te fieren.
  • Stel jo systeem yn foar GPU-analyze.

Bou de Matrix-applikaasje
Download de matrix_multiply_vtune-koade sample pakket foar Intel oneAPI toolkits. Dit befettet de sample dy't jo kinne brûke om te bouwen en profile in SYCL applikaasje.

Oan profile in SYCL-applikaasje, soargje derfoar dat jo de koade kompilearje mei de -gline-tables-only en -fdebug-info-for-profiling Intel oneAPI DPC ++ Compiler opsjes.

Om dizze sample applikaasje, doch it folgjende:

  1. Gean nei de sample map.
    cd <sample_dir/VtuneProfiler/matrix_fermannichfâldigje>
  2. De multiply.cpp file yn de src map befettet ferskate ferzjes fan matrix fermannichfâldigjen. Selektearje in ferzje troch it bewurkjen fan de oerienkommende #define MULTIPLY line yn multiply.h.
  3. Bou de app mei de besteande Makefile:
    cmke.
    meitsje
    Dit moat in útfierbere matrix.icpx -fsycl generearje.
    Om it programma te wiskjen, typ:
    skjinmeitsje
    Dit ferwideret de útfierbere en it objekt files dy't makke binne troch it kommando make.

Run GPU Analysis
Run in GPU analyze op de Matrix sample.

  1. Starte VTune Profiler mei it kommando vtune-gui.
  2. Klik op Nij projekt fan 'e Wolkom side.
  3. Spesifisearje in namme en lokaasje foar jo sample projekt en klikje Project oanmeitsje.
  4. Blêdzje yn it WHAT-paniel nei de matrix.icpx-fsycl file.
  5. Klikje yn it HOE-paniel op de intel-Get-Started-mei-VTune-Profiler-06 Blêdzje knop en selektearje GPU Compute / Media Hotspots analyze út de Accelerators groep yn de Analysis Tree.
    intel-Get-Started-mei-VTune-Profiler-10
  6. Klikje op de Start knop ûnderoan om de analyse te starten mei de foarselekteare opsjes.

GPU-analyze útfiere fan kommandorigel:

  1. Tariede it systeem om in GPU-analyze út te fieren. Sjoch Systeem ynstelle foar GPU-analyze.
  2. Omjouwingsfariabelen ynstelle foar Intel-software-ark:
    boarne $ONEAPI_ROOT/setvars.sh
  3. Rinne de GPU Compute / Media Hotspots-analyze:
    vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    Om it gearfettingsrapport te sjen, typ:
    vtune -rapport gearfetting -r ./result_gpu-hotspots

VTune Profiler sammelet gegevens en toant analyse resultaten yn de GPU Compute / Media Hotspots viewpunt. Sjoch yn it finster Gearfetting statistiken oer CPU- en GPU-boarnegebrûk om te begripen as jo applikaasje GPU-bûn is. Wikselje nei it Graphics-finster om basis CPU- en GPU-metriken te sjen dy't de útfiering fan koade oer de tiid fertsjintwurdigje.

Te begjinnen mei Intel® VTune™ Profiler foar macOS*

Brûk VTune Profiler op in macOS-systeem om doelanalyse op ôfstân út te fieren op in net-macOS-systeem (allinich Linux* of Android*).

Jo kinne VTune Pro net brûkefiler yn in macOS-omjouwing foar dizze doelen:

  • Profile it macOS-systeem wêrop it is ynstalleare.
  • Sammelje gegevens op in macOS-systeem op ôfstân.

Om prestaasjes te analysearjen fan in Linux * of Android * doel op ôfstân fan 'e macOS-host, doch ien fan dizze stappen:

  • Run in VTune Profiler-analyse op it macOS-systeem mei in systeem op ôfstân spesifisearre as doel. As analyze begjint, VTune Profiler ferbynt mei it systeem op ôfstân om gegevens te sammeljen, bringt dan de resultaten werom nei de macOS-host foar viewing.
  • Utfiere in analyse op it doelsysteem lokaal en kopiearje de resultaten nei in macOS-systeem foar viewyn VTune Profiler.

De stappen yn dit dokumint geane oan fan in Linux-doelsysteem op ôfstân en sammelje prestaasjesgegevens mei SSH-tagong fan VTune Profiler op in macOS-hostsysteem.

Foardat jo begjinne

  1. Ynstallearje Intel® VTune™ Profiler op jo macOS*-systeem.
  2. Bou jo Linux-applikaasje mei symboalynformaasje en yn Release-modus mei alle optimalisaasjes ynskeakele. Foar detaillearre ynformaasje, sjoch de kompilerynstellingen yn 'e VTune Profiler help.
  3. Stel SSH-tagong yn fan it host-macOS-systeem nei it doel Linux-systeem om te wurkjen yn 'e wachtwurd-minder modus.

Stap 1: Start VTune Profiler

  1. Starte VTune Profiler mei it kommando vtune-gui.
    Standert is de is /opt/intel/oneapi/.
  2. As de GUI iepenet, klikje jo op NIJE PROJEKT yn it Wolkom skerm.
  3. Spesifisearje de projektnamme en lokaasje yn it dialoochfinster Project oanmeitsje.
  4. Klik Project oanmeitsje.

Stap 2: Konfigurearje en útfiere Analyse
Nei't jo in nij projekt oanmakke hawwe, iepenet it finster Analysis konfigurearje mei it analysetype Performance Snapshot.
Dizze analyze presintearret in oerview fan problemen dy't de prestaasjes fan jo applikaasje op it doelsysteem beynfloedzje.

intel-Get-Started-mei-VTune-Profiler-11

  1. Selektearje yn it WHERE-paniel Remote Linux (SSH) en spesifisearje it doel Linux-systeem mei brûkersnamme@ hostnamme[:port].
    VTune Profiler ferbynt mei it Linux-systeem en ynstallearret it doelpakket.
  2. Jou yn it WAT-paniel it paad nei jo applikaasje op it doel Linux-systeem.
  3. Klikje op de knop Start om Performance Snapshot út te fieren op 'e applikaasje.

Stap 3: View en Analysearje Performance Data
As gegevenssammeling foltôge, VTune Profiler toant analyseresultaten op it macOS-systeem. Begjin jo analyse yn it finster Gearfetting. Hjir sjogge jo in optreden foarbyview fan jo applikaasje.

De oerview omfettet typysk ferskate metriken tegearre mei har beskriuwingen.

intel-Get-Started-mei-VTune-Profiler-12

  • A Wreidzje elke metrik út foar detaillearre ynformaasje oer bydragende faktoaren.
  • B In markearre metrysk jout in wearde oan bûten akseptabel / normaal wurkbereik. Brûk arktips om te begripen hoe't jo in markearre metrik ferbetterje kinne.
  • C Sjoch begelieding oer oare analyzes dy't jo moatte beskôgje om folgjende te rinnen. De Analysis Tree markearret dizze oanbefellings.

Folgjende stappen
Performance Snapshot is in goed begjinpunt om in algemiene beoardieling te krijen fan applikaasjeprestaasjes mei VTune Profiler.
Kontrolearje dan as jo algoritme tuning fereasket.

  1. Run Hotspots Analysis op jo applikaasje.
  2. Folgje in Hotspots-tutorial. Learje techniken om it measte út jo Hotspots-analyse te heljen.
  3. Sadree't jo algoritme goed ôfstimd is, útfiere Performance Snapshot opnij om resultaten te kalibrearjen en potensjele prestaasjesferbetteringen op oare gebieten te identifisearjen.

Sjoch ek
Microarchitecture Exploration

VTune Profiler Help Tour

Learje mear
Dokumint / Beskriuwing

  • Brûkersgids
    De brûkersgids is de primêre dokumintaasje foar VTune Profiler.
    NOAT
    Jo kinne ek in offline ferzje fan 'e VTune Pro downloadefiler dokumintaasje.
  • Online training
    De online trainingsside is in poerbêste boarne om de basis fan VTune Pro te learenfiler mei Getting Started-gidsen, fideo's, tutorials, webinars, en technyske artikels.
  • Kookboek
    Kookboek foar prestaasjesanalyse dat resepten befettet om populêre prestaasjesproblemen te identifisearjen en op te lossen mei analysetypen yn VTune Profiler.
  • Ynstallaasjegids foar Windows | Linux | macOS-hosts
    De ynstallaasjegids befettet basisynstallaasjeynstruksjes foar VTune Profiler en post-ynstallaasje konfiguraasje ynstruksjes foar de ferskate bestjoerders en samlers.
  • Tutorials
    VTune Profiler tutorials liede in nije brûker troch basis funksjes mei in koarte sample applikaasje.
  • Release Notes
    Fyn ynformaasje oer de lêste ferzje fan VTune Profiler, ynklusyf in wiidweidige beskriuwing fan nije funksjes, systeem easken en technyske problemen dy't waarden oplost.
    Foar de standalone en toolkit ferzjes fan VTune Profiler, begripe de hjoeddeiske Systeem easken.

Meidielings en disclaimers
Intel-technologyen kinne aktivearring fan hardware, software of tsjinst fereaskje.
Gjin produkt of komponint kin absolút feilich wêze.
Jo kosten en resultaten kinne ferskille.
© Intel Corporation. Intel, it Intel-logo en oare Intel-merken binne hannelsmerken fan Intel Corporation of har dochterûndernimmingen. Oare nammen en merken kinne wurde opeaske as eigendom fan oaren.
Intel, it Intel-logo, Intel Atom, Intel Core, Intel Xeon Phi, VTune en Xeon binne hannelsmerken fan Intel Corporation yn 'e FS en/of oare lannen.
* Oare nammen en merken kinne wurde opeaske as eigendom fan oaren.
Microsoft, Windows, en it Windows-logo binne hannelsmerken, of registrearre hannelsmerken fan Microsoft Corporation yn 'e Feriene Steaten en/of oare lannen.
Java is in registrearre hannelsmerk fan Oracle en/of har filialen.
OpenCL en it OpenCL-logo binne hannelsmerken fan Apple Inc. brûkt mei tastimming fan Khronos.

Intel-technologyen kinne aktivearring fan hardware, software of tsjinst fereaskje.
Gjin produkt of komponint kin absolút feilich wêze.
Jo kosten en resultaten kinne ferskille.
© Intel Corporation. Intel, it Intel-logo en oare Intel-merken binne hannelsmerken fan Intel Corporation of har dochterûndernimmingen. Oare nammen en merken kinne wurde opeaske as eigendom fan oaren.
Intel, it Intel-logo, Intel Atom, Intel Core, Intel Xeon Phi, VTune en Xeon binne hannelsmerken fan Intel Corporation yn 'e FS en/of oare lannen.
* Oare nammen en merken kinne wurde opeaske as eigendom fan oaren.
Microsoft, Windows, en it Windows-logo binne hannelsmerken, of registrearre hannelsmerken fan Microsoft Corporation yn 'e Feriene Steaten en/of oare lannen.
Java is in registrearre hannelsmerk fan Oracle en/of har filialen.
OpenCL en it OpenCL-logo binne hannelsmerken fan Apple Inc. brûkt mei tastimming fan Khronos.

Dokuminten / Resources

intel Te begjinnen mei VTune Profiler [pdf] Brûkersgids
Te begjinnen mei VTune Profiler, Te begjinnen, mei VTune Profiler, VTune Profiler

Referinsjes

Lit in reaksje efter

Jo e-mailadres sil net publisearre wurde. Ferplichte fjilden binne markearre *