intel Kezdő lépések a VTune Pro használatávalfiler
Kezdje el az Intel® VTune™ Pro használatátfiler
Használja az Intel VTune Pro-tfiler helyi és távoli célrendszerek elemzéséhez Windows*, macOS* és Linux* gazdagépekről. Javítsa az alkalmazások és a rendszer teljesítményét az alábbi műveletekkel:
- Elemezze az algoritmus választásait.
- Keresse meg a soros és párhuzamos kód szűk keresztmetszeteit.
- Tudja meg, hogy az alkalmazás hol és hogyan profitálhat a rendelkezésre álló hardverforrásokból.
- Gyorsítsa fel az alkalmazás végrehajtását.
Töltse le az Intel VTune Pro-tfiler a rendszerén az alábbi módok egyikén: - Töltse le az önálló verziót.
- Szerezd meg az Intel VTune Pro-tfiler az Intel® oneAPI Base Toolkit részeként.
Lásd a VTune Pro-tfiler képzési oldal videókhoz, webinars, és további anyagok, amelyek segítenek az indulásban.
JEGYZET
Az Intel® VTune™ Pro verzióihoz tartozó dokumentációfiler a 2021-es kiadás előtt csak letölthető. A letölthető dokumentációk termékverziónkénti listáját az alábbi oldalakon találja:
- Töltse le az Intel Parallel Studio XE dokumentációját
- Töltse le az Intel System Studio dokumentációját
A munkafolyamat megértése
Használja az Intel VTune Pro-tfiler profinakfile egy alkalmazás, és elemezheti az eredményeket a teljesítmény javítása érdekében.
Az általános munkafolyamat a következő lépéseket tartalmazza:
A kezdéshez válassza ki a gazdagépet
További információ a Windows*, Linux* vagy macOS* rendszerspecifikus munkafolyamatairól.
Kezdje el az Intel® VTune™ Pro használatátfiler Windows* operációs rendszerhez
Mielőtt elkezdené
- Telepítse az Intel® VTune™ Pro-tfiler a Windows* rendszeren.
- Építse fel alkalmazását szimbóluminformációkkal és Release módban, minden optimalizálással. A fordító beállításaival kapcsolatos részletes információkért lásd a VTune Pro-tfiler online használati útmutató.
Használhatja az s mátrixot isampAz alkalmazás elérhető itt \VTune\Samples\mátrix. Láthatja a megfelelő sample eredményezi \VTune\Projects\sample (mátrix). - Állítsa be a környezeti változókat: Futtassa a \setvars.bat szkript.
Alapértelmezés szerint a a oneAPI összetevők esetében a Program Files (x86)\Intel\oneAPI.
JEGYZET Intel® VTune™ Pro használatakor nem kell futtatnia a setvars.bat fájltfiler a Microsoft* Visual Studio*-on belül.
1. lépés: Indítsa el az Intel® VTune™ Pro-tfiler
Indítsa el az Intel VTune Pro-tfiler ezen módszerek egyikén, és állítson be egy projektet. A projekt egy tároló az elemezni kívánt alkalmazáshoz, az elemzés típusához és az adatgyűjtési eredményekhez.
Forrás / VTune Pro indításafiler
Önálló (GUI)
- Futtassa a vtune-gui parancsot, vagy futtassa az Intel® VTune™ Pro-tfiler a Start menüből.
- Amikor megnyílik a grafikus felület, kattintson az üdvözlőképernyőn.
- A Projekt létrehozása párbeszédpanelen adja meg a projekt nevét és helyét.
- Kattintson a Projekt létrehozása elemre.
Önálló (parancssor)
Futtassa a vtune parancsot.
Microsoft* Visual Studio* IDE
Nyissa meg a megoldást a Visual Studióban. A VTune Profiler eszköztár automatikusan engedélyezve van, és a Visual Studio projekt elemzési célként van beállítva.
JEGYZET
Az Intel® VTune™ Pro futtatásakor nem kell projektet létrehozniafiler parancssorból vagy a Microsoft* Visual Studio programból.
2. lépés: Az elemzés konfigurálása és futtatása
Új projekt létrehozása után megnyílik az Elemzés konfigurálása ablak a következő alapértelmezett értékekkel:
- Az Alkalmazás indítása részben tallózással keresse meg az alkalmazás futtatható fájljának helyét file.
- Kattintson a Start gombra a Performance Snapshot futtatásához az alkalmazáson. Ez az elemzés egy általános áttekintést mutat beview az alkalmazás teljesítményét a célrendszeren befolyásoló problémákról.
3. lépés: View és a teljesítményadatok elemzése
Amikor az adatgyűjtés befejeződött, a VTune Profiler megjeleníti az elemzés eredményeit az Összegzés ablakban. Itt látható egy előadás végeview az alkalmazásod.
A végeview jellemzően több mérőszámot is tartalmaz a leírásukkal együtt.
- A Bontsa ki az egyes mutatókat a hozzájáruló tényezőkről szóló részletes információkért.
- B A megjelölt mérőszám az elfogadható/normál működési tartományon kívül eső értéket jelez. Használja az eszköztippeket a megjelölt mutató javításának megértéséhez.
- C Tekintse meg a további elemzésekre vonatkozó útmutatást. Az elemzési fa kiemeli ezeket az ajánlásokat.
Következő lépések
A Performance Snapshot jó kiindulópont az alkalmazások teljesítményének átfogó értékeléséhez a VTune Pro segítségévelfiler. Ezután ellenőrizze, hogy az algoritmus igényel-e hangolást.
- Kövesse az oktatóanyagot a teljesítmény általános szűk keresztmetszete elemzéséhez.
- Ha az algoritmus jól be van hangolva, futtassa újra a Performance Snapshot alkalmazást az eredmények kalibrálásához és a lehetséges teljesítményjavítások azonosításához más területeken.
Lásd még
Mikroarchitektúra feltárása
VTune Profiler Help Tour
Example: Profile OpenMP* alkalmazás Windowson*
Használja az Intel VTune Pro-tfiler Windows gépen profile mintample iso3dfd_omp_offload OpenMP alkalmazás letöltve egy Intel GPU-ra. Tanulja meg a GPU-elemzés futtatását és az eredmények vizsgálatát.
Előfeltételek
- Győződjön meg arról, hogy a rendszeren Microsoft* Windows 10 vagy újabb verzió fut.
- Használja az Intel Processor Graphics alábbi verzióinak egyikét:
- Gen 8
- Gen 9
- Gen 11
- A rendszernek az alábbi Intel processzorok egyikén kell futnia:
- 7. generációs Intel® Core™ i7 processzorok (kódnév: Kaby Lake)
- 8. generációs Intel® Core™ i7 processzorok (kódnév: Coffee Lake)
- 10. generációs Intel® Core™ i7 processzorok (kódnév: Ice Lake)
- Telepítse az Intel VTune Pro-tfiler az alábbi források egyikéből:
- Önálló termék letöltés
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Töltse le az Intel® oneAPI HPC Toolkit-et, amely tartalmazza az Intel® oneAPI DPC++/C++ fordítót (icx/icpx), amelyre szüksége vanfile OpenMP alkalmazások.
- Állítsa be a környezeti változókat. Futtassa a vars.bat parancsfájlt, amely a \env könyvtárat.
- Állítsa be a rendszert a GPU elemzéshez.
JEGYZET
Az Intel VTune Pro telepítéséhezfiler Microsoft* Visual Studio környezetben, lásd a VTune Pro-tfiler Felhasználói kézikönyv.
Készítse el és fordítsa le az OpenMP Offload alkalmazást
- Töltse le az iso3dfd_omp_offload OpenMP Offload sample.
- Nyitva a sample könyvtárat.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Fordítsa le az OpenMP Offload alkalmazást.
mkdir build
cd build
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Futtasson egy GPU-elemzést az OpenMP Offload alkalmazáson
Most készen áll a GPU tehermentesítési elemzésének futtatására az Ön által lefordított OpenMP alkalmazáson.
- Nyissa meg a VTune Pro-tfiler és kattintson az Új projekt elemre egy projekt létrehozásához.
- Az üdvözlő oldalon kattintson az Elemzés konfigurálása elemre az elemzés beállításához.
- Válassza ki ezeket a beállításokat az elemzéshez.
- A WHERE panelen válassza a Helyi gazdagép lehetőséget.
- A MIT ablakban válassza az Alkalmazás indítása lehetőséget, és adja meg az iso3dfd_omp_offload bináris fájlt a pro alkalmazásának.file.
- A HOGYAN panelen válassza ki a GPU tehermentesítés elemzési típusát az elemzési fa Gyorsítók csoportjából.
- Kattintson a Start gombra az elemzés futtatásához.
VTune Profiler adatokat gyűjt és elemzési eredményeket jelenít meg a GPU-letöltésben viewpont.
- Az Összegzés ablakban tekintse meg a CPU- és GPU-erőforrás-használati statisztikákat. Használja ezeket az adatokat annak meghatározására, hogy az Ön alkalmazása:
- GPU kötött
- CPU-hoz kötött
- A rendszer számítási erőforrásainak nem hatékony kihasználása
- Használja a Platform ablakban található információkat az alapvető CPU- és GPU-metrikák megtekintéséhez.
- Vizsgáljon meg konkrét számítási feladatokat a Grafika ablakban.
A mélyebb elemzéshez lásd a VTune Pro kapcsolódó receptjétfiler Teljesítményelemző szakácskönyv. A profilalkotást a GPU Compute/Media Hotspots elemzésével is folytathatja.
Example: Profile SYCL* alkalmazás Windowson*
Profile mintample matrix_multiply SYCL alkalmazás Intel® VTune™ Pro-valfiler. Ismerkedjen meg a termékkel, és ismerje meg a GPU-hoz kötött alkalmazásokhoz gyűjtött statisztikákat.
Előfeltételek
- Győződjön meg arról, hogy a Microsoft* Visual Studio (v2017 vagy újabb) telepítve van a rendszeren.
- Telepítse az Intel VTune Pro-tfiler az Intel® oneAPI Base Toolkitből vagy az Intel® System Bring-up Toolkitből. Ezek az eszközkészletek a profilalkotási folyamathoz szükséges Intel® oneAPI DPC++/C++ Compiler (icpx -fsycl) fordítót tartalmazzák.
- Állítsa be a környezeti változókat. Futtassa a vars.bat parancsfájlt, amely a \env könyvtárat.
- Győződjön meg arról, hogy az Intel oneAPI DPC++ fordító (az Intel oneAPI Base eszközkészlettel együtt) integrálva van a Microsoft Visual Studio programba.
- Fordítsa le a kódot az Intel oneAPI DPC++ Compiler -gline-tables-only és -fdebug-info-for-profiling opcióival.
- Állítsa be a rendszert a GPU elemzéshez.
Az Intel VTune Pro telepítésével kapcsolatos információkértfiler Microsoft* Visual Studio környezetben, lásd: VTune Profiler Felhasználói kézikönyv.
Építsd meg a Matrix alkalmazást
Töltse le a matrix_multiply_vtune kódot sampcsomag Intel oneAPI eszközkészletekhez. Ez tartalmazza az sample amely segítségével építhet és profile egy SYCL alkalmazás.
- Nyissa meg a Microsoft* Visual Studio-t.
- Kattintson File > Megnyitás > Projekt/Megoldás. Keresse meg a matrix_multiply_vtune mappát, és válassza a matrix_multiply.sln lehetőséget.
- Építse fel ezt a konfigurációt (Projekt > Építés).
- Futtassa a programot (Debug > Start Without Debugging).
- Az s DPC++ vagy menetes verziójának kiválasztásáhozample, használjon előfeldolgozó definíciókat.
- Nyissa meg a Projekt tulajdonságai > DPC++ > Előfeldolgozó > Előfeldolgozó meghatározása menüpontot.
- Határozza meg az icpx -fsycl vagy USE_THR paramétert.
Futtassa a GPU-elemzést
Futtasson egy GPU elemzést a Matrix s-enample.
- A Visual Studio eszköztárán kattintson az Elemzés konfigurálása gombra.
Megnyílik az Elemzés konfigurálása ablak. Alapértelmezés szerint örökli a VS projekt beállításait, és a matrix_multiply.exe fájlt adja meg alkalmazásként a pro számára.file. - Az Elemzés konfigurálása ablakban kattintson a
Tallózás gomb a HOGYAN panelen.
- Válassza ki a GPU számítási/médiahotspotok elemzési típusát az elemzési fa Gyorsítók csoportjából.
- Kattintson a Start gombra az elemzés elindításához az előre meghatározott beállításokkal.
Futtassa a GPU-elemzést a parancssorból:
- Nyissa ki az sample könyvtár:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - Ebben a könyvtárban nyisson meg egy Visual Studio* projektet file matrix_multiply.sln
- A multiply.cpp file a mátrixszorzás több változatát tartalmazza. Válasszon ki egy verziót a multiply.hpp megfelelő #define MULTIPLY sorának szerkesztésével
- Építse fel a teljes projektet egy kiadási konfigurációval.
Ez létrehoz egy matrix_multiply.exe nevű végrehajtható fájlt. - Készítse fel a rendszert a GPU elemzés futtatására. Lásd: Rendszer beállítása GPU-elemzéshez.
- Állítsa be a VTune Pro-tfiler környezeti változókat a köteg futtatásával file: export \env\vars.bat
- Futtassa az elemzés parancsot:
vtune.exe -collect gpu-offload – matrix_multiply.exe
VTune Profiler adatokat gyűjt és elemzési eredményeket jelenít meg a GPU Compute/Media Hotspotokban viewpont. Az Összegzés ablakban tekintse meg a CPU- és GPU-erőforrás-használati statisztikákat, hogy megértse, hogy az alkalmazás GPU-hoz kötött-e. Váltson a Grafika ablakra, hogy megtekinthesse a kódvégrehajtást az idő múlásával jellemező alapvető CPU- és GPU-metrikákat.
Kezdje el az Intel® VTune™ Pro használatátfiler Linux* operációs rendszerhez
Mielőtt elkezdené
- Telepítse az Intel® VTune™ Pro-tfiler a Linux* rendszeren.
- Építse fel alkalmazását szimbóluminformációkkal és Release módban, minden optimalizálással. A fordító beállításaival kapcsolatos részletes információkért lásd a VTune Pro-tfiler online használati útmutató.
Használhatja az s mátrixot isampAz alkalmazás elérhető itt \sample\mátrix. Láthatod sample eredményezi \sample (mátrix). - Állítsa be a környezeti változókat: forrás /setvars.sh
Alapértelmezés szerint a ez:- $HOME/intel/oneapi/ felhasználói engedélyekkel telepítve;
- /opt/intel/oneapi/ root jogosultságokkal telepítve.
1. lépés: Indítsa el a VTune Pro-tfiler
Indítsa el a VTune Pro-tfiler az alábbi módok egyikén:
Forrás / VTune Pro indításafiler
Önálló/IDE (GUI)
- Futtassa a vtunegui parancsot. A VTune Pro elindításáhozfiler az Intel System Studio IDE-ben válassza az Eszközök > VTune Pro lehetőségetfiler > Indítsa el a VTune Pro programotfiler. Ezzel beállítja az összes megfelelő környezeti változót, és elindítja a termék önálló felületét.
- Amikor megnyílik a grafikus felület, kattintson az ÚJ PROJEKT lehetőségre az üdvözlőképernyőn.
- A Projekt létrehozása párbeszédpanelen adja meg a projekt nevét és helyét.
- Kattintson a Projekt létrehozása elemre.
Önálló (parancssor)
- Futtassa a vtune parancsot.
2. lépés: Az elemzés konfigurálása és futtatása
Új projekt létrehozása után megnyílik az Elemzés konfigurálása ablak a következő alapértelmezett értékekkel:
- Az Alkalmazás indítása részben tallózással keresse meg az alkalmazás helyét.
- Kattintson a Start gombra a Performance Snapshot futtatásához az alkalmazáson. Ez az elemzés egy általános áttekintést mutat beview az alkalmazás teljesítményét a célrendszeren befolyásoló problémákról.
3. lépés: View és a teljesítményadatok elemzése
Amikor az adatgyűjtés befejeződött, a VTune Profiler megjeleníti az elemzés eredményeit az Összegzés ablakban. Itt látható egy előadás végeview az alkalmazásod.
A végeview jellemzően több mérőszámot is tartalmaz a leírásukkal együtt.
- A Bontsa ki az egyes mutatókat a hozzájáruló tényezőkről szóló részletes információkért.
- B A megjelölt mérőszám az elfogadható/normál működési tartományon kívül eső értéket jelez. Használja az eszköztippeket a megjelölt mutató javításának megértéséhez.
- C Tekintse meg a további elemzésekre vonatkozó útmutatást. Az elemzési fa kiemeli ezeket az ajánlásokat.
Következő lépések
A Performance Snapshot jó kiindulópont az alkalmazások teljesítményének átfogó értékeléséhez a VTune Pro segítségévelfiler. Ezután ellenőrizze, hogy az algoritmus igényel-e hangolást.
- Kövesse az oktatóanyagot a teljesítmény általános szűk keresztmetszete elemzéséhez.
- Ha az algoritmus jól be van hangolva, futtassa újra a Performance Snapshot alkalmazást az eredmények kalibrálásához és a lehetséges teljesítményjavítások azonosításához más területeken.
Lásd még
Mikroarchitektúra feltárása
VTune Profiler Help Tour
Example: Profile OpenMP alkalmazás Linuxon*
Használja az Intel VTune Pro-tfiler egy Linux gépen a profile mintample iso3dfd_omp_offload OpenMP alkalmazás letöltve egy Intel GPU-ra. Tanulja meg a GPU-elemzés futtatását és az eredmények vizsgálatát.
Előfeltételek
- Győződjön meg arról, hogy a rendszeren Linux* OS kernel 4.14 vagy újabb verzió fut.
- Használja az Intel Processor Graphics alábbi verzióinak egyikét:
- Gen 8
- Gen 9
- Gen 11
- A rendszernek az alábbi Intel processzorok egyikén kell futnia:
- 7. generációs Intel® Core™ i7 processzorok (kódnév: Kaby Lake)
- 8. generációs Intel® Core™ i7 processzorok (kódnév: Coffee Lake)
- 10. generációs Intel® Core™ i7 processzorok (kódnév: Ice Lake)
- Linux grafikus felhasználói felülethez használja:
- GTK+ 2.10 vagy újabb verzió (2.18 és újabb verziók ajánlottak)
- Pango 1.14 vagy újabb verzió
- X.Org 1.0 vagy újabb verzió (1.7 és újabb verziók ajánlottak)
- Telepítse az Intel VTune Pro-tfiler az alábbi források egyikéből:
- Önálló termék letöltés
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Töltse le az Intel® oneAPI HPC Toolkit-et, amely tartalmazza az Intel® oneAPI DPC++/C++ fordítót (icx/icpx), amelyre szüksége vanfile OpenMP alkalmazások.
- Állítsa be a környezeti változókat. Futtassa a vars.sh szkriptet.
- Állítsa be a rendszert a GPU elemzéshez.
Készítse el és fordítsa le az OpenMP Offload alkalmazást
- Töltse le az iso3dfd_omp_offload OpenMP Offload sample.
- Nyitva a sample könyvtárat.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Fordítsa le az OpenMP Offload alkalmazást.
mkdir build;
cmake -DVERIFY_RESULTS=0 ..
készít -j
Ez létrehoz egy src/iso3dfd végrehajtható fájlt.
A program törléséhez írja be:
tisztává tenni
Ez eltávolítja a végrehajtható fájlt és az objektumot files amelyet a make paranccsal hozott létre.
Futtasson egy GPU-elemzést az OpenMP Offload alkalmazáson
Most készen áll a GPU tehermentesítési elemzésének futtatására az Ön által lefordított OpenMP alkalmazáson.
- Nyissa meg a VTune Pro-tfiler és kattintson az Új projekt elemre egy projekt létrehozásához.
- Az üdvözlő oldalon kattintson az Elemzés konfigurálása elemre az elemzés beállításához.
- Válassza ki ezeket a beállításokat az elemzéshez.
- A WHERE panelen válassza a Helyi gazdagép lehetőséget.
- A MIT ablakban válassza az Alkalmazás indítása lehetőséget, és adja meg az iso3dfd_omp_offload bináris fájlt a pro alkalmazásának.file.
- A HOGYAN panelen válassza ki a GPU tehermentesítés elemzési típusát az elemzési fa Gyorsítók csoportjából.
- Kattintson a Start gombra az elemzés futtatásához.
VTune Profiler adatokat gyűjt és elemzési eredményeket jelenít meg a GPU-letöltésben viewpont.
- Az Összegzés ablakban tekintse meg a CPU- és GPU-erőforrás-használati statisztikákat. Használja ezeket az adatokat annak meghatározására, hogy az Ön alkalmazása:
- GPU kötött
- CPU-hoz kötött
- A rendszer számítási erőforrásainak nem hatékony kihasználása
- Használja a Platform ablakban található információkat az alapvető CPU- és GPU-metrikák megtekintéséhez.
- Vizsgáljon meg konkrét számítási feladatokat a Grafika ablakban.
A mélyebb elemzéshez lásd a VTune Pro kapcsolódó receptjétfiler Teljesítményelemző szakácskönyv. A profilalkotást a GPU Compute/Media Hotspots elemzésével is folytathatja.
Example: Profile SYCL* alkalmazás Linuxon*
Használja a VTune Pro-tfiler as-valample matrix_multiply SYCL alkalmazás, amellyel gyorsan megismerheti a GPU-hoz kötött alkalmazásokhoz gyűjtött terméket és statisztikákat.
Előfeltételek
- Telepítse a VTune Pro-tfiler és Intel® oneAPI DPC++/C++ fordító az Intel® oneAPI Base Toolkitből vagy az Intel® System Bring-up Toolkitből.
- Állítsa be a környezeti változókat a vars.sh parancsfájl végrehajtásával.
- Állítsa be a rendszert a GPU elemzéshez.
Építsd meg a Matrix alkalmazást
Töltse le a matrix_multiply_vtune kódot sampcsomag Intel oneAPI eszközkészletekhez. Ez tartalmazza az sample amely segítségével építhet és profile egy SYCL alkalmazás.
Profinakfile egy SYCL-alkalmazás, ügyeljen arra, hogy a kódot a -gline-tables-only és -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler opciókkal fordítsa le.
Ennek összeállításához sampalkalmazás esetén tegye a következőket:
- Menj a sample könyvtárat.
cd <sample_dir/VtuneProfiler/mátrix_szorzás> - A multiply.cpp file az src mappában a mátrixszorzás több változatát tartalmazza. Válasszon ki egy verziót a multiply.h megfelelő #define MULTIPLY sorának szerkesztésével.
- Készítse el az alkalmazást a meglévő Make segítségévelfile:
cmake .
készítsenek
Ennek létre kell hoznia egy matrix.icpx -fsycl végrehajtható fájlt.
A program törléséhez írja be:
tisztává tenni
Ez eltávolítja a végrehajtható fájlt és az objektumot files amelyeket a make parancs hozott létre.
Futtassa a GPU-elemzést
Futtasson egy GPU elemzést a Matrix s-enample.
- Indítsa el a VTune Pro programotfiler a vtune-gui paranccsal.
- Kattintson az Új projekt lehetőségre az üdvözlő oldalon.
- Adja meg az s nevét és helyétample projektet, és kattintson a Projekt létrehozása gombra.
- A MIT ablaktáblában keresse meg a matrix.icpx-fsycl fájlt file.
- A HOGYAN panelen kattintson a
Tallózás gombra, és válassza ki a GPU számítási/média hotspotok elemzését az Analysis Tree Gyorsítók csoportjából.
- Kattintson a Start gombra alul az elemzés elindításához az előre kiválasztott opciókkal.
Futtassa a GPU-elemzést a parancssorból:
- Készítse fel a rendszert a GPU elemzés futtatására. Lásd: Rendszer beállítása GPU-elemzéshez.
- Környezeti változók beállítása az Intel szoftvereszközökhöz:
forrás $ONEAPI_ROOT/setvars.sh - Futtassa a GPU Compute/Media Hotspots elemzést:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
Az összefoglaló jelentés megtekintéséhez írja be:
vtune -report summary -r ./result_gpu-hotspots
VTune Profiler adatokat gyűjt és elemzési eredményeket jelenít meg a GPU Compute/Media Hotspotokban viewpont. Az Összegzés ablakban tekintse meg a CPU- és GPU-erőforrás-használati statisztikákat, hogy megértse, hogy az alkalmazás GPU-hoz kötött-e. Váltson a Grafika ablakra, hogy megtekinthesse a kódvégrehajtást az idő múlásával jellemező alapvető CPU- és GPU-metrikákat.
Kezdje el az Intel® VTune™ Pro használatátfiler macOS* esetén
Használja a VTune Pro-tfiler macOS rendszeren, hogy távoli célelemzést hajtson végre nem macOS rendszeren (csak Linux* vagy Android*).
A VTune Pro nem használhatófiler macOS környezetben a következő célokra:
- Profile a macOS rendszer, amelyre telepítve van.
- Gyűjtsön adatokat egy távoli macOS rendszeren.
Egy távoli Linux* vagy Android* cél teljesítményének elemzéséhez a macOS gazdagépről hajtsa végre az alábbi lépések egyikét:
- Futtasson egy VTune Pro-tfiler elemzés a macOS rendszeren a célként megadott távoli rendszerrel. Az elemzés megkezdésekor a VTune Profiler csatlakozik a távoli rendszerhez, hogy adatokat gyűjtsön, majd az eredményeket visszahozza a macOS gazdagéphez viewing.
- Futtasson le egy elemzést a célrendszeren helyileg, és másolja át az eredményeket egy macOS rendszerre viewa VTune Pro alkalmazásbanfiler.
A dokumentum lépései távoli Linux célrendszert feltételeznek, és teljesítményadatokat gyűjtenek a VTune Pro SSH-hozzáférésévelfiler macOS gazdagépen.
Mielőtt elkezdené
- Telepítse az Intel® VTune™ Pro-tfiler a macOS* rendszeren.
- Készítse el Linux-alkalmazását szimbóluminformációkkal és Release módban, minden optimalizálással. Részletes információkért lásd a VTune Pro fordító beállításaitfiler segítség.
- Állítsa be az SSH-hozzáférést a gazdagép macOS rendszerből a cél Linux rendszerbe, hogy jelszó nélküli módban működjön.
1. lépés: Indítsa el a VTune Pro-tfiler
- Indítsa el a VTune Pro programotfiler a vtune-gui paranccsal.
Alapértelmezés szerint a az /opt/intel/oneapi/. - Amikor megnyílik a grafikus felület, kattintson az ÚJ PROJEKT lehetőségre az üdvözlőképernyőn.
- A Projekt létrehozása párbeszédpanelen adja meg a projekt nevét és helyét.
- Kattintson a Projekt létrehozása elemre.
2. lépés: Az elemzés konfigurálása és futtatása
Új projekt létrehozása után megnyílik az Elemzés konfigurálása ablak a Teljesítmény pillanatkép elemzési típusával.
Ez az elemzés egy végeview olyan problémákról, amelyek befolyásolják az alkalmazás teljesítményét a célrendszeren.
- A WHERE panelen válassza a Távoli Linux (SSH) lehetőséget, és adja meg a cél Linux rendszert a felhasználónév@ gazdagépnév[:port] használatával.
VTune Profiler csatlakozik a Linux rendszerhez, és telepíti a célcsomagot. - A MI panelen adja meg az alkalmazás elérési útját a cél Linux rendszeren.
- Kattintson a Start gombra a Performance Snapshot futtatásához az alkalmazáson.
3. lépés: View és a teljesítményadatok elemzése
Amikor az adatgyűjtés befejeződött, a VTune Profiler megjeleníti az elemzési eredményeket a macOS rendszeren. Indítsa el az elemzést az Összegzés ablakban. Itt látható egy előadás végeview az alkalmazásod.
A végeview jellemzően több mérőszámot is tartalmaz a leírásukkal együtt.
- A Bontsa ki az egyes mutatókat a hozzájáruló tényezőkről szóló részletes információkért.
- B A megjelölt mérőszám az elfogadható/normál működési tartományon kívül eső értéket jelez. Használja az eszköztippeket a megjelölt mutató javításának megértéséhez.
- C Tekintse meg a további elemzésekre vonatkozó útmutatást. Az elemzési fa kiemeli ezeket az ajánlásokat.
Következő lépések
A Performance Snapshot jó kiindulópont az alkalmazások teljesítményének átfogó értékeléséhez a VTune Pro segítségévelfiler.
Ezután ellenőrizze, hogy az algoritmus igényel-e hangolást.
- Futtassa a Hotspotok elemzését az alkalmazáson.
- Kövesse a Hotspots oktatóanyagot. Tanuljon meg olyan technikákat, amelyek segítségével a legtöbbet hozhatja ki Hotspotok elemzéséből.
- Ha az algoritmus jól be van hangolva, futtassa újra a Performance Snapshot alkalmazást az eredmények kalibrálásához és a lehetséges teljesítményjavítások azonosításához más területeken.
Lásd még
Mikroarchitektúra feltárása
VTune Profiler Help Tour
További információ
Dokumentum / Leírás
- Felhasználói kézikönyv
A Felhasználói kézikönyv a VTune Pro elsődleges dokumentációjafiler.
JEGYZET
Letöltheti a VTune Pro offline verzióját isfiler dokumentációt. - Online képzés
Az online képzési oldal kiváló forrás a VTune Pro alapjainak elsajátításáhozfiler Kezdő lépések útmutatókkal, videókkal, oktatóanyagokkal, webinars és műszaki cikkek. - Szakácskönyv
Teljesítményelemző szakácskönyv, amely recepteket tartalmaz a népszerű teljesítményproblémák azonosításához és megoldásához a VTune Pro elemzési típusai segítségévelfiler. - Telepítési útmutató Windowshoz | Linux | macOS gazdagépek
A Telepítési útmutató a VTune Pro alapvető telepítési utasításait tartalmazzafiler és telepítés utáni konfigurációs utasítások a különféle illesztőprogramokhoz és gyűjtőkhöz. - Oktatóanyagok
VTune ProfileAz r oktatóanyagok egy rövid s segítségével vezetik el az új felhasználót az alapvető funkciókonample alkalmazás. - Kiadási megjegyzések
További információ a VTune Pro legújabb verziójárólfiler, beleértve az új funkciók, rendszerkövetelmények és a megoldott műszaki problémák átfogó leírását.
A VTune Pro önálló és eszközkészlet-verzióihozfiler, ismerje meg az aktuális rendszerkövetelményeket.
Megjegyzések és felelősség kizárása
Az Intel technológiákhoz engedélyezni kell a hardver, a szoftver vagy a szolgáltatás aktiválását.
Egyetlen termék vagy alkatrész sem lehet teljesen biztonságos.
A költségek és az eredmények változhatnak.
© Intel Corporation. Az Intel, az Intel logó és más Intel védjegyek az Intel Corporation vagy leányvállalatai védjegyei. Más nevek és márkák mások tulajdonát képezhetik.
Az Intel, az Intel logó, az Intel Atom, az Intel Core, az Intel Xeon Phi, a VTune és a Xeon az Intel Corporation védjegyei az Egyesült Államokban és/vagy más országokban.
*Más nevek és márkák mások tulajdonát képezhetik.
A Microsoft, a Windows és a Windows logó a Microsoft Corporation védjegyei vagy bejegyzett védjegyei az Egyesült Államokban és/vagy más országokban.
A Java az Oracle és/vagy leányvállalatainak bejegyzett védjegye.
Az OpenCL és az OpenCL logó az Apple Inc. védjegyei, amelyeket a Khronos engedélyével használ.
Az Intel technológiákhoz engedélyezni kell a hardver, a szoftver vagy a szolgáltatás aktiválását.
Egyetlen termék vagy alkatrész sem lehet teljesen biztonságos.
A költségek és az eredmények változhatnak.
© Intel Corporation. Az Intel, az Intel logó és más Intel védjegyek az Intel Corporation vagy leányvállalatai védjegyei. Más nevek és márkák mások tulajdonát képezhetik.
Az Intel, az Intel logó, az Intel Atom, az Intel Core, az Intel Xeon Phi, a VTune és a Xeon az Intel Corporation védjegyei az Egyesült Államokban és/vagy más országokban.
*Más nevek és márkák mások tulajdonát képezhetik.
A Microsoft, a Windows és a Windows logó a Microsoft Corporation védjegyei vagy bejegyzett védjegyei az Egyesült Államokban és/vagy más országokban.
A Java az Oracle és/vagy leányvállalatainak bejegyzett védjegye.
Az OpenCL és az OpenCL logó az Apple Inc. védjegyei, amelyeket a Khronos engedélyével használ.
Dokumentumok / Források
![]() |
intel Kezdő lépések a VTune Pro használatávalfiler [pdf] Felhasználói útmutató Kezdje el a VTune Pro használatátfiler, Kezdő lépések a VTune Pro segítségévelfiler, VTune Profiler |