intel Pradėkite nuo VTune Profiler
Pradėkite naudoti „Intel® VTune™ Pro“.filer
Naudokite „Intel VTune Pro“.filer analizuoti vietines ir nuotolines tikslines sistemas iš Windows*, macOS* ir Linux* kompiuterių. Pagerinkite programos ir sistemos veikimą atlikdami šias operacijas:
- Analizuokite algoritmų pasirinkimus.
- Raskite serijinio ir lygiagrečiojo kodo kliūtis.
- Supraskite, kur ir kaip jūsų programa gali gauti naudos iš turimų aparatinės įrangos išteklių.
- Paspartinkite programos vykdymą.
Atsisiųskite „Intel VTune Pro“.filer savo sistemoje vienu iš šių būdų: - Atsisiųskite atskirą versiją.
- Gaukite „Intel VTune Pro“.filer kaip „Intel® oneAPI Base Toolkit“ dalis.
Žiūrėkite VTune Profiler mokymo puslapis vaizdo įrašams, webinars ir daugiau medžiagos, padėsiančios pradėti.
PASTABA
„Intel® VTune™ Pro“ versijų dokumentacijafiler iki 2021 m. leidimo galima tik atsisiųsti. Galimų atsisiuntimų dokumentacijos pagal produkto versiją sąrašą rasite šiuose puslapiuose:
- Atsisiųskite „Intel Parallel Studio XE“ dokumentaciją
- Atsisiųskite „Intel System Studio“ dokumentaciją
Supraskite darbo eigą
Naudokite „Intel VTune Pro“.filer prie profesionalofile programą ir analizuokite rezultatus, kad pagerintumėte našumą.
Bendrą darbo eigą sudaro šie žingsniai:
Norėdami pradėti, pasirinkite savo pagrindinę sistemą
Sužinokite daugiau apie konkrečiai sistemai skirtas darbo eigas, skirtas Windows*, Linux* arba macOS*.
Pradėkite naudoti „Intel® VTune™ Pro“.filer skirta Windows* OS
Prieš pradėdami
- Įdiekite „Intel® VTune™ Pro“.filer jūsų Windows* sistemoje.
- Sukurkite programą naudodami simbolių informaciją ir išleidimo režimu, kai įgalinti visi optimizavimai. Išsamios informacijos apie kompiliatoriaus nustatymus rasite „VTune Pro“.filer internetinis vartotojo vadovas.
Taip pat galite naudoti matricą sampprograma pasiekiama \VTune\Samples\matrica. Galite pamatyti atitinkamas sample rezultatus \VTune\Projects\sample (matrica). - Nustatykite aplinkos kintamuosius: paleiskite \setvars.bat scenarijus.
Pagal numatytuosius nustatymus, oneAPI komponentams yra Programa Files (x86)\Intel\oneAPI.
PASTABA Nereikia paleisti setvars.bat, kai naudojate Intel® VTune™ Profiler programoje Microsoft* Visual Studio*.
1 veiksmas: paleiskite „Intel® VTune™ Pro“.filer
Paleiskite „Intel VTune Pro“.filer naudokite vieną iš šių būdų ir sukurkite projektą. Projektas yra programos, kurią norite analizuoti, analizės tipo ir duomenų rinkimo rezultatų konteineris.
Šaltinis / Pradėti VTune Profiler
Atskiras (GUI)
- Paleiskite komandą vtune-gui arba paleiskite Intel® VTune™ Profiler iš meniu Pradėti.
- Atsidarius GUI, spustelėkite pasveikinimo ekraną.
- Dialogo lange Kurti projektą nurodykite projekto pavadinimą ir vietą.
- Spustelėkite Sukurti projektą.
Atskiras (komandų eilutė)
Paleiskite komandą vtune.
Microsoft* Visual Studio* IDE
Atidarykite sprendimą „Visual Studio“. „VTune Pro“.filer įrankių juosta automatiškai įjungiama, o jūsų „Visual Studio“ projektas nustatomas kaip analizės tikslas.
PASTABA
Nereikia kurti projekto, kai naudojate „Intel® VTune™ Pro“.filer iš komandinės eilutės arba „Microsoft* Visual Studio“.
2 veiksmas: konfigūruokite ir paleiskite analizę
Sukūrus naują projektą, atsidaro langas Konfigūruoti analizę su šiomis numatytomis reikšmėmis:
- Skiltyje Paleisti programą naršykite iki programos vykdomosios programos vietos file.
- Spustelėkite Pradėti, kad savo programoje paleistumėte „Performance Snapshot“. Ši analizė pateikia bendrą pabaigąview problemų, turinčių įtakos jūsų programos veikimui tikslinėje sistemoje.
3 veiksmas: View ir analizuoti našumo duomenis
Kai duomenų rinkimas baigtas, „VTune Profiler rodo analizės rezultatus suvestinės lange. Čia matote, kad spektaklis baigėsiview savo paraiškos.
Viršview paprastai apima keletą metrikų kartu su jų aprašymais.
- A Išplėskite kiekvieną metriką, kad gautumėte išsamios informacijos apie prisidedančius veiksnius.
- B Pažymėta metrika rodo vertę, esančią už priimtino / įprasto veikimo diapazono. Naudokite įrankių patarimus, kad suprastumėte, kaip patobulinti pažymėtą metriką.
- C Žr. kitų analizių, kurias turėtumėte apsvarstyti, gaires. Analizės medis pabrėžia šias rekomendacijas.
Kiti žingsniai
„Performance Snapshot“ yra geras atspirties taškas norint gauti bendrą programos „VTune Pro“ našumo įvertinimąfiler. Tada patikrinkite, ar jūsų algoritmas reikalauja derinimo.
- Vykdykite mokymo programą, kad analizuotumėte įprastas našumo kliūtis.
- Kai algoritmas bus gerai sureguliuotas, dar kartą paleiskite „Performance Snapshot“, kad sukalibruotumėte rezultatus ir nustatytumėte galimus našumo patobulinimus kitose srityse.
Taip pat žr
Mikroarchitektūros tyrinėjimas
VTune Profiler Pagalbos turas
ExampLe: Profile OpenMP* programa Windows*
Naudokite „Intel VTune Pro“.filer „Windows“ kompiuteryje į profesionalųfile kaipample iso3dfd_omp_offload OpenMP programa, perkelta į Intel GPU. Sužinokite, kaip atlikti GPU analizę ir ištirti rezultatus.
Būtinos sąlygos
- Įsitikinkite, kad jūsų sistemoje veikia Microsoft* Windows 10 arba naujesnė versija.
- Naudokite vieną iš šių „Intel Processor Graphics“ versijų:
- Gen 8
- Gen 9
- Gen 11
- Jūsų sistema turėtų veikti viename iš šių „Intel“ procesorių:
- 7-osios kartos Intel® Core™ i7 procesoriai (kodinis pavadinimas Kaby Lake)
- 8-osios kartos Intel® Core™ i7 procesoriai (kodinis pavadinimas Coffee Lake)
- 10-osios kartos „Intel® Core™ i7“ procesoriai (kodinis pavadinimas „Ice Lake“)
- Įdiekite „Intel VTune Pro“.filer iš vieno iš šių šaltinių:
- Atsisiųskite atskirą produktą
- „Intel® oneAPI“ bazės įrankių rinkinys
- „Intel® System Bring-up“ įrankių rinkinys
- Atsisiųskite „Intel® oneAPI HPC“ įrankių rinkinį, kuriame yra „Intel® oneAPI DPC++/C++“ kompiliatorius (icx/icpx), kurio jums reikia profesionaliai.file OpenMP programos.
- Nustatykite aplinkos kintamuosius. Vykdykite vars.bat scenarijų, esantį \env katalogas.
- Nustatykite savo sistemą GPU analizei.
PASTABA
Norėdami įdiegti „Intel VTune Pro“.filer Microsoft* Visual Studio aplinkoje, žr. VTune Profiler Vartotojo vadovas.
Sukurkite ir sukompiliuokite „OpenMP Offload“ programą
- Atsisiųskite iso3dfd_omp_offload OpenMP Offload sample.
- Atviras į sample katalogas.
CD <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Sukompiliuokite „OpenMP Offload“ programą.
mkdir statyba
cd pastatymas
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Vykdykite GPU analizę „OpenMP Offload“ programoje
Dabar esate pasirengę paleisti GPU iškrovimo analizę sukompiliuotoje OpenMP programoje.
- Atidarykite „VTune Pro“.filer ir spustelėkite Naujas projektas, kad sukurtumėte projektą.
- Pasisveikinimo puslapyje spustelėkite Konfigūruoti analizę, kad nustatytumėte analizę.
- Pasirinkite šiuos nustatymus analizei.
- Srityje WHERE pasirinkite Local Host.
- Srityje WHAT pasirinkite Launch Application ir nurodykite dvejetainį failą iso3dfd_omp_offload kaip programą profile.
- Srityje KAIP pasirinkite GPU iškrovimo analizės tipą iš analizės medžio grupės Greitintuvai.
- Spustelėkite mygtuką Pradėti, kad paleistumėte analizę.
VTune Profiler renka duomenis ir parodo analizės rezultatus GPU iškrovime viewtašką.
- Lange Suvestinė peržiūrėkite procesoriaus ir GPU išteklių naudojimo statistiką. Naudokite šiuos duomenis, kad nustatytumėte, ar jūsų programa yra:
- Su GPU
- Pririštas prie procesoriaus
- Neefektyviai naudojate savo sistemos skaičiavimo išteklius
- Norėdami pamatyti pagrindinę procesoriaus ir GPU metriką, naudokite informaciją platformos lange.
- Ištirkite konkrečias skaičiavimo užduotis Grafikos lange.
Norėdami gauti gilesnę analizę, žr. susijusį receptą „VTune Pro“.filer Veiklos analizės receptų knyga. Taip pat galite tęsti profiliavimą naudodami GPU skaičiavimo / medijos viešųjų taškų analizę.
Example: Profile SYCL* programa Windows*
Profile kaipample matrix_multiply SYCL programa su Intel® VTune™ Profiler. Susipažinkite su produktu ir supraskite su GPU susietų programų statistiką.
Būtinos sąlygos
- Įsitikinkite, kad sistemoje įdiegta Microsoft* Visual Studio (v2017 arba naujesnė).
- Įdiekite „Intel VTune Pro“.filer iš Intel® oneAPI Base Toolkit arba Intel® System Bring-up Toolkit. Šiuose įrankių rinkiniuose yra „Intel® oneAPI DPC++/C++ Compiler“ (icpx -fsycl) kompiliatorius, reikalingas profiliavimo procesui.
- Nustatykite aplinkos kintamuosius. Vykdykite vars.bat scenarijų, esantį \env katalogas.
- Įsitikinkite, kad „Intel oneAPI DPC++“ kompiliatorius (įdiegtas kartu su „Intel oneAPI Base“ įrankių rinkiniu) yra integruotas į „Microsoft Visual Studio“.
- Sukompiliuokite kodą naudodami „Intel oneAPI DPC++ Compiler“ parinktis -gline-tables-only ir -fdebug-info-for-profiling.
- Nustatykite savo sistemą GPU analizei.
Norėdami gauti informacijos apie „Intel VTune Pro“ diegimąfiler Microsoft* Visual Studio aplinkoje, žr. VTune Profiler Vartotojo vadovas.
Sukurkite „Matrix“ programą
Atsisiųskite matrix_multiply_vtune kodą samp„Intel oneAPI“ įrankių rinkinių paketas. Jame yra sample kurį galite naudoti kurdami ir profile SYCL programa.
- Atidarykite Microsoft* Visual Studio.
- Spustelėkite File > Atidaryti > Projektas / sprendimas. Raskite aplanką matrix_multiply_vtune ir pasirinkite matrix_multiply.sln.
- Sukurkite šią konfigūraciją (Projektas > Sukurti).
- Paleiskite programą (Debug> Start Without Debugging).
- Norėdami pasirinkti DPC++ arba srieginę sample, naudokite išankstinio procesoriaus apibrėžimus.
- Eikite į „Projekto ypatybės“ > „DPC++“ > „Preprocessor“ > „Preprocessor Definition“.
- Apibrėžkite icpx -fsycl arba USE_THR.
Paleiskite GPU analizę
Paleiskite GPU analizę „Matrix s“.ample.
- Visual Studio įrankių juostoje spustelėkite mygtuką Konfigūruoti analizę.
Atsidaro langas Konfigūruoti analizę. Pagal numatytuosius nustatymus jis paveldi jūsų VS projekto nustatymus ir nurodo matrix_multiply.exe kaip programą profile. - Lange Konfigūruoti analizę spustelėkite
Naršymo mygtukas srityje KAIP.
- Analizės medžio grupėje Greitintuvai pasirinkite GPU skaičiavimo / medijos viešųjų taškų analizės tipą.
- Spustelėkite mygtuką Pradėti, kad pradėtumėte analizę su iš anksto nustatytomis parinktimis.
Paleiskite GPU analizę iš komandinės eilutės:
- Atidarykite sample katalogas:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - Šiame kataloge atidarykite Visual Studio* projektą file pavadinta matrix_multiply.sln
- Multiply.cpp file yra keletas matricos daugybos versijų. Pasirinkite versiją redaguodami atitinkamą #define MULTIPLY eilutę multiply.hpp
- Sukurkite visą projektą naudodami leidimo konfigūraciją.
Tai sugeneruoja vykdomąjį failą, vadinamą matrix_multiply.exe. - Paruoškite sistemą atlikti GPU analizę. Žr. Sistemos nustatymas GPU analizei.
- Nustatykite „VTune Pro“.filer aplinkos kintamuosius paleisdami paketą file: eksportas \env\vars.bat
- Paleiskite analizės komandą:
vtune.exe - surinkti gpu-offload - matrix_multiply.exe
VTune Profiler renka duomenis ir parodo analizės rezultatus GPU skaičiavimo / medijos prieigos taškuose viewtašką. Lange Suvestinė peržiūrėkite procesoriaus ir GPU išteklių naudojimo statistiką, kad suprastumėte, ar jūsų programa susieta su GPU. Perjunkite į grafikos langą, kad pamatytumėte pagrindinę CPU ir GPU metriką, atspindinčią kodo vykdymą laikui bėgant.
Pradėkite naudoti „Intel® VTune™ Pro“.filer skirta Linux* OS
Prieš pradėdami
- Įdiekite „Intel® VTune™ Pro“.filer savo Linux* sistemoje.
- Sukurkite programą naudodami simbolių informaciją ir išleidimo režimu, kai įgalinti visi optimizavimai. Išsamios informacijos apie kompiliatoriaus nustatymus rasite „VTune Pro“.filer internetinis vartotojo vadovas.
Taip pat galite naudoti matricą sampprograma pasiekiama \sample\matrica. Galite pamatyti sample rezultatus \sample (matrica). - Nustatykite aplinkos kintamuosius: šaltinis /setvars.sh
Pagal numatytuosius nustatymus, yra:- $HOME/intel/oneapi/ įdiegus su vartotojo leidimais;
- /opt/intel/oneapi/, kai įdiegta su root teisėmis.
1 veiksmas: paleiskite „VTune Pro“.filer
Paleiskite „VTune Pro“.filer vienu iš šių būdų:
Šaltinis / Pradėti VTune Profiler
Atskiras / IDE (GUI)
- Vykdykite komandą vtunegui. Norėdami paleisti „VTune Pro“.filer iš Intel System Studio IDE pasirinkite Tools > VTune Profiler > Paleiskite „VTune Pro“.filer. Taip nustatomi visi atitinkami aplinkos kintamieji ir paleidžiama atskira produkto sąsaja.
- Atsidarius GUI, pasveikinimo ekrane spustelėkite NAUJAS PROJEKTAS.
- Dialogo lange Kurti projektą nurodykite projekto pavadinimą ir vietą.
- Spustelėkite Sukurti projektą.
Atskiras (komandų eilutė)
- Paleiskite komandą vtune.
2 veiksmas: konfigūruokite ir paleiskite analizę
Sukūrus naują projektą, atsidaro langas Konfigūruoti analizę su šiomis numatytomis reikšmėmis:
- Skiltyje Paleisti programą naršykite į savo programos vietą.
- Spustelėkite Pradėti, kad savo programoje paleistumėte našumo momentinį vaizdą. Ši analizė pateikia bendrą pabaigąview problemų, turinčių įtakos jūsų programos veikimui tikslinėje sistemoje.
3 veiksmas: View ir analizuoti našumo duomenis
Kai duomenų rinkimas baigtas, „VTune Profiler rodo analizės rezultatus suvestinės lange. Čia matote, kad spektaklis baigėsiview savo paraiškos.
Viršview paprastai apima keletą metrikų kartu su jų aprašymais.
- A Išplėskite kiekvieną metriką, kad gautumėte išsamios informacijos apie prisidedančius veiksnius.
- B Pažymėta metrika rodo vertę, esančią už priimtino / įprasto veikimo diapazono. Naudokite įrankių patarimus, kad suprastumėte, kaip patobulinti pažymėtą metriką.
- C Žr. kitų analizių, kurias turėtumėte apsvarstyti, gaires. Analizės medis pabrėžia šias rekomendacijas.
Kiti žingsniai
„Performance Snapshot“ yra geras atspirties taškas norint gauti bendrą programos „VTune Pro“ našumo įvertinimąfiler. Tada patikrinkite, ar jūsų algoritmas reikalauja derinimo.
- Vykdykite mokymo programą, kad analizuotumėte įprastas našumo kliūtis.
- Kai algoritmas bus gerai sureguliuotas, dar kartą paleiskite „Performance Snapshot“, kad sukalibruotumėte rezultatus ir nustatytumėte galimus našumo patobulinimus kitose srityse.
Taip pat žr
Mikroarchitektūros tyrinėjimas
VTune Profiler Pagalbos turas
Example: Profile OpenMP programa Linux*
Naudokite „Intel VTune Pro“.filer „Linux“ įrenginyje į profesionalųfile kaipample iso3dfd_omp_offload OpenMP programa, perkelta į Intel GPU. Sužinokite, kaip atlikti GPU analizę ir ištirti rezultatus.
Būtinos sąlygos
- Įsitikinkite, kad jūsų sistemoje veikia Linux* OS branduolys 4.14 arba naujesnė versija.
- Naudokite vieną iš šių „Intel Processor Graphics“ versijų:
- Gen 8
- Gen 9
- Gen 11
- Jūsų sistema turėtų veikti viename iš šių „Intel“ procesorių:
- 7-osios kartos Intel® Core™ i7 procesoriai (kodinis pavadinimas Kaby Lake)
- 8-osios kartos Intel® Core™ i7 procesoriai (kodinis pavadinimas Coffee Lake)
- 10-osios kartos „Intel® Core™ i7“ procesoriai (kodinis pavadinimas „Ice Lake“)
- Linux GUI naudokite:
- GTK+ versija 2.10 arba naujesnė (rekomenduojama 2.18 ir naujesnės versijos)
- Pango 1.14 ar naujesnė versija
- X.Org 1.0 ar naujesnė versija (rekomenduojama 1.7 ir naujesnės versijos)
- Įdiekite „Intel VTune Pro“.filer iš vieno iš šių šaltinių:
- Atsisiųskite atskirą produktą
- „Intel® oneAPI“ bazės įrankių rinkinys
- „Intel® System Bring-up“ įrankių rinkinys
- Atsisiųskite „Intel® oneAPI HPC“ įrankių rinkinį, kuriame yra „Intel® oneAPI DPC++/C++“ kompiliatorius (icx/icpx), kurio jums reikia profesionaliai.file OpenMP programos.
- Nustatykite aplinkos kintamuosius. Vykdykite vars.sh scenarijų.
- Nustatykite savo sistemą GPU analizei.
Sukurkite ir sukompiliuokite „OpenMP Offload“ programą
- Atsisiųskite iso3dfd_omp_offload OpenMP Offload sample.
- Atviras į sample katalogas.
CD <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Sukompiliuokite „OpenMP Offload“ programą.
mkdir build;
cmake -DVERIFY_RESULTS=0 ..
padaryti -j
Tai sugeneruoja src/iso3dfd vykdomąjį failą.
Norėdami ištrinti programą, įveskite:
padaryti švarų
Tai pašalina vykdomąjį failą ir objektą files, kurias sukūrėte naudodami komandą make.
Vykdykite GPU analizę „OpenMP Offload“ programoje
Dabar esate pasirengę paleisti GPU iškrovimo analizę sukompiliuotoje OpenMP programoje.
- Atidarykite „VTune Pro“.filer ir spustelėkite Naujas projektas, kad sukurtumėte projektą.
- Pasisveikinimo puslapyje spustelėkite Konfigūruoti analizę, kad nustatytumėte analizę.
- Pasirinkite šiuos nustatymus analizei.
- Srityje WHERE pasirinkite Local Host.
- Srityje WHAT pasirinkite Launch Application ir nurodykite dvejetainį failą iso3dfd_omp_offload kaip programą profile.
- Srityje KAIP pasirinkite GPU iškrovimo analizės tipą iš analizės medžio grupės Greitintuvai.
- Spustelėkite mygtuką Pradėti, kad paleistumėte analizę.
VTune Profiler renka duomenis ir parodo analizės rezultatus GPU iškrovime viewtašką.
- Lange Suvestinė peržiūrėkite procesoriaus ir GPU išteklių naudojimo statistiką. Naudokite šiuos duomenis, kad nustatytumėte, ar jūsų programa yra:
- Su GPU
- Pririštas prie procesoriaus
- Neefektyviai naudojate savo sistemos skaičiavimo išteklius
- Norėdami pamatyti pagrindinę procesoriaus ir GPU metriką, naudokite informaciją platformos lange.
- Ištirkite konkrečias skaičiavimo užduotis Grafikos lange.
Norėdami gauti gilesnę analizę, žr. susijusį receptą „VTune Pro“.filer Veiklos analizės receptų knyga. Taip pat galite tęsti profiliavimą naudodami GPU skaičiavimo / medijos viešųjų taškų analizę.
Example: Profile SYCL* programa Linux*
Naudokite „VTune Pro“.filer su asample matrix_multiply SYCL programą, kad greitai susipažintumėte su produktu ir statistika, renkama su GPU susijusioms programoms.
Būtinos sąlygos
- Įdiekite „VTune Pro“.filer ir Intel® oneAPI DPC++/C++ kompiliatorius iš Intel® oneAPI Base Toolkit arba Intel® System Bring-up Toolkit.
- Nustatykite aplinkos kintamuosius vykdydami vars.sh scenarijų.
- Nustatykite savo sistemą GPU analizei.
Sukurkite Matricos programą
Atsisiųskite matrix_multiply_vtune kodą samp„Intel oneAPI“ įrankių rinkinių paketas. Jame yra sample kurį galite naudoti kurdami ir profile SYCL programa.
Profile SYCL programą, būtinai sukompiliuokite kodą naudodami „Intel oneAPI DPC++ Compiler“ parinktis -gline-tables-only ir -fdebug-info-for-profiling.
Norėdami sudaryti šį sampprogramoje, atlikite šiuos veiksmus:
- Eikite į sample katalogas.
CD <sample_dir/VtuneProfiler/matricos_dauginimas> - Multiply.cpp file src aplanke yra kelios matricos daugybos versijos. Pasirinkite versiją redaguodami atitinkamą #define MULTIPLY eilutę multiply.h.
- Sukurkite programą naudodami esamą Makefile:
cmake .
padaryti
Tai turėtų sugeneruoti vykdomąjį failą matrix.icpx -fsycl.
Norėdami ištrinti programą, įveskite:
padaryti švarų
Tai pašalina vykdomąjį failą ir objektą files, kurios buvo sukurtos naudojant komandą make.
Paleiskite GPU analizę
Paleiskite GPU analizę „Matrix s“.ample.
- Paleiskite VTune Profiler su komanda vtune-gui.
- Sveikiname puslapyje spustelėkite Naujas projektas.
- Nurodykite savo s pavadinimą ir vietąample projektą ir spustelėkite Sukurti projektą.
- Srityje WHAT suraskite matrix.icpx-fsycl file.
- Srityje KAIP spustelėkite
Naršymo mygtukas ir analizės medžio grupėje Accelerators pasirinkite GPU Compute/Media Hotspots analizė.
- Spustelėkite apačioje esantį mygtuką Pradėti, kad paleistumėte analizę su iš anksto pasirinktomis parinktimis.
Paleiskite GPU analizę iš komandinės eilutės:
- Paruoškite sistemą atlikti GPU analizę. Žr. Sistemos nustatymas GPU analizei.
- „Intel“ programinės įrangos įrankių aplinkos kintamųjų nustatymas:
šaltinis $ONEAPI_ROOT/setvars.sh - Vykdykite GPU skaičiavimo / medijos viešosios interneto prieigos taškų analizę:
vtune -surink gpu-hotspots -r ./result_gpu-hotspots - ./matrix.icpx -fsycl
Norėdami pamatyti suvestinę ataskaitą, įveskite:
vtune -report santrauka -r ./result_gpu-hotspots
VTune Profiler renka duomenis ir parodo analizės rezultatus GPU skaičiavimo / medijos prieigos taškuose viewtašką. Lange Suvestinė peržiūrėkite procesoriaus ir GPU išteklių naudojimo statistiką, kad suprastumėte, ar jūsų programa susieta su GPU. Perjunkite į grafikos langą, kad pamatytumėte pagrindinę CPU ir GPU metriką, atspindinčią kodo vykdymą laikui bėgant.
Pradėkite naudoti „Intel® VTune™ Pro“.filer skirta macOS*
Naudokite „VTune Pro“.filer „MacOS“ sistemoje, kad atliktumėte nuotolinę tikslinę analizę ne „MacOS“ sistemoje (tik „Linux“* arba „Android“*).
Negalite naudoti „VTune Pro“.filer „MacOS“ aplinkoje šiais tikslais:
- Profile „macOS“ sistema, kurioje ji įdiegta.
- Surinkite duomenis nuotolinėje „MacOS“ sistemoje.
Norėdami analizuoti nuotolinio „Linux“* arba „Android“* taikymo iš „MacOS“ pagrindinio kompiuterio našumą, atlikite vieną iš šių veiksmų:
- Paleiskite „VTune Pro“.filer analizė „macOS“ sistemoje su nuotoline sistema, nurodyta kaip taikinys. Pradėjus analizę, VTune Profiler prisijungia prie nuotolinės sistemos, kad rinktų duomenis, tada grąžina rezultatus į „MacOS“ pagrindinį kompiuterį viewing.
- Paleiskite tikslinės sistemos analizę vietoje ir nukopijuokite rezultatus į „MacOS“ sistemą view„VTune Pro“.filer.
Šiame dokumente pateikiami veiksmai apima nuotolinę Linux tikslinę sistemą ir renka našumo duomenis naudojant SSH prieigą iš VTune Profiler „MacOS“ prieglobos sistemoje.
Prieš pradėdami
- Įdiekite „Intel® VTune™ Pro“.filer jūsų macOS* sistemoje.
- Sukurkite savo „Linux“ programą naudodami simbolių informaciją ir išleidimo režimu su įjungtais optimizavimais. Norėdami gauti daugiau informacijos, žr. kompiliatoriaus nustatymus „VTune Pro“.filer pagalba.
- Nustatykite SSH prieigą iš pagrindinės „MacOS“ sistemos į tikslinę „Linux“ sistemą, kad veiktų režimu be slaptažodžio.
1 veiksmas: paleiskite „VTune Pro“.filer
- Paleiskite VTune Profiler su komanda vtune-gui.
Pagal numatytuosius nustatymus, yra /opt/intel/oneapi/. - Atsidarius GUI, pasveikinimo ekrane spustelėkite NAUJAS PROJEKTAS.
- Dialogo lange Kurti projektą nurodykite projekto pavadinimą ir vietą.
- Spustelėkite Sukurti projektą.
2 veiksmas: konfigūruokite ir paleiskite analizę
Sukūrus naują projektą, atsidaro langas Konfigūruoti analizę su Našumo momentinės nuotraukos analizės tipu.
Ši analizė rodo pabaigąview problemų, kurios turi įtakos jūsų programos veikimui tikslinėje sistemoje.
- Srityje WHERE pasirinkite Remote Linux (SSH) ir nurodykite tikslinę Linux sistemą naudodami vartotojo vardas@ hostname[:port].
VTune Profiler prisijungia prie „Linux“ sistemos ir įdiegia tikslinį paketą. - Srityje KAS nurodykite kelią į savo programą tikslinėje Linux sistemoje.
- Spustelėkite mygtuką Pradėti, kad programoje paleistumėte Performance Snapshot.
3 veiksmas: View ir analizuoti našumo duomenis
Kai duomenų rinkimas baigtas, „VTune Profiler rodo analizės rezultatus MacOS sistemoje. Pradėkite analizę Santraukos lange. Čia matote, kad spektaklis baigėsiview savo paraiškos.
Viršview paprastai apima keletą metrikų kartu su jų aprašymais.
- A Išplėskite kiekvieną metriką, kad gautumėte išsamios informacijos apie prisidedančius veiksnius.
- B Pažymėta metrika rodo vertę, esančią už priimtino / įprasto veikimo diapazono. Naudokite įrankių patarimus, kad suprastumėte, kaip patobulinti pažymėtą metriką.
- C Žr. kitų analizių, kurias turėtumėte apsvarstyti, gaires. Analizės medis pabrėžia šias rekomendacijas.
Kiti žingsniai
„Performance Snapshot“ yra geras atspirties taškas norint gauti bendrą programos „VTune Pro“ našumo įvertinimąfiler.
Tada patikrinkite, ar jūsų algoritmas reikalauja derinimo.
- Savo programoje paleiskite viešosios interneto prieigos taškų analizę.
- Sekite „Hotspots“ mokymo programą. Išmokite būdų, kaip išnaudoti visas viešosios interneto prieigos taškų analizės galimybes.
- Kai algoritmas bus gerai sureguliuotas, dar kartą paleiskite „Performance Snapshot“, kad sukalibruotumėte rezultatus ir nustatytumėte galimus našumo patobulinimus kitose srityse.
Taip pat žr
Mikroarchitektūros tyrinėjimas
VTune Profiler Pagalbos turas
Sužinokite daugiau
Dokumentas / Aprašymas
- Vartotojo vadovas
Vartotojo vadovas yra pagrindinė „VTune Pro“ dokumentacijafiler.
PASTABA
Taip pat galite atsisiųsti neprisijungus pasiekiamą „VTune Pro“ versijąfiler dokumentaciją. - Mokymai internetu
Internetinė mokymo svetainė yra puikus šaltinis norint išmokti VTune Pro pagrindusfiler su darbo pradžios vadovais, vaizdo įrašais, vadovėliais, webinarus ir techninius straipsnius. - Kulinarijos knyga
Našumo analizės kulinarijos knyga, kurioje pateikiami receptai populiarioms našumo problemoms nustatyti ir išspręsti naudojant VTune Pro analizės tipusfiler. - „Windows“ diegimo vadovas | Linux | macOS prieglobos
Diegimo vadove yra pagrindinės VTune Pro diegimo instrukcijosfiler ir įvairių tvarkyklių ir kolektorių konfigūracijos instrukcijos po įdiegimo. - Pamokos
VTune Profiler mokymo programos padeda naujam vartotojui susipažinti su pagrindinėmis funkcijomis su trumpu sample paraiška. - Išleidimo pastabos
Raskite informacijos apie naujausią „VTune Pro“ versijąfiler, įskaitant išsamų naujų funkcijų, sistemos reikalavimų ir išspręstų techninių problemų aprašymą.
Atskirai ir įrankių rinkinio „VTune Pro“ versijomsfiler, suprasti dabartinius sistemos reikalavimus.
Pranešimai ir atsakomybės apribojimai
„Intel“ technologijoms gali reikėti aktyvuotos aparatinės, programinės įrangos ar paslaugų.
Joks gaminys ar komponentas negali būti visiškai saugūs.
Jūsų išlaidos ir rezultatai gali skirtis.
© Intel Corporation. „Intel“, „Intel“ logotipas ir kiti „Intel“ ženklai yra „Intel Corporation“ arba jos dukterinių įmonių prekių ženklai. Kiti pavadinimai ir prekės ženklai gali būti laikomi kitų nuosavybe.
„Intel“, „Intel“ logotipas, „Intel Atom“, „Intel Core“, „Intel Xeon Phi“, „VTune“ ir „Xeon“ yra „Intel Corporation“ prekių ženklai JAV ir (arba) kitose šalyse.
*Kiti pavadinimai ir prekės ženklai gali būti laikomi kitų nuosavybe.
„Microsoft“, „Windows“ ir „Windows“ logotipas yra „Microsoft Corporation“ prekių ženklai arba registruotieji prekių ženklai JAV ir (arba) kitose šalyse.
Java yra registruotasis Oracle ir (arba) jos filialų prekės ženklas.
OpenCL ir OpenCL logotipas yra Apple Inc. prekių ženklai, naudojami su Khronos leidimu.
„Intel“ technologijoms gali reikėti aktyvuotos aparatinės, programinės įrangos ar paslaugų.
Joks gaminys ar komponentas negali būti visiškai saugūs.
Jūsų išlaidos ir rezultatai gali skirtis.
© Intel Corporation. „Intel“, „Intel“ logotipas ir kiti „Intel“ ženklai yra „Intel Corporation“ arba jos dukterinių įmonių prekių ženklai. Kiti pavadinimai ir prekės ženklai gali būti laikomi kitų nuosavybe.
„Intel“, „Intel“ logotipas, „Intel Atom“, „Intel Core“, „Intel Xeon Phi“, „VTune“ ir „Xeon“ yra „Intel Corporation“ prekių ženklai JAV ir (arba) kitose šalyse.
*Kiti pavadinimai ir prekės ženklai gali būti laikomi kitų nuosavybe.
„Microsoft“, „Windows“ ir „Windows“ logotipas yra „Microsoft Corporation“ prekių ženklai arba registruotieji prekių ženklai JAV ir (arba) kitose šalyse.
Java yra registruotasis Oracle ir (arba) jos filialų prekės ženklas.
OpenCL ir OpenCL logotipas yra Apple Inc. prekių ženklai, naudojami su Khronos leidimu.
Dokumentai / Ištekliai
![]() |
intel Pradėkite nuo VTune Profiler [pdfVartotojo vadovas Pradėkite naudotis „VTune Pro“.filer, Pradėkite naudodami „VTune Pro“.filer, „VTune Pro“.filer |