intel Սկսեք VTune Pro-ովfiler
Սկսեք Intel® VTune™ Pro-ովfiler
Օգտագործեք Intel VTune Pro-նfiler վերլուծելու տեղական և հեռավոր թիրախային համակարգերը Windows*, macOS* և Linux* հոսթերից: Բարելավել հավելվածի և համակարգի կատարողականը հետևյալ գործողությունների միջոցով.
- Վերլուծեք ալգորիթմի ընտրությունը:
- Գտեք սերիական և զուգահեռ կոդի խցանումները:
- Հասկացեք, թե որտեղ և ինչպես կարող է ձեր հավելվածը օգուտ քաղել առկա ապարատային ռեսուրսներից:
- Արագացրեք ձեր դիմումի կատարումը:
Ներբեռնեք Intel VTune Pro-նfiler ձեր համակարգում հետևյալ եղանակներից մեկով. - Ներբեռնեք անկախ տարբերակը:
- Ստացեք Intel VTune Profiler որպես Intel® oneAPI Base Toolkit-ի մաս:
Տես VTune Pro-նfiler վերապատրաստման էջ տեսանյութերի համար, webinars և ավելի շատ նյութեր, որոնք կօգնեն ձեզ սկսել:
ԾԱՆՈԹԱԳՐՈՒԹՅՈՒՆ
Փաստաթղթեր Intel® VTune™ Pro-ի տարբերակների համարfiler մինչև 2021 թողարկումը հասանելի են միայն ներբեռնման համար: Ըստ արտադրանքի տարբերակի հասանելի փաստաթղթերի ներբեռնումների ցանկի համար տես այս էջերը.
- Ներբեռնեք փաստաթղթեր Intel Parallel Studio XE-ի համար
- Ներբեռնեք փաստաթղթեր Intel System Studio-ի համար
Հասկացեք աշխատանքային հոսքը
Օգտագործեք Intel VTune Pro-նfiler to profile հավելված և վերլուծել արդյունքները կատարողականի բարելավման համար:
Ընդհանուր աշխատանքային հոսքը պարունակում է հետևյալ քայլերը.
Սկսելու համար ընտրեք ձեր հյուրընկալող համակարգը
Իմացեք ավելին Windows*, Linux* կամ macOS* համակարգի հատուկ աշխատանքային հոսքերի մասին:
Սկսեք Intel® VTune™ Pro-ովfiler Windows* OS-ի համար
Նախքան սկսելը
- Տեղադրեք Intel® VTune™ Pro-նfiler ձեր Windows* համակարգում:
- Կառուցեք ձեր հավելվածը խորհրդանիշի տեղեկություններով և թողարկման ռեժիմում՝ միացված բոլոր օպտիմալացումներով: Կոմպիլյատորի կարգավորումների վերաբերյալ մանրամասն տեղեկությունների համար տես VTune Pro-նfiler առցանց օգտագործողի ուղեցույց:
Կարող եք նաև օգտագործել մատրիցը sampհայտը հասանելի է \VTune\Samples\ matrix. Դուք կարող եք տեսնել համապատասխան սampհանգեցնում է \VTune\Projects\sample (մատրիցա). - Կարգավորեք շրջակա միջավայրի փոփոխականները. Գործարկեք \setvars.bat սցենար.
Լռելյայնորեն, որ oneAPI բաղադրիչների համար Ծրագիրն է Files (x86)\Intel\oneAPI:
ԾԱՆՈԹԱԳՐՈՒԹՅՈՒՆ Intel® VTune™ Pro-ն օգտագործելիս setvars.bat-ը գործարկելու կարիք չկաfiler Microsoft* Visual Studio*-ում:
Քայլ 1. Սկսեք Intel® VTune™ Pro-նfiler
Գործարկեք Intel VTune Pro-նfiler այս եղանակներից մեկի միջոցով և ստեղծեք նախագիծ: Նախագիծը կոնտեյներ է այն հավելվածի համար, որը ցանկանում եք վերլուծել, վերլուծության տեսակը և տվյալների հավաքագրման արդյունքները:
Աղբյուր / Սկսել VTune Pro-նfiler
Անկախ (GUI)
- Գործարկեք vtune-gui հրամանը կամ գործարկեք Intel® VTune™ Pro-նfiler Սկսել Start ընտրացանկից:
- Երբ GUI-ն բացվի, սեղմեք «Ողջույն» էկրանին:
- Ստեղծել նախագիծ երկխոսության վանդակում նշեք նախագծի անվանումը և գտնվելու վայրը:
- Սեղմեք Ստեղծել նախագիծ:
Անկախ (հրամանի տող)
Գործարկեք vtune հրամանը:
Microsoft* Visual Studio* IDE
Բացեք ձեր լուծումը Visual Studio-ում: VTune Profiler գործիքագոտին ավտոմատ կերպով միացված է, և ձեր Visual Studio նախագիծը սահմանվում է որպես վերլուծության թիրախ:
ԾԱՆՈԹԱԳՐՈՒԹՅՈՒՆ
Intel® VTune™ Pro-ն գործարկելիս նախագիծ ստեղծելու կարիք չկաfiler հրամանի տողից կամ Microsoft* Visual Studio-ի ներսում:
Քայլ 2. Կազմաձևեք և գործարկեք վերլուծությունը
Նոր նախագիծ ստեղծելուց հետո «Կարգավորել վերլուծության» պատուհանը բացվում է այս լռելյայն արժեքներով.
- Գործարկման հավելված բաժնում դիտեք ձեր հավելվածի գործարկվողի գտնվելու վայրը file.
- Սեղմեք «Սկսել»՝ ձեր հավելվածի վրա «Performance Snapshot» գործարկելու համար: Այս վերլուծությունը ներկայացնում է ընդհանուր ավարտview նպատակային համակարգում ձեր հավելվածի կատարման վրա ազդող խնդիրներ:
Քայլ 3: View և վերլուծել կատարողականի տվյալները
Երբ տվյալների հավաքագրումն ավարտվի, VTune Pro-նfiler-ը ցուցադրում է վերլուծության արդյունքները Ամփոփման պատուհանում: Այստեղ դուք տեսնում եք ավարտված ներկայացումview ձեր դիմումի.
Ավարտըview սովորաբար ներառում է մի քանի չափումներ՝ դրանց նկարագրությունների հետ մեկտեղ:
- A Ընդարձակեք յուրաքանչյուր չափանիշ՝ նպաստող գործոնների մասին մանրամասն տեղեկություններ ստանալու համար:
- B Նշված չափանիշը ցույց է տալիս ընդունելի/նորմալ աշխատանքային միջակայքից դուրս արժեք: Օգտագործեք գործիքների խորհուրդները՝ հասկանալու համար, թե ինչպես բարելավել դրոշակավորված չափանիշը:
- C Տեսեք ուղեցույց այլ վերլուծությունների վերաբերյալ, որոնք դուք պետք է հաշվի առնեք հաջորդիվ: Վերլուծության ծառը կարևորում է այս առաջարկությունները:
Հաջորդ քայլերը
Performance Snapshot-ը լավ մեկնարկային կետ է VTune Pro-ի հետ հավելվածի կատարողականի ընդհանուր գնահատական ստանալու համարfiler. Հաջորդը, ստուգեք, արդյոք ձեր ալգորիթմը պահանջում է թյունինգ:
- Հետևեք ձեռնարկին` վերլուծելու ընդհանուր կատարողական խոչընդոտները:
- Երբ ձեր ալգորիթմը լավ կարգավորվի, նորից գործարկեք Performance Snapshot-ը՝ արդյունքները չափորոշելու և այլ ոլորտներում կատարողականի հնարավոր բարելավումները հայտնաբերելու համար:
Տես նաև
Միկրոճարտարապետության հետախուզում
VTune Profiler Օգնության շրջագայություն
Exampլե: Profile OpenMP* հավելված Windows-ում*
Օգտագործեք Intel VTune Pro-նfiler Windows մեքենայի վրա պրոֆfile ինչպեսample iso3dfd_omp_offload OpenMP հավելվածը բեռնված է Intel GPU-ի վրա: Իմացեք, թե ինչպես վարել GPU-ի վերլուծությունը և ուսումնասիրել արդյունքները:
Նախադրյալներ
- Համոզվեք, որ ձեր համակարգն աշխատում է Microsoft* Windows 10 կամ ավելի նոր տարբերակով:
- Օգտագործեք Intel Processor Graphics-ի այս տարբերակներից մեկը.
- Gen 8
- Gen 9
- Gen 11
- Ձեր համակարգը պետք է աշխատի այս Intel պրոցեսորներից մեկի վրա.
- 7-րդ սերնդի Intel® Core™ i7 պրոցեսորներ (կոդային անունը Kaby Lake)
- 8-րդ սերնդի Intel® Core™ i7 պրոցեսորներ (կոդային անվանումը Coffee Lake)
- 10-րդ սերնդի Intel® Core™ i7 պրոցեսորներ (կոդային անվանումը Ice Lake)
- Տեղադրեք Intel VTune Pro-նfiler այս աղբյուրներից մեկից.
- Անկախ արտադրանքի ներբեռնում
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Ներբեռնեք Intel® oneAPI HPC Toolkit-ը, որը պարունակում է Intel® oneAPI DPC++/C++ Կազմող (icx/icpx), որը դուք պետք է պատրաստեք:file OpenMP հավելվածներ.
- Ստեղծեք շրջակա միջավայրի փոփոխականներ: Կատարեք vars.bat սցենարը, որը գտնվում է \env գրացուցակ:
- Ստեղծեք ձեր համակարգը GPU վերլուծության համար:
ԾԱՆՈԹԱԳՐՈՒԹՅՈՒՆ
Intel VTune Pro-ն տեղադրելու համարfiler Microsoft* Visual Studio միջավայրում տես VTune Pro-նfiler Օգտագործողի ուղեցույց:
Կառուցեք և կազմեք OpenMP Offload հավելվածը
- Ներբեռնեք iso3dfd_omp_offload OpenMP Offload sampլե.
- Բաց դեպի սampտեղեկատու.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Կազմեք OpenMP Offload հավելվածը:
mkdir կառուցել
CD-ի պատրաստում
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Գործարկեք GPU-ի վերլուծություն OpenMP Offload հավելվածում
Այժմ դուք պատրաստ եք գործարկել GPU-ի բեռնաթափման վերլուծությունը ձեր կազմած OpenMP հավելվածում:
- Բացեք VTune Pro-նfiler և սեղմեք Նոր նախագիծ՝ նախագիծ ստեղծելու համար:
- Ողջույնի էջում սեղմեք Կարգավորել վերլուծությունը՝ ձեր վերլուծությունը կարգավորելու համար:
- Ընտրեք այս կարգավորումները ձեր վերլուծության համար:
- WHERE վահանակում ընտրեք Local Host:
- WHAT վահանակում ընտրեք Գործարկել հավելվածը և նշեք iso3dfd_omp_offload երկուականը որպես պրոֆիլի հավելված:file.
- ԻՆՉՊԵՍ պատուհանում ընտրեք GPU-ի բեռնաթափման վերլուծության տեսակը Անալիզի ծառի արագացուցիչների խմբից:
- Սեղմեք «Սկսել» կոճակը՝ վերլուծությունը կատարելու համար:
VTune Profiler-ը հավաքում է տվյալներ և ցուցադրում վերլուծության արդյունքները GPU Offload-ում viewկետ.
- Ամփոփման պատուհանում տես CPU-ի և GPU-ի ռեսուրսների օգտագործման վիճակագրությունը: Օգտագործեք այս տվյալները՝ որոշելու համար, թե արդյոք ձեր դիմումը հետևյալն է.
- GPU-ով կապված
- CPU-ով կապված
- Ձեր համակարգի հաշվողական ռեսուրսների անարդյունավետ օգտագործումը
- Օգտագործեք Պլատֆորմի պատուհանի տեղեկատվությունը, որպեսզի տեսնեք հիմնական պրոցեսորի և GPU-ի չափումները:
- Գրաֆիկա պատուհանում ուսումնասիրեք որոշակի հաշվողական առաջադրանքներ:
Ավելի խորը վերլուծության համար տե՛ս համապատասխան բաղադրատոմսը VTune Pro-ումfiler Performance Analysis Cookbook. Կարող եք նաև շարունակել ձեր պրոֆիլավորումը GPU Compute/Media Hotspots վերլուծության միջոցով:
Example: Profile SYCL* հավելված Windows-ում*
Profile ինչպեսample matrix_multiply SYCL հավելվածը Intel® VTune™ Pro-ովfiler. Ծանոթացեք արտադրանքին և հասկացեք GPU-ով կապված հավելվածների համար հավաքագրված վիճակագրությունը:
Նախադրյալներ
- Համոզվեք, որ ձեր համակարգում տեղադրված է Microsoft* Visual Studio (v2017 կամ ավելի նոր տարբերակ):
- Տեղադրեք Intel VTune Pro-նfiler Intel® oneAPI Base Toolkit-ից կամ Intel® System Bring-up Toolkit-ից: Այս գործիքակազմերը պարունակում են Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) կոմպիլյատոր, որն անհրաժեշտ է պրոֆիլավորման գործընթացի համար:
- Ստեղծեք շրջակա միջավայրի փոփոխականներ: Կատարեք vars.bat սցենարը, որը գտնվում է \env գրացուցակ:
- Համոզվեք, որ Intel oneAPI DPC++ Compiler-ը (տեղադրված է Intel oneAPI Base գործիքակազմով) ինտեգրված է Microsoft Visual Studio-ին:
- Կազմեք կոդը՝ օգտագործելով -gline-tables-only և -fdebug-info-for-profiling տարբերակները Intel oneAPI DPC++ Compiler-ի համար:
- Ստեղծեք ձեր համակարգը GPU վերլուծության համար:
Intel VTune Pro-ի տեղադրման մասին տեղեկությունների համարfiler Microsoft* Visual Studio միջավայրում, տես VTune Profiler Օգտագործողի ուղեցույց:
Կառուցեք Matrix հավելվածը
Ներբեռնեք matrix_multiply_vtune կոդը sampփաթեթ Intel oneAPI գործիքակազմի համար: Սա պարունակում է սample որը կարող եք օգտագործել կառուցելու և պրոֆfile SYCL հավելված:
- Բացեք Microsoft* Visual Studio-ն:
- Սեղմեք File > Բացել > Նախագիծ/Լուծում: Գտեք matrix_multiply_vtune թղթապանակը և ընտրեք matrix_multiply.sln:
- Կառուցեք այս կոնֆիգուրացիան (Project > Build):
- Գործարկեք ծրագիրը (Վրիպազերծում > Սկսեք առանց վրիպազերծման):
- s-ի DPC++ կամ թելային տարբերակ ընտրելու համարample, օգտագործել նախապրոցեսորի սահմանումներ:
- Գնալ դեպի Ծրագրի հատկություններ > DPC++ > Նախապրոցեսոր > Նախամշակողի սահմանում:
- Սահմանեք icpx -fsycl կամ USE_THR:
Գործարկեք GPU-ի վերլուծությունը
Գործարկեք GPU վերլուծություն Matrix s-ի վրաampլե.
- Visual Studio-ի գործիքագոտուց սեղմեք «Կարգավորել վերլուծություն» կոճակը:
Բացվում է «Կարգավորել վերլուծության» պատուհանը: Լռելյայնորեն, այն ժառանգում է ձեր VS նախագծի կարգավորումները և նշում է matrix_multiply.exe-ը որպես պրոֆիլի հավելված:file. - Կարգավորել վերլուծության պատուհանում սեղմեք կոճակը
Թերթիր կոճակը HOW վահանակում:
- Վերլուծության ծառի արագացուցիչների խմբից ընտրեք GPU Compute/Media Hotspots վերլուծության տեսակը:
- Սեղմեք «Սկսել» կոճակը՝ վերլուծությունը նախապես սահմանված տարբերակներով սկսելու համար:
Գործարկեք GPU-ի վերլուծությունը հրամանի տողից.
- Բացեք սample տեղեկատու:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - Այս գրացուցակում բացեք Visual Studio* նախագիծը file անվանմամբ matrix_multiply.sln
- The multiply.cpp file պարունակում է մատրիցային բազմապատկման մի քանի տարբերակներ: Ընտրեք տարբերակ՝ խմբագրելով համապատասխան #define MULTIPLY տողը multiply.hpp-ում
- Կառուցեք ամբողջ նախագիծը Release կոնֆիգուրացիայով:
Սա ստեղծում է գործարկիչ, որը կոչվում է matrix_multiply.exe: - Պատրաստեք համակարգը GPU վերլուծություն գործարկելու համար: Տե՛ս Set Up System GPU-ի վերլուծության համար:
- Սահմանել VTune Pro-նfiler միջավայրի փոփոխականներ՝ գործարկելով խմբաքանակը file: արտահանում \env\vars.bat
- Գործարկեք վերլուծության հրամանը.
vtune.exe - հավաքել gpu-offload — matrix_multiply.exe
VTune Profiler-ը հավաքում է տվյալներ և ցուցադրում վերլուծության արդյունքները GPU Compute/Media Hotspots-ում viewկետ. Ամփոփման պատուհանում տես CPU-ի և GPU-ի ռեսուրսների օգտագործման վիճակագրությունը՝ հասկանալու համար, թե արդյոք ձեր հավելվածը կապված է GPU-ի հետ: Անցեք գրաֆիկայի պատուհան՝ տեսնելու հիմնական պրոցեսորի և պրոցեսորի ցուցիչները, որոնք ներկայացնում են ժամանակի ընթացքում կոդի կատարումը:
Սկսեք Intel® VTune™ Pro-ովfiler Linux* OS-ի համար
Նախքան սկսելը
- Տեղադրեք Intel® VTune™ Pro-նfiler ձեր Linux* համակարգում:
- Կառուցեք ձեր հավելվածը խորհրդանիշի տեղեկություններով և թողարկման ռեժիմում՝ միացված բոլոր օպտիմալացումներով: Կոմպիլյատորի կարգավորումների վերաբերյալ մանրամասն տեղեկությունների համար տես VTune Pro-նfiler առցանց օգտագործողի ուղեցույց:
Կարող եք նաև օգտագործել մատրիցը sampհայտը հասանելի է \սample\matrix. Դուք կարող եք տեսնել սampհանգեցնում է \սample (մատրիցա). - Սահմանեք շրջակա միջավայրի փոփոխականները՝ աղբյուրը /setvars.sh
Լռելյայնորեն, որ է:- $HOME/intel/oneapi/ երբ տեղադրվում է օգտագործողի թույլտվություններով;
- /opt/intel/oneapi/ երբ տեղադրվում է արմատային թույլտվություններով:
Քայլ 1. Սկսեք VTune Pro-նfiler
Սկսեք VTune Pro-նfiler այս եղանակներից մեկի միջոցով.
Աղբյուր / Սկսել VTune Pro-նfiler
Անկախ/IDE (GUI)
- Գործարկեք vtunegui հրամանը: VTune Pro-ն սկսելու համարfiler Intel System Studio IDE-ից ընտրեք Գործիքներ > VTune Profiler > Գործարկել VTune Pro-նfiler. Սա սահմանում է շրջակա միջավայրի բոլոր համապատասխան փոփոխականները և գործարկում է արտադրանքի ինքնուրույն ինտերֆեյսը:
- Երբ GUI-ն բացվի, սեղմեք ՆՈՐ ՆԱԽԱԳԻԾ ողջույնի էկրանին:
- Ստեղծել նախագիծ երկխոսության վանդակում նշեք նախագծի անվանումը և գտնվելու վայրը:
- Սեղմեք Ստեղծել նախագիծ:
Անկախ (հրամանի տող)
- Գործարկեք vtune հրամանը:
Քայլ 2. Կազմաձևեք և գործարկեք վերլուծությունը
Նոր նախագիծ ստեղծելուց հետո «Կարգավորել վերլուծության» պատուհանը բացվում է այս լռելյայն արժեքներով.
- Գործարկման հավելված բաժնում դիտեք ձեր հավելվածի գտնվելու վայրը:
- Կտտացրեք «Սկսել»՝ ձեր հավելվածի վրա «Performance Snapshot» գործարկելու համար: Այս վերլուծությունը ներկայացնում է ընդհանուր ավարտview նպատակային համակարգում ձեր հավելվածի կատարման վրա ազդող խնդիրներ:
Քայլ 3: View և վերլուծել կատարողականի տվյալները
Երբ տվյալների հավաքագրումն ավարտվի, VTune Pro-նfiler-ը ցուցադրում է վերլուծության արդյունքները Ամփոփման պատուհանում: Այստեղ դուք տեսնում եք ավարտված ներկայացումview ձեր դիմումի.
Ավարտըview սովորաբար ներառում է մի քանի չափումներ՝ դրանց նկարագրությունների հետ մեկտեղ:
- A Ընդարձակեք յուրաքանչյուր չափանիշ՝ նպաստող գործոնների մասին մանրամասն տեղեկություններ ստանալու համար:
- B Նշված չափանիշը ցույց է տալիս ընդունելի/նորմալ աշխատանքային միջակայքից դուրս արժեք: Օգտագործեք գործիքների խորհուրդները՝ հասկանալու համար, թե ինչպես բարելավել դրոշակավորված չափանիշը:
- C Տեսեք ուղեցույց այլ վերլուծությունների վերաբերյալ, որոնք դուք պետք է հաշվի առնեք հաջորդիվ: Վերլուծության ծառը կարևորում է այս առաջարկությունները:
Հաջորդ քայլերը
Performance Snapshot-ը լավ մեկնարկային կետ է VTune Pro-ի հետ հավելվածի կատարողականի ընդհանուր գնահատական ստանալու համարfiler. Հաջորդը, ստուգեք, արդյոք ձեր ալգորիթմը պահանջում է թյունինգ:
- Հետևեք ձեռնարկին` վերլուծելու ընդհանուր կատարողական խոչընդոտները:
- Երբ ձեր ալգորիթմը լավ կարգավորվի, նորից գործարկեք Performance Snapshot-ը՝ արդյունքները չափորոշելու և այլ ոլորտներում կատարողականի հնարավոր բարելավումները հայտնաբերելու համար:
Տես նաև
Միկրոճարտարապետության հետախուզում
VTune Profiler Օգնության շրջագայություն
Example: Profile OpenMP հավելված Linux-ում*
Օգտագործեք Intel VTune Pro-նfiler Linux մեքենայի վրա պրոֆfile ինչպեսample iso3dfd_omp_offload OpenMP հավելվածը բեռնված է Intel GPU-ի վրա: Իմացեք, թե ինչպես վարել GPU-ի վերլուծությունը և ուսումնասիրել արդյունքները:
Նախադրյալներ
- Համոզվեք, որ ձեր համակարգն աշխատում է Linux* OS միջուկ 4.14 կամ ավելի նոր տարբերակով:
- Օգտագործեք Intel Processor Graphics-ի այս տարբերակներից մեկը.
- Gen 8
- Gen 9
- Gen 11
- Ձեր համակարգը պետք է աշխատի այս Intel պրոցեսորներից մեկի վրա.
- 7-րդ սերնդի Intel® Core™ i7 պրոցեսորներ (կոդային անունը Kaby Lake)
- 8-րդ սերնդի Intel® Core™ i7 պրոցեսորներ (կոդային անվանումը Coffee Lake)
- 10-րդ սերնդի Intel® Core™ i7 պրոցեսորներ (կոդային անվանումը Ice Lake)
- Linux GUI-ի համար օգտագործեք՝
- GTK+ տարբերակ 2.10 կամ ավելի նոր (2.18 և ավելի նոր տարբերակները խորհուրդ են տրվում)
- Pango տարբերակ 1.14 կամ ավելի նոր
- X.Org տարբերակ 1.0 կամ ավելի նոր (1.7 և ավելի նոր տարբերակները խորհուրդ են տրվում)
- Տեղադրեք Intel VTune Pro-նfiler այս աղբյուրներից մեկից.
- Անկախ արտադրանքի ներբեռնում
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Ներբեռնեք Intel® oneAPI HPC Toolkit-ը, որը պարունակում է Intel® oneAPI DPC++/C++ Կազմող (icx/icpx), որը դուք պետք է պատրաստեք:file OpenMP հավելվածներ.
- Ստեղծեք շրջակա միջավայրի փոփոխականներ: Կատարեք vars.sh սցենարը:
- Ստեղծեք ձեր համակարգը GPU վերլուծության համար:
Կառուցեք և կազմեք OpenMP Offload հավելվածը
- Ներբեռնեք iso3dfd_omp_offload OpenMP Offload sampլե.
- Բաց դեպի սampտեղեկատու.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Կազմեք OpenMP Offload հավելվածը:
mkdir կառուցել;
cmake -DVERIFY_RESULTS=0 ..
կատարել -ջ
Սա առաջացնում է src/iso3dfd գործարկվող:
Ծրագիրը ջնջելու համար մուտքագրեք.
մաքրել
Սա հեռացնում է գործարկվողը և օբյեկտը files, որոնք ստեղծել եք make հրամանով:
Գործարկեք GPU-ի վերլուծություն OpenMP Offload հավելվածում
Այժմ դուք պատրաստ եք գործարկել GPU-ի բեռնաթափման վերլուծությունը ձեր կազմած OpenMP հավելվածում:
- Բացեք VTune Pro-նfiler և սեղմեք Նոր նախագիծ՝ նախագիծ ստեղծելու համար:
- Ողջույնի էջում սեղմեք Կարգավորել վերլուծությունը՝ ձեր վերլուծությունը կարգավորելու համար:
- Ընտրեք այս կարգավորումները ձեր վերլուծության համար:
- WHERE վահանակում ընտրեք Local Host:
- WHAT վահանակում ընտրեք Գործարկել հավելվածը և նշեք iso3dfd_omp_offload երկուականը որպես պրոֆիլի հավելված:file.
- ԻՆՉՊԵՍ պատուհանում ընտրեք GPU-ի բեռնաթափման վերլուծության տեսակը Անալիզի ծառի արագացուցիչների խմբից:
- Սեղմեք «Սկսել» կոճակը՝ վերլուծությունը կատարելու համար:
VTune Profiler-ը հավաքում է տվյալներ և ցուցադրում վերլուծության արդյունքները GPU Offload-ում viewկետ.
- Ամփոփման պատուհանում տես CPU-ի և GPU-ի ռեսուրսների օգտագործման վիճակագրությունը: Օգտագործեք այս տվյալները՝ որոշելու համար, թե արդյոք ձեր դիմումը հետևյալն է.
- GPU-ով կապված
- CPU-ով կապված
- Ձեր համակարգի հաշվողական ռեսուրսների անարդյունավետ օգտագործումը
- Օգտագործեք Պլատֆորմի պատուհանի տեղեկատվությունը, որպեսզի տեսնեք հիմնական պրոցեսորի և GPU-ի չափումները:
- Գրաֆիկա պատուհանում ուսումնասիրեք որոշակի հաշվողական առաջադրանքներ:
Ավելի խորը վերլուծության համար տե՛ս համապատասխան բաղադրատոմսը VTune Pro-ումfiler Performance Analysis Cookbook. Կարող եք նաև շարունակել ձեր պրոֆիլավորումը GPU Compute/Media Hotspots վերլուծության միջոցով:
Example: Profile SYCL* հավելված Linux*
Օգտագործեք VTune Pro-նfiler հետ որպեսample matrix_multiply SYCL հավելվածը արագ ծանոթանալու արտադրանքին և վիճակագրությանը, որը հավաքագրվում է GPU-ով կապված հավելվածների համար:
Նախադրյալներ
- Տեղադրեք VTune Pro-նfiler և Intel® oneAPI DPC++/C++ Կազմող՝ Intel® OneAPI Base Toolkit-ից կամ Intel® System Bring-up Toolkit-ից:
- Ստեղծեք միջավայրի փոփոխականներ՝ գործարկելով vars.sh սկրիպտը:
- Ստեղծեք ձեր համակարգը GPU վերլուծության համար:
Կառուցեք Matrix հավելվածը
Ներբեռնեք matrix_multiply_vtune կոդը sampփաթեթ Intel oneAPI գործիքակազմի համար: Սա պարունակում է սample որը կարող եք օգտագործել կառուցելու և պրոֆfile SYCL հավելված:
Profile SYCL հավելված, համոզվեք, որ կազմեք կոդը՝ օգտագործելով -gline-tables-only և -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler տարբերակները:
Այս կազմելու համար սampհայտում կատարեք հետևյալը.
- Գնալ դեպի սampտեղեկատու.
cd <sample_dir/VtuneProfiler/matrix_multiply> - The multiply.cpp file src թղթապանակում պարունակում է մատրիցային բազմապատկման մի քանի տարբերակներ: Ընտրեք տարբերակ՝ խմբագրելով համապատասխան #define MULTIPLY տողը multiply.h-ում:
- Կառուցեք հավելվածը՝ օգտագործելով գոյություն ունեցող Make-ըfile:
cmake .
դարձնել
Սա պետք է ստեղծի matrix.icpx -fsycl գործարկվող:
Ծրագիրը ջնջելու համար մուտքագրեք.
մաքրել
Սա հեռացնում է գործարկվողը և օբյեկտը fileներ, որոնք ստեղծվել են make հրամանով:
Գործարկեք GPU-ի վերլուծությունը
Գործարկեք GPU վերլուծություն Matrix s-ի վրաampլե.
- Գործարկեք VTune Pro-նfiler vtune-gui հրամանով:
- Ողջույնի էջից սեղմեք Նոր նախագիծ:
- Նշեք ձեր անունն ու գտնվելու վայրըample project և սեղմեք Ստեղծել նախագիծ:
- WHAT վահանակում դիտեք matrix.icpx-fsycl file.
- ԻՆՉՊԵՍ վահանակում սեղմեք կոճակը
Զննեք կոճակը և ընտրեք GPU Compute/Media Hotspots վերլուծություն արագացուցիչների խմբից Անալիզի ծառի մեջ:
- Սեղմեք «Սկսել» կոճակը ներքևում՝ վերլուծությունը նախապես ընտրված տարբերակներով սկսելու համար:
Գործարկեք GPU-ի վերլուծությունը հրամանի տողից.
- Պատրաստեք համակարգը GPU վերլուծություն գործարկելու համար: Տե՛ս Set Up System GPU-ի վերլուծության համար:
- Ստեղծեք միջավայրի փոփոխականներ Intel ծրագրային գործիքների համար.
աղբյուր $ONEAPI_ROOT/setvars.sh - Գործարկեք GPU Compute/Media Hotspots վերլուծությունը.
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
Ամփոփ հաշվետվությունը տեսնելու համար մուտքագրեք.
vtune -report summary -r ./result_gpu-hotspots
VTune Profiler-ը հավաքում է տվյալներ և ցուցադրում վերլուծության արդյունքները GPU Compute/Media Hotspots-ում viewկետ. Ամփոփման պատուհանում տես CPU-ի և GPU-ի ռեսուրսների օգտագործման վիճակագրությունը՝ հասկանալու համար, թե արդյոք ձեր հավելվածը կապված է GPU-ի հետ: Անցեք գրաֆիկայի պատուհան՝ տեսնելու հիմնական պրոցեսորի և պրոցեսորի ցուցիչները, որոնք ներկայացնում են ժամանակի ընթացքում կոդի կատարումը:
Սկսեք Intel® VTune™ Pro-ովfiler macOS-ի համար*
Օգտագործեք VTune Pro-նfiler macOS համակարգում՝ ոչ macOS համակարգում հեռավոր թիրախային վերլուծություն կատարելու համար (միայն Linux* կամ Android*):
Դուք չեք կարող օգտագործել VTune Pro-նfiler macOS միջավայրում այս նպատակների համար.
- Profile macOS համակարգը, որի վրա այն տեղադրված է:
- Հավաքեք տվյալներ հեռավոր macOS համակարգի վրա:
MacOS հոսթից հեռակա Linux* կամ Android* թիրախի կատարումը վերլուծելու համար կատարեք հետևյալ քայլերից մեկը.
- Գործարկել VTune Pro-նfiler վերլուծություն macOS համակարգի վրա՝ որպես թիրախ նշված հեռավոր համակարգով: Երբ վերլուծությունը սկսվում է, VTune Profiler-ը միանում է հեռավոր համակարգին՝ տվյալներ հավաքելու համար, այնուհետև արդյունքները վերադարձնում է macOS հոսթին viewինգ.
- Տեղադրեք վերլուծություն թիրախային համակարգի վրա և պատճենեք արդյունքները macOS համակարգում viewաշխատել VTune Pro-ումfiler.
Այս փաստաթղթի քայլերը ենթադրում են հեռավոր Linux թիրախային համակարգ և հավաքում են կատարողականի տվյալներ՝ օգտագործելով SSH մուտքը VTune Pro-ից:filer macOS հյուրընկալող համակարգի վրա:
Նախքան սկսելը
- Տեղադրեք Intel® VTune™ Pro-նfiler ձեր macOS* համակարգում:
- Կառուցեք ձեր Linux հավելվածը սիմվոլի տեղեկություններով և թողարկման ռեժիմում՝ միացված բոլոր օպտիմիզացումներով: Մանրամասն տեղեկությունների համար տե՛ս VTune Pro-ի կոմպիլյատորի կարգավորումներըfiler օգնություն.
- Սահմանեք SSH մուտքը հյուրընկալող macOS համակարգից դեպի թիրախային Linux համակարգ՝ առանց գաղտնաբառի ռեժիմում աշխատելու համար:
Քայլ 1. Սկսեք VTune Pro-նfiler
- Գործարկեք VTune Pro-նfiler vtune-gui հրամանով:
Լռելյայնորեն, որ /opt/intel/oneapi/ է: - Երբ GUI-ն բացվի, սեղմեք ՆՈՐ ՆԱԽԱԳԻԾ ողջույնի էկրանին:
- Ստեղծել նախագիծ երկխոսության վանդակում նշեք նախագծի անվանումը և գտնվելու վայրը:
- Սեղմեք Ստեղծել նախագիծ:
Քայլ 2. Կազմաձևեք և գործարկեք վերլուծությունը
Նոր նախագիծ ստեղծելուց հետո «Կարգավորել վերլուծության» պատուհանը բացվում է Performance Snapshot վերլուծության տիպով:
Այս վերլուծությունը ներկայացնում է ավարտview խնդիրներ, որոնք ազդում են թիրախային համակարգում ձեր հավելվածի կատարման վրա:
- WHERE վահանակում ընտրեք Remote Linux (SSH) և նշեք թիրախային Linux համակարգը՝ օգտագործելով username@ hostname[:port]:
VTune Profiler-ը միանում է Linux համակարգին և տեղադրում թիրախային փաթեթը: - WHAT վահանակում տրամադրեք ձեր հավելվածի ուղին թիրախային Linux համակարգում:
- Սեղմեք «Սկսել» կոճակը՝ «Performance Snapshot»-ը հավելվածում գործարկելու համար:
Քայլ 3: View և վերլուծել կատարողականի տվյալները
Երբ տվյալների հավաքագրումն ավարտվի, VTune Pro-նfiler-ը ցուցադրում է վերլուծության արդյունքները macOS համակարգում: Սկսեք ձեր վերլուծությունը Ամփոփման պատուհանում: Այստեղ դուք տեսնում եք ավարտված ներկայացումview ձեր դիմումի.
Ավարտըview սովորաբար ներառում է մի քանի չափումներ՝ դրանց նկարագրությունների հետ մեկտեղ:
- A Ընդարձակեք յուրաքանչյուր չափանիշ՝ նպաստող գործոնների մասին մանրամասն տեղեկություններ ստանալու համար:
- B Նշված չափանիշը ցույց է տալիս ընդունելի/նորմալ աշխատանքային միջակայքից դուրս արժեք: Օգտագործեք գործիքների խորհուրդները՝ հասկանալու համար, թե ինչպես բարելավել դրոշակավորված չափանիշը:
- C Տեսեք ուղեցույց այլ վերլուծությունների վերաբերյալ, որոնք դուք պետք է հաշվի առնեք հաջորդիվ: Վերլուծության ծառը կարևորում է այս առաջարկությունները:
Հաջորդ քայլերը
Performance Snapshot-ը լավ մեկնարկային կետ է VTune Pro-ի հետ հավելվածի կատարողականի ընդհանուր գնահատական ստանալու համարfiler.
Հաջորդը, ստուգեք, արդյոք ձեր ալգորիթմը պահանջում է թյունինգ:
- Գործարկեք Hotspots Analysis-ը ձեր հավելվածում:
- Հետևեք Hotspots ձեռնարկին: Իմացեք մեթոդներ՝ ձեր թեժ կետերի վերլուծությունից առավելագույն օգուտ քաղելու համար:
- Երբ ձեր ալգորիթմը լավ կարգավորվի, նորից գործարկեք Performance Snapshot-ը՝ արդյունքները չափորոշելու և այլ ոլորտներում կատարողականի հնարավոր բարելավումները հայտնաբերելու համար:
Տես նաև
Միկրոճարտարապետության հետախուզում
VTune Profiler Օգնության շրջագայություն
Իմացեք ավելին
Փաստաթուղթ / նկարագրություն
- Օգտագործողի ուղեցույց
Օգտագործողի ուղեցույցը VTune Pro-ի հիմնական փաստաթղթերն ենfiler.
ԾԱՆՈԹԱԳՐՈՒԹՅՈՒՆ
Կարող եք նաև ներբեռնել VTune Pro-ի օֆլայն տարբերակըfiler փաստաթղթեր. - Առցանց ուսուցում
Առցանց ուսուցման կայքը հիանալի ռեսուրս է VTune Pro-ի հիմունքները սովորելու համարfiler Սկսելու ուղեցույցներով, տեսանյութերով, ձեռնարկներով, webinars, եւ տեխնիկական հոդվածներ. - Խոհարարական գիրք
Կատարման վերլուծության խոհարարական գիրք, որը պարունակում է բաղադրատոմսեր՝ բացահայտելու և լուծելու կատարողականի հանրաճանաչ խնդիրները՝ օգտագործելով վերլուծության տեսակները VTune Pro-ումfiler. - Տեղադրման ուղեցույց Windows-ի համար | Linux | macOS-ի հյուրընկալողներ
Տեղադրման ուղեցույցը պարունակում է VTune Pro-ի տեղադրման հիմնական հրահանգներfiler և տեղադրումից հետո կազմաձևման հրահանգներ տարբեր վարորդների և կոլեկտորների համար: - Ձեռնարկներ
VTune Profiler ձեռնարկները ուղղորդում են նոր օգտվողին հիմնական հատկանիշների միջոցով կարճ s-ովampհայտը. - Թողարկման նշումներ
Գտեք տեղեկատվություն VTune Pro-ի վերջին տարբերակի մասինfiler, ներառյալ նոր հնարավորությունների, համակարգի պահանջների և լուծված տեխնիկական խնդիրների համապարփակ նկարագրությունը:
VTune Pro-ի առանձին և գործիքակազմ տարբերակների համարfiler, հասկանալ ընթացիկ Համակարգի պահանջները:
Ծանուցումներ և հերքումներ
Intel-ի տեխնոլոգիաները կարող են պահանջել միացված ապարատային, ծրագրային ապահովում կամ ծառայության ակտիվացում:
Ոչ մի ապրանք կամ բաղադրիչ չի կարող բացարձակապես ապահով լինել:
Ձեր ծախսերն ու արդյունքները կարող են տարբեր լինել:
© Intel Corporation. Intel-ը, Intel-ի պատկերանշանը և Intel այլ նշանները Intel Corporation-ի կամ նրա դուստր ձեռնարկությունների ապրանքանիշերն են: Այլ անուններ և ապրանքանիշեր կարող են պահանջվել որպես ուրիշների սեփականություն:
Intel-ը, Intel-ի լոգոն, Intel Atom-ը, Intel Core-ը, Intel Xeon Phi-ն, VTune-ը և Xeon-ը Intel Corporation-ի ապրանքանիշերն են ԱՄՆ-ում և/կամ այլ երկրներում:
*Այլ անուններ և ապրանքանիշեր կարող են պահանջվել որպես ուրիշների սեփականություն:
Microsoft-ը, Windows-ը և Windows-ի լոգոն Microsoft Corporation-ի ապրանքանիշերն են կամ գրանցված ապրանքային նշանները Միացյալ Նահանգներում և/կամ այլ երկրներում:
Java-ն Oracle-ի և/կամ նրա դուստր ձեռնարկությունների գրանցված ապրանքային նշանն է:
OpenCL-ը և OpenCL լոգոն Apple Inc.-ի ապրանքանիշերն են, որոնք օգտագործվում են Khronos-ի թույլտվությամբ:
Intel-ի տեխնոլոգիաները կարող են պահանջել միացված ապարատային, ծրագրային ապահովում կամ ծառայության ակտիվացում:
Ոչ մի ապրանք կամ բաղադրիչ չի կարող բացարձակապես ապահով լինել:
Ձեր ծախսերն ու արդյունքները կարող են տարբեր լինել:
© Intel Corporation. Intel-ը, Intel-ի պատկերանշանը և Intel այլ նշանները Intel Corporation-ի կամ նրա դուստր ձեռնարկությունների ապրանքանիշերն են: Այլ անուններ և ապրանքանիշեր կարող են պահանջվել որպես ուրիշների սեփականություն:
Intel-ը, Intel-ի լոգոն, Intel Atom-ը, Intel Core-ը, Intel Xeon Phi-ն, VTune-ը և Xeon-ը Intel Corporation-ի ապրանքանիշերն են ԱՄՆ-ում և/կամ այլ երկրներում:
*Այլ անուններ և ապրանքանիշեր կարող են պահանջվել որպես ուրիշների սեփականություն:
Microsoft-ը, Windows-ը և Windows-ի լոգոն Microsoft Corporation-ի ապրանքանիշերն են կամ գրանցված ապրանքային նշանները Միացյալ Նահանգներում և/կամ այլ երկրներում:
Java-ն Oracle-ի և/կամ նրա դուստր ձեռնարկությունների գրանցված ապրանքային նշանն է:
OpenCL-ը և OpenCL լոգոն Apple Inc.-ի ապրանքանիշերն են, որոնք օգտագործվում են Khronos-ի թույլտվությամբ:
Փաստաթղթեր / ռեսուրսներ
![]() |
intel Սկսեք VTune Pro-ովfiler [pdf] Օգտագործողի ուղեցույց Սկսեք VTune Pro-ովfiler, Սկսեք, VTune Pro-ի հետfiler, VTune Profiler |