intel شروع ڪريو VTune Pro سانfiler
Intel® VTune™ پرو سان شروع ڪريوfiler
استعمال ڪريو Intel VTune Profileونڊوز *، macOS*، ۽ لينڪس * ميزبانن مان مقامي ۽ ريموٽ ٽارگيٽ سسٽم جو تجزيو ڪرڻ لاءِ. انهن عملن ذريعي ايپليڪيشن ۽ سسٽم جي ڪارڪردگي بهتر ڪريو:
- الگورتھم جي اختيارن جو تجزيو ڪريو.
- ڳولھيو سيريل ۽ متوازي ڪوڊ bottlenecks.
- سمجھو ته ڪٿي ۽ ڪيئن توھان جي ايپليڪيشن دستياب هارڊويئر وسيلن مان فائدو حاصل ڪري سگھي ٿي.
- توهان جي اپليڪيشن جي عمل کي تيز ڪريو.
ڊائون لوڊ ڪريو Intel VTune Profileتوهان جي سسٽم تي انهن طريقن مان هڪ ذريعي: - Standalone ورجن ڊائون لوڊ ڪريو.
- حاصل ڪريو Intel VTune Profiler Intel® oneAPI بيس ٽول کٽ جي حصي جي طور تي.
ڏسو VTune Profileوڊيوز لاءِ تربيتي صفحو، webinars، ۽ وڌيڪ مواد توهان کي شروع ڪرڻ ۾ مدد ڪرڻ لاء.
نوٽ
Intel® VTune™ Pro جي نسخن لاءِ دستاويزfiler 2021 رليز کان پهريان صرف ڊائون لوڊ لاءِ دستياب آهن. پراڊڪٽ ورزن طرفان دستياب دستاويزن جي ڊائون لوڊ جي فهرست لاءِ، هي صفحا ڏسو:
- Intel Parallel Studio XE لاءِ دستاويز ڊائون لوڊ ڪريو
- Intel System Studio لاءِ دستاويز ڊائون لوڊ ڪريو
سمجھو ڪم فلو
استعمال ڪريو Intel VTune Profiler کان پروfile ڪارڪردگي بهتر ڪرڻ لاءِ هڪ ايپليڪيشن ۽ نتيجن جو تجزيو.
عام ڪم فلو انهن مرحلن تي مشتمل آهي:
شروع ڪرڻ لاءِ پنھنجو ھوسٽ سسٽم چونڊيو
ونڊوز*، لينڪس*، يا macOS* لاءِ سسٽم-مخصوص ورڪ فلوز بابت وڌيڪ سکو.
Intel® VTune™ پرو سان شروع ڪريوfiler Windows* OS لاءِ
توھان کان اڳ شروع ڪريو
- انسٽال ڪريو Intel® VTune™ Profiler توهان جي ونڊوز * سسٽم تي.
- پنھنجي ايپليڪيشن کي علامت جي معلومات سان ٺاھيو ۽ رليز موڊ ۾ سڀني اصلاحن سان. گڏ ڪرڻ واري سيٽنگن تي تفصيلي ڄاڻ لاء، ڏسو VTune Profiler آن لائن استعمال ڪندڙ ھدايت.
توھان پڻ استعمال ڪري سگھو ٿا ميٽرڪس ايسamp۾ موجود درخواست \VTune\Sampليس\ميٽرڪس. توھان ڏسي سگھو ٿا لاڳاپيل sampجي نتيجي ۾ \VTune\Projects\sampلي (ميٽرڪس). - ماحوليات جي متغيرن کي ترتيب ڏيو: ھلايو \setvars.bat اسڪرپٽ.
ڊفالٽ طور، جي oneAPI اجزاء لاءِ پروگرام آھي Files (x86)\Intel\oneAPI.
نوٽ Intel® VTune™ Pro استعمال ڪرڻ وقت توهان کي setvars.bat هلائڻ جي ضرورت ناهيfiler Microsoft * Visual Studio * اندر.
قدم 1: Intel® VTune™ پرو شروع ڪريوfiler
Intel VTune Pro شروع ڪريوfiler انهن طريقن مان هڪ ذريعي ۽ هڪ پروجيڪٽ قائم ڪريو. هڪ پروجيڪٽ ايپليڪيشن لاءِ هڪ ڪنٽينر آهي جنهن جو توهان تجزيو ڪرڻ چاهيو ٿا، تجزيو جو قسم، ۽ ڊيٽا گڏ ڪرڻ جا نتيجا.
ذريعو / VTune پرو شروع ڪريوfiler
اسٽينڊل (GUI)
- vtune-gui ڪمانڊ کي ھلايو يا Intel® VTune™ پرو ھلايوfiler شروع مينيو مان.
- جڏهن GUI کلي ٿو، ڪلڪ ڪريو ڀليڪار اسڪرين ۾.
- ۾ ٺاهيو پروجيڪٽ ڊائلاگ باڪس، وضاحت ڪريو منصوبي جو نالو ۽ مقام.
- ڪلڪ ڪريو Create Project .
اسٽينڊل (ڪمانڊ لائن)
vtune حڪم هلايو.
Microsoft* Visual Studio* IDE
پنهنجو حل کوليو Visual Studio ۾. VTune پروfiler ٽول بار خودڪار طريقي سان چالو ڪيو ويو آهي ۽ توهان جي بصري اسٽوڊيو پروجيڪٽ کي هڪ تجزيو ٽارگيٽ طور مقرر ڪيو ويو آهي.
نوٽ
Intel® VTune™ Pro هلائڻ دوران توهان کي پروجيڪٽ ٺاهڻ جي ضرورت ناهيfiler ڪمانڊ لائن مان يا Microsoft * Visual Studio جي اندر.
مرحلا 2: ترتيب ڏيو ۽ تجزيو ڪريو
هڪ نئون پروجيڪٽ ٺاهڻ کان پوءِ، ڪنفيگر تجزيي ونڊو هنن ڊفالٽ ويلز سان کلي ٿي:
- لانچ ائپليڪيشن سيڪشن ۾، براؤز ڪريو توھان جي ايپليڪيشن جي جڳھ تي عملدرآمد قابل file.
- پنھنجي ايپليڪيشن تي پرفارمنس سنيپ شاٽ هلائڻ لاءِ Start تي ڪلڪ ڪريو. هي تجزيو هڪ عام اوور پيش ڪري ٿوview مسئلن جو ٽارگيٽ سسٽم تي توهان جي ايپليڪيشن جي ڪارڪردگي کي متاثر ڪري ٿو.
قدم 3: View ۽ ڪارڪردگي ڊيٽا جو تجزيو
جڏهن ڊيٽا گڏ ڪرڻ مڪمل ٿئي ٿي، VTune Profiler ڏيکاري ٿو تجزيو جا نتيجا خلاصو ونڊو ۾. هتي، توهان هڪ ڪارڪردگي تي ڏسنداview توهان جي اپليڪيشن جو.
مٿانview عام طور تي انهن جي وضاحتن سان گڏ ڪيترائي ميٽرڪ شامل آهن.
- A تعاون ڪندڙ عنصر بابت تفصيلي ڄاڻ لاءِ هر ميٽرڪ کي وڌايو.
- B هڪ پرچم ٿيل ميٽرڪ اشارو ڏئي ٿو هڪ قدر قابل قبول/عام آپريٽنگ حد کان ٻاهر. استعمال ڪريو ٽول ٽائيپ سمجھڻ لاءِ ته جھنڊو ٿيل ميٽرڪ کي ڪيئن بهتر بڻايو وڃي.
- C ٻين تجزين تي ھدايت ڏسو توھان کي اڳتي ھلڻ تي غور ڪرڻ گھرجي. تجزياتي وڻ انهن سفارشن کي نمايان ڪري ٿو.
ايندڙ قدم
ڪارڪردگي سنيپ شاٽ هڪ سٺو شروعاتي نقطو آهي VTune پرو سان ايپليڪيشن ڪارڪردگي جو مجموعي جائزو وٺڻ لاءِfileر اڳيون، چيڪ ڪريو ته توهان جي الگورتھم کي ٽيوننگ جي ضرورت آهي.
- عام ڪارڪردگي جي رڪاوٽن جو تجزيو ڪرڻ لاءِ سبق جي پيروي ڪريو.
- هڪ دفعو توهان جو الورورٿم چڱي طرح ٺهيو، پرفارمنس سنيپ شاٽ ٻيهر هلايو نتيجن کي ترتيب ڏيڻ ۽ ٻين علائقن ۾ امڪاني ڪارڪردگي بهتري جي نشاندهي ڪرڻ لاءِ.
پڻ ڏسو
مائڪرو آرڪيٽيڪچر جي ڳولا
VTune Profiler مدد ٽور
Exampاليزي: پروfile هڪ OpenMP* ايپليڪيشن ونڊوز تي*
استعمال ڪريو Intel VTune Profiler هڪ ونڊوز مشين تي پروfile جيئنample iso3dfd_omp_offload OpenMP ايپليڪيشن هڪ Intel GPU تي آف لوڊ ڪئي وئي. سکو ته ڪيئن هلائڻ لاءِ هڪ GPU تجزيو ۽ جانچيو نتيجا.
شرطون
- پڪ ڪريو ته توهان جو سسٽم هلائي رهيو آهي Microsoft* Windows 10 يا هڪ نئون ورزن.
- Intel پروسيسر گرافڪس جي انهن نسخن مان هڪ استعمال ڪريو:
- جنرل 8
- جنرل 9
- جنرل 11
- توھان جو سسٽم ھجڻ گھرجي انھن مان ھڪڙي تي Intel پروسيسر:
- 7th Generation Intel® Core™ i7 پروسيسرز (ڪوڊ نالو ڪبي ڍنڍ)
- 8th Generation Intel® Core™ i7 پروسيسرز (ڪوڊ نالو ڪافي ڍنڍ)
- 10th Generation Intel® Core™ i7 پروسيسرز (ڪوڊ نالو آئس ڍنڍ)
- انسٽال ڪريو Intel VTune Profiler انهن ذريعن مان هڪ:
- اسٽينڊل پراڊڪٽ ڊائون لوڊ
- Intel® oneAPI بيس ٽول ڪٽ
- Intel® System Bring-up Toolkit
- ڊائون لوڊ ڪريو Intel® oneAPI HPC Toolkit جنهن ۾ Intel® oneAPI DPC++/C++ Compiler(icx/icpx) آهي جنهن کي توهان کي پرو ڪرڻ جي ضرورت آهي.file OpenMP ايپليڪيشنون.
- ماحوليات جي تبديلين کي ترتيب ڏيو. ۾ واقع vars.bat اسڪرپٽ تي عمل ڪريو \env ڊاريڪٽري.
- GPU تجزيي لاءِ پنهنجو سسٽم سيٽ ڪريو.
نوٽ
Intel VTune Pro انسٽال ڪرڻ لاءِfiler Microsoft* Visual Studio ماحول ۾، ڏسو VTune Profiler يوزر گائيڊ.
OpenMP آف لوڊ ايپليڪيشن ٺاهيو ۽ گڏ ڪريو
- ڊائون لوڊ ڪريو iso3dfd_omp_offload OpenMP Offload sampلي.
- ايس ڏانهن کليلampلي ڊاريڪٽري.
سي ڊي <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - OpenMP آف لوڊ ايپليڪيشن کي گڏ ڪريو.
mkdir تعمير
سي ڊي تعمير
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
اوپن ايم پي آف لوڊ ايپليڪيشن تي هڪ GPU تجزيو هلايو
توھان ھاڻي تيار آھيو GPU آف لوڊ تجزيو هلائڻ لاءِ OpenMP ايپليڪيشن تي جيڪو توھان مرتب ڪيو آھي.
- VTune Pro کوليوfiler ۽ ڪلڪ ڪريو نئون پروجيڪٽ پروجيڪٽ ٺاهڻ لاءِ.
- ڀليڪار واري صفحي تي، تي ڪلڪ ڪريو Configure Analysis پنھنجو تجزيو قائم ڪرڻ لاءِ.
- پنھنجي تجزيو لاءِ ھي سيٽنگون چونڊيو.
- WHERE پين ۾، چونڊيو مقامي ميزبان.
- WHAT پين ۾، لانچ ايپليڪيشن چونڊيو ۽ وضاحت ڪريو iso3dfd_omp_offload بائنري کي پرو لاءِ ايپليڪيشن طورfile.
- HOW پين ۾، GPU آف لوڊ تجزيو قسم چونڊيو Accelerators گروپ مان Analysis Tree ۾.
- تجزيو هلائڻ لاءِ شروع بٽڻ تي ڪلڪ ڪريو.
VTune Profiler ڊيٽا گڏ ڪري ٿو ۽ GPU آف لوڊ ۾ تجزيو جا نتيجا ڏيکاري ٿو viewنقطو.
- خلاصو ونڊو ۾، CPU ۽ GPU وسيلن جي استعمال تي انگ اکر ڏسو. اهو طئي ڪرڻ لاءِ هي ڊيٽا استعمال ڪريو ته توهان جي درخواست آهي:
- GPU پابند
- سي پي يو پابند
- توهان جي سسٽم جي حسابي وسيلن کي غير موثر طور تي استعمال ڪرڻ
- بنيادي CPU ۽ GPU ميٽرڪس ڏسڻ لاءِ پليٽ فارم ونڊو ۾ معلومات استعمال ڪريو.
- گرافڪس ونڊو ۾ مخصوص ڪمپيوٽنگ ڪمن جي تحقيق ڪريو.
گہرے تجزيي لاءِ، وي ٽيون پرو ۾ هڪ لاڳاپيل ترڪيب ڏسوfiler ڪارڪردگي تجزيو ڪڪ بڪ. توھان پڻ جاري ڪري سگھوٿا پنھنجي پروفائلنگ کي GPU Compute/Media Hotspots analysis سان.
Exampلي: پروfile هڪ SYCL * ونڊوز تي ايپليڪيشن*
پروfile جيئنample matrix_multiply SYCL ايپليڪيشن Intel® VTune™ پرو سانfileر پراڊڪٽ سان واقف ٿيو ۽ GPU- پابند ايپليڪيشنن لاءِ گڏ ڪيل انگ اکر سمجھو.
شرطون
- پڪ ڪريو ته توهان وٽ Microsoft* Visual Studio (v2017 يا نئون) توهان جي سسٽم تي انسٽال ٿيل آهي.
- انسٽال ڪريو Intel VTune ProfileIntel® oneAPI Base Toolkit يا Intel® System Bring-up Toolkit مان. انهن ٽول ڪِٽس ۾ Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) ڪمپائلر شامل آهي جيڪو پروفائلنگ جي عمل لاءِ گهربل آهي.
- ماحوليات جي تبديلين کي ترتيب ڏيو. ۾ واقع vars.bat اسڪرپٽ تي عمل ڪريو \env ڊاريڪٽري.
- پڪ ڪريو ته Intel oneAPI DPC++ Compiler (Intel oneAPI Base Toolkit سان انسٽال ٿيل) Microsoft Visual Studio ۾ ضم ٿيل آهي.
- Intel oneAPI DPC++ Compiler لاءِ -gline-tables-only ۽ -fdebug-info-for-profiling آپشنز استعمال ڪندي ڪوڊ مرتب ڪريو.
- GPU تجزيي لاءِ پنهنجو سسٽم سيٽ ڪريو.
Intel VTune Pro انسٽال ڪرڻ بابت معلومات لاءِfiler Microsoft* Visual Studio ماحول ۾، ڏسو VTune Profiler يوزر گائيڊ.
Matrix ايپ ٺاهيو
ڊائون لوڊ ڪريو matrix_multiply_vtune ڪوڊ sampلي پيڪيج Intel oneAPI ٽول ڪِٽس لاءِ. هن تي مشتمل آهي ايسampجنهن کي توهان استعمال ڪري سگهو ٿا تعمير ۽ پروfile SYCL ايپليڪيشن.
- Microsoft * Visual Studio کوليو.
- ڪلڪ ڪريو File > کوليو > پروجيڪٽ / حل. ڳوليو matrix_multiply_vtune فولڊر ۽ چونڊيو matrix_multiply.sln.
- ھن ٺاھ جوڙ ٺاھيو (پروجيڪٽ > تعمير ڪريو).
- پروگرام کي هلايو (ڊيبگ> شروع ڪريو بغير ڊيبنگ).
- DPC++ چونڊڻ لاءِ يا sample, preprocessor وصفون استعمال ڪريو.
- وڃو پروجيڪٽ پراپرٽيز> ڊي پي سي++> پري پروسيسر> پري پروسيسر جي تعريف.
- وضاحت ڪريو icpx -fsycl يا USE_THR.
GPU تجزيو هلايو
Matrix s تي هڪ GPU تجزيو هلائيampلي.
- Visual Studio ٽول بار مان، ڪلڪ ڪريو Configure Analysis بٽڻ.
ڪنفيگر تجزيي ونڊو کلي ٿي. ڊفالٽ طور، اهو توهان جي VS پروجيڪٽ سيٽنگن کي ورثي ۾ ڏئي ٿو ۽ matrix_multiply.exe کي پرو جي ايپليڪيشن طور بيان ڪري ٿو.file. - Configure Analysis Window ۾، ڪلڪ ڪريو
HOW پين ۾ براؤز بٽڻ.
- GPU Compute/Media Hotspots جو تجزيو قسم چونڊيو Accelerators گروپ مان Analysis Tree ۾.
- اڳئين بيان ڪيل اختيارن سان تجزيو شروع ڪرڻ لاءِ شروع بٽڻ تي ڪلڪ ڪريو.
ڪمانڊ لائن مان GPU تجزيو هلايو:
- ايس کوليوampلي ڊاريڪٽري:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - هن ڊاريڪٽري ۾، کوليو هڪ Visual Studio* پروجيڪٽ file نالو matrix_multiply.sln
- multiply.cpp file ميٽرڪس ضرب جي ڪيترن ئي نسخن تي مشتمل آهي. multiply.hpp ۾ لاڳاپيل #define MULTIPLY لائن کي ايڊٽ ڪندي نسخو چونڊيو
- مڪمل پروجيڪٽ کي ريليز جي ترتيب سان ٺاهيو.
هي ٺاهي ٿو هڪ قابل عمل جنهن کي سڏيو ويندو آهي matrix_multiply.exe. - GPU تجزيو هلائڻ لاءِ سسٽم تيار ڪريو. ڏسو سيٽ اپ سسٽم لاءِ GPU تجزيو.
- VTune Pro سيٽ ڪريوfiler ماحوليات جي بيچ کي هلائڻ سان file: برآمد \env\vars.bat
- هلايو تجزيو حڪم:
vtune.exe -collect gpu-offload — matrix_multiply.exe
VTune Profiler ڊيٽا گڏ ڪري ٿو ۽ GPU Compute/Media Hotspots ۾ تجزيو جا نتيجا ڏيکاري ٿو viewنقطو. خلاصو ونڊو ۾، سي پي يو ۽ GPU وسيلن جي استعمال تي شماريات ڏسو سمجھڻ لاءِ ته ڇا توھان جي ايپليڪيشن GPU- پابند آھي. تبديل ڪريو گرافڪس ونڊو کي ڏسڻ لاءِ بنيادي CPU ۽ GPU ميٽرڪس جيڪي وقت سان گڏ ڪوڊ جي عمل جي نمائندگي ڪن ٿا.
Intel® VTune™ پرو سان شروع ڪريوfiler Linux* OS لاءِ
توھان کان اڳ شروع ڪريو
- انسٽال ڪريو Intel® VTune™ Profiler توهان جي لينڪس * سسٽم تي.
- پنھنجي ايپليڪيشن کي علامت جي معلومات سان ٺاھيو ۽ رليز موڊ ۾ سڀني اصلاحن سان. گڏ ڪرڻ واري سيٽنگن تي تفصيلي ڄاڻ لاء، ڏسو VTune Profiler آن لائن استعمال ڪندڙ ھدايت.
توھان پڻ استعمال ڪري سگھو ٿا ميٽرڪس ايسamp۾ موجود درخواست \sampلي\ميٽرڪس. توهان ڏسي سگهو ٿا sampجي نتيجي ۾ \sampلي (ميٽرڪس). - ماحوليات کي ترتيب ڏيو: ذريعو /setvars.sh
ڊفالٽ طور، جي آهي:- $HOME/intel/oneapi/ جڏهن انسٽال ٿيل هجي صارف جي اجازت سان؛
- /opt/intel/oneapi/ جڏهن روٽ اجازتن سان انسٽال ڪيو وڃي.
قدم 1: VTune پرو شروع ڪريوfiler
VTune پرو شروع ڪريوfileانهن طريقن مان هڪ ذريعي:
ذريعو / VTune پرو شروع ڪريوfiler
اسٽينڊل / IDE (GUI)
- vtunegui حڪم هلايو. VTune پرو شروع ڪرڻ لاءfiler انٽيل سسٽم اسٽوڊيو IDE مان، چونڊيو اوزار > VTune Profiler> VTune پرو لانچ ڪريوfileر اهو سڀني مناسب ماحول جي متغيرن کي سيٽ ڪري ٿو ۽ پراڊڪٽ جو هڪ اسٽائل انٽرفيس لانچ ڪري ٿو.
- جڏهن GUI کلي ٿو، ڪلڪ ڪريو نئون منصوبو ڀليڪار اسڪرين ۾.
- ۾ ٺاهيو پروجيڪٽ ڊائلاگ باڪس، وضاحت ڪريو منصوبي جو نالو ۽ مقام.
- ڪلڪ ڪريو Create Project .
اسٽينڊل (ڪمانڊ لائن)
- vtune حڪم هلايو.
مرحلا 2: ترتيب ڏيو ۽ تجزيو ڪريو
هڪ نئون پروجيڪٽ ٺاهڻ کان پوءِ، ڪنفيگر تجزيي ونڊو هنن ڊفالٽ ويلز سان کلي ٿي:
- لانچ ايپليڪيشن سيڪشن ۾، براؤز ڪريو توھان جي ايپليڪيشن جي جڳھ ڏانھن.
- پنھنجي ايپليڪيشن تي پرفارمنس سنيپ شاٽ هلائڻ لاءِ شروع تي ڪلڪ ڪريو. هي تجزيو هڪ عام اوور پيش ڪري ٿوview مسئلن جو ٽارگيٽ سسٽم تي توهان جي ايپليڪيشن جي ڪارڪردگي کي متاثر ڪري ٿو.
قدم 3: View ۽ ڪارڪردگي ڊيٽا جو تجزيو
جڏهن ڊيٽا گڏ ڪرڻ مڪمل ٿئي ٿي، VTune Profiler ڏيکاري ٿو تجزيو جا نتيجا خلاصو ونڊو ۾. هتي، توهان هڪ ڪارڪردگي تي ڏسنداview توهان جي اپليڪيشن جو.
مٿانview عام طور تي انهن جي وضاحتن سان گڏ ڪيترائي ميٽرڪ شامل آهن.
- A تعاون ڪندڙ عنصر بابت تفصيلي ڄاڻ لاءِ هر ميٽرڪ کي وڌايو.
- B هڪ پرچم ٿيل ميٽرڪ اشارو ڏئي ٿو هڪ قدر قابل قبول/عام آپريٽنگ حد کان ٻاهر. استعمال ڪريو ٽول ٽائيپ سمجھڻ لاءِ ته جھنڊو ٿيل ميٽرڪ کي ڪيئن بهتر بڻايو وڃي.
- C ٻين تجزين تي ھدايت ڏسو توھان کي اڳتي ھلڻ تي غور ڪرڻ گھرجي. تجزياتي وڻ انهن سفارشن کي نمايان ڪري ٿو.
ايندڙ قدم
ڪارڪردگي سنيپ شاٽ هڪ سٺو شروعاتي نقطو آهي VTune پرو سان ايپليڪيشن ڪارڪردگي جو مجموعي جائزو وٺڻ لاءِfileر اڳيون، چيڪ ڪريو ته توهان جي الگورتھم کي ٽيوننگ جي ضرورت آهي.
- عام ڪارڪردگي جي رڪاوٽن جو تجزيو ڪرڻ لاءِ سبق جي پيروي ڪريو.
- هڪ دفعو توهان جو الورورٿم چڱي طرح ٺهيو، پرفارمنس سنيپ شاٽ ٻيهر هلايو نتيجن کي ترتيب ڏيڻ ۽ ٻين علائقن ۾ امڪاني ڪارڪردگي بهتري جي نشاندهي ڪرڻ لاءِ.
پڻ ڏسو
مائڪرو آرڪيٽيڪچر جي ڳولا
VTune Profiler مدد ٽور
Exampلي: پروfile لينڪس تي هڪ OpenMP ايپليڪيشن*
استعمال ڪريو Intel VTune Profiler هڪ لينڪس مشين تي پروfile جيئنample iso3dfd_omp_offload OpenMP ايپليڪيشن هڪ Intel GPU تي آف لوڊ ڪئي وئي. سکو ته ڪيئن هلائڻ لاءِ هڪ GPU تجزيو ۽ جانچيو نتيجا.
شرطون
- پڪ ڪريو ته توهان جو سسٽم هلي رهيو آهي Linux* OS kernel 4.14 يا نئون ورزن.
- Intel پروسيسر گرافڪس جي انهن نسخن مان هڪ استعمال ڪريو:
- جنرل 8
- جنرل 9
- جنرل 11
- توھان جو سسٽم ھجڻ گھرجي انھن مان ھڪڙي تي Intel پروسيسر:
- 7th Generation Intel® Core™ i7 پروسيسرز (ڪوڊ نالو ڪبي ڍنڍ)
- 8th Generation Intel® Core™ i7 پروسيسرز (ڪوڊ نالو ڪافي ڍنڍ)
- 10th Generation Intel® Core™ i7 پروسيسرز (ڪوڊ نالو آئس ڍنڍ)
- Linux GUI لاءِ، استعمال ڪريو:
- GTK+ ورجن 2.10 يا نئون (2.18 ۽ نوان ورجن سفارش ٿيل آهن)
- پينگو ورزن 1.14 يا نئون
- X.Org ورجن 1.0 يا نئون (1.7 ۽ نوان ورجن سفارش ٿيل آهن)
- انسٽال ڪريو Intel VTune Profiler انهن ذريعن مان هڪ:
- اسٽينڊل پراڊڪٽ ڊائون لوڊ
- Intel® oneAPI بيس ٽول ڪٽ
- Intel® System Bring-up Toolkit
- ڊائون لوڊ ڪريو Intel® oneAPI HPC Toolkit جنهن ۾ Intel® oneAPI DPC++/C++ Compiler(icx/icpx) آهي جنهن کي توهان کي پرو ڪرڻ جي ضرورت آهي.file OpenMP ايپليڪيشنون.
- ماحوليات جي تبديلين کي ترتيب ڏيو. vars.sh اسڪرپٽ تي عمل ڪريو.
- GPU تجزيي لاءِ پنهنجو سسٽم سيٽ ڪريو.
OpenMP آف لوڊ ايپليڪيشن ٺاهيو ۽ گڏ ڪريو
- ڊائون لوڊ ڪريو iso3dfd_omp_offload OpenMP Offload sampلي.
- ايس ڏانهن کليلampلي ڊاريڪٽري.
سي ڊي <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - OpenMP آف لوڊ ايپليڪيشن کي گڏ ڪريو.
mkdir تعمير؛
cmake -DVERIFY_RESULTS=0 ..
ٺاهڻ - جي
هي ٺاهي ٿو src/iso3dfd قابل عمل.
پروگرام کي ختم ڪرڻ لاء، ٽائپ ڪريو:
صاف ڪرڻ
هي executable ۽ اعتراض کي هٽائي ٿو fileجيڪو توهان ٺاهيو حڪم سان ٺاهيو.
اوپن ايم پي آف لوڊ ايپليڪيشن تي هڪ GPU تجزيو هلايو
توھان ھاڻي تيار آھيو GPU آف لوڊ تجزيو هلائڻ لاءِ OpenMP ايپليڪيشن تي جيڪو توھان مرتب ڪيو آھي.
- VTune Pro کوليوfiler ۽ ڪلڪ ڪريو نئون پروجيڪٽ پروجيڪٽ ٺاهڻ لاءِ.
- ڀليڪار واري صفحي تي، تي ڪلڪ ڪريو Configure Analysis پنھنجو تجزيو قائم ڪرڻ لاءِ.
- پنھنجي تجزيو لاءِ ھي سيٽنگون چونڊيو.
- WHERE پين ۾، چونڊيو مقامي ميزبان.
- WHAT پين ۾، لانچ ايپليڪيشن چونڊيو ۽ وضاحت ڪريو iso3dfd_omp_offload بائنري کي پرو لاءِ ايپليڪيشن طورfile.
- HOW پين ۾، GPU آف لوڊ تجزيو قسم چونڊيو Accelerators گروپ مان Analysis Tree ۾.
- تجزيو هلائڻ لاءِ شروع بٽڻ تي ڪلڪ ڪريو.
VTune Profiler ڊيٽا گڏ ڪري ٿو ۽ GPU آف لوڊ ۾ تجزيو جا نتيجا ڏيکاري ٿو viewنقطو.
- خلاصو ونڊو ۾، CPU ۽ GPU وسيلن جي استعمال تي انگ اکر ڏسو. اهو طئي ڪرڻ لاءِ هي ڊيٽا استعمال ڪريو ته توهان جي درخواست آهي:
- GPU پابند
- سي پي يو پابند
- توهان جي سسٽم جي حسابي وسيلن کي غير موثر طور تي استعمال ڪرڻ
- بنيادي CPU ۽ GPU ميٽرڪس ڏسڻ لاءِ پليٽ فارم ونڊو ۾ معلومات استعمال ڪريو.
- گرافڪس ونڊو ۾ مخصوص ڪمپيوٽنگ ڪمن جي تحقيق ڪريو.
گہرے تجزيي لاءِ، وي ٽيون پرو ۾ هڪ لاڳاپيل ترڪيب ڏسوfiler ڪارڪردگي تجزيو ڪڪ بڪ. توھان پڻ جاري ڪري سگھوٿا پنھنجي پروفائلنگ کي GPU Compute/Media Hotspots analysis سان.
Exampلي: پروfile هڪ SYCL * لينڪس تي ايپليڪيشن*
VTune پرو استعمال ڪريوfiler سان جيئنample matrix_multiply SYCL ايپليڪيشن جلدي واقف ٿيڻ لاءِ پراڊڪٽ ۽ انگن اکرن سان گڏ گڏ ڪيل GPU- پابند ايپليڪيشنن لاءِ.
شرطون
- VTune پرو انسٽال ڪريوfiler ۽ Intel® oneAPI DPC++/C++ Compiler Intel® oneAPI Base Toolkit يا Intel® System Bring-up Toolkit مان.
- vars.sh اسڪرپٽ تي عمل ڪندي ماحوليات جي متغيرن کي سيٽ ڪريو.
- GPU تجزيي لاءِ پنهنجو سسٽم سيٽ ڪريو.
Matrix ايپليڪيشن ٺاهيو
ڊائون لوڊ ڪريو matrix_multiply_vtune ڪوڊ sampلي پيڪيج Intel oneAPI ٽول ڪِٽس لاءِ. هن تي مشتمل آهي ايسampجنهن کي توهان استعمال ڪري سگهو ٿا تعمير ۽ پروfile SYCL ايپليڪيشن.
پرو ڪرڻfile هڪ SYCL ايپليڪيشن، پڪ ڪريو ته ڪوڊ گڏ ڪرڻ لاءِ -gline-tables-only ۽ -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler آپشنز استعمال ڪري.
هن کي گڏ ڪرڻ لاءِ ايسampدرخواست، ھيٺ ڏنل ڪريو:
- ايس ڏانهن وڃوampلي ڊاريڪٽري.
سي ڊي <sample_dir/VtuneProfiler/matrix_multiply> - multiply.cpp file src فولڊر ۾ ميٽرڪس ضرب جي ڪيترن ئي نسخن تي مشتمل آهي. multiply.h ۾ لاڳاپيل #define MULTIPLY لائن کي ايڊٽ ڪندي نسخو چونڊيو.
- موجوده Make استعمال ڪندي ايپ ٺاهيوfile:
سي ايم ڪيڪ.
ٺاهڻ
انهي کي ٺاهڻ گهرجي matrix.icpx -fsycl قابل عمل.
پروگرام کي ختم ڪرڻ لاء، ٽائپ ڪريو:
صاف ڪرڻ
هي executable ۽ اعتراض کي هٽائي ٿو files جيڪي ٺاهيل حڪم ذريعي ٺاهيا ويا آهن.
GPU تجزيو هلايو
Matrix s تي هڪ GPU تجزيو هلائيampلي.
- VTune پرو لانچ ڪريوfiler vtune-gui حڪم سان.
- ڪلڪ ڪريو نئون پروجيڪٽ ڀلي ڪري آيا صفحي مان.
- توھان جي لاء ھڪڙو نالو ۽ جڳھ بيان ڪريوampلي پروجيڪٽ ۽ ڪلڪ ڪريو پروجيڪٽ ٺاهيو.
- WHAT پين ۾، براؤز ڪريو matrix.icpx-fsycl file.
- HOW پين ۾، ڪلڪ ڪريو
براؤز ڪريو بٽڻ ۽ چونڊيو GPU Compute/Media Hotspots analysis مان Accelerators Group مان Analysis Tree.
- اڳئين چونڊيل اختيارن سان تجزيو شروع ڪرڻ لاءِ ھيٺئين پاسي واري بٽڻ تي ڪلڪ ڪريو.
ڪمانڊ لائن مان GPU تجزيو هلايو:
- GPU تجزيو هلائڻ لاءِ سسٽم تيار ڪريو. ڏسو سيٽ اپ سسٽم لاءِ GPU تجزيو.
- Intel سافٽ ويئر ٽولز لاءِ ماحوليات جي متغير سيٽ اپ ڪريو:
ذريعو $ONEAPI_ROOT/setvars.sh - ھلايو GPU Compute/ميڊيا هٽسپاٽ تجزيو:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots - ./matrix.icpx -fsycl
خلاصو رپورٽ ڏسڻ لاءِ، ٽائپ ڪريو:
vtune -رپورٽ خلاصو -r./result_gpu-hotspots
VTune Profiler ڊيٽا گڏ ڪري ٿو ۽ GPU Compute/Media Hotspots ۾ تجزيو جا نتيجا ڏيکاري ٿو viewنقطو. خلاصو ونڊو ۾، سي پي يو ۽ GPU وسيلن جي استعمال تي شماريات ڏسو سمجھڻ لاءِ ته ڇا توھان جي ايپليڪيشن GPU- پابند آھي. تبديل ڪريو گرافڪس ونڊو کي ڏسڻ لاءِ بنيادي CPU ۽ GPU ميٽرڪس جيڪي وقت سان گڏ ڪوڊ جي عمل جي نمائندگي ڪن ٿا.
Intel® VTune™ پرو سان شروع ڪريوfiler for macOS*
VTune پرو استعمال ڪريوfiler هڪ macOS سسٽم تي ريموٽ ٽارگيٽ تجزيو ڪرڻ لاءِ هڪ غير macOS سسٽم تي (صرف لينڪس* يا Android*).
توھان استعمال نٿا ڪري سگھو VTune Profiler انهن مقصدن لاء هڪ macOS ماحول ۾:
- پروfile macOS سسٽم جنهن تي اهو انسٽال ٿيل آهي.
- ريموٽ macOS سسٽم تي ڊيٽا گڏ ڪريو.
macOS ميزبان کان ريموٽ لينڪس* يا Android* ٽارگيٽ جي ڪارڪردگي جو تجزيو ڪرڻ لاءِ، انهن قدمن مان هڪ ڪريو:
- هڪ VTune پرو هلائيfiler تجزيا macOS سسٽم تي ريموٽ سسٽم سان گڏ بيان ڪيل حدف جي طور تي. جڏهن تجزيو شروع ٿئي ٿو، VTune Profiler ڊيٽا گڏ ڪرڻ لاءِ ريموٽ سسٽم سان ڳنڍيندو آهي، پوءِ نتيجا واپس آڻيندو آهي macOS ميزبان لاءِ viewing.
- ھدف واري نظام تي مقامي طور تي تجزيو ڪريو ۽ نتيجن کي نقل ڪريو MacOS سسٽم لاءِ viewVTune Pro ۾filer.
هن دستاويز ۾ قدم هڪ ريموٽ لينڪس ٽارگيٽ سسٽم کي فرض ڪن ٿا ۽ VTune Pro کان SSH رسائي استعمال ڪندي ڪارڪردگي ڊيٽا گڏ ڪري ٿوfiler هڪ macOS ميزبان سسٽم تي.
توھان کان اڳ شروع ڪريو
- انسٽال ڪريو Intel® VTune™ Profiler توهان جي macOS * سسٽم تي.
- پنھنجي لينڪس ايپليڪيشن ٺاھيو علامت جي معلومات سان ۽ رليز موڊ ۾ سڀني اصلاحن سان. تفصيلي ڄاڻ لاءِ، ڏسو ڪمپلر سيٽنگون VTune Pro ۾fileمدد ڪريو.
- سيٽ اپ ڪريو SSH رسائي ميزبان macOS سسٽم کان ٽارگيٽ لينڪس سسٽم تائين ڪم ڪرڻ لاءِ پاسورڊ-گهٽ موڊ ۾.
قدم 1: VTune پرو شروع ڪريوfiler
- VTune پرو لانچ ڪريوfiler vtune-gui حڪم سان.
ڊفالٽ طور، جي آهي /opt/intel/oneapi/. - جڏهن GUI کلي ٿو، ڪلڪ ڪريو نئون منصوبو ڀليڪار اسڪرين ۾.
- ۾ ٺاهيو پروجيڪٽ ڊائلاگ باڪس، وضاحت ڪريو منصوبي جو نالو ۽ مقام.
- ڪلڪ ڪريو Create Project .
مرحلا 2: ترتيب ڏيو ۽ تجزيو ڪريو
توهان جي نئين پروجيڪٽ ٺاهڻ کان پوء، تجزيي کي ترتيب ڏيو ونڊو کي پرفارمنس سنيپ شاٽ جي تجزيي جي قسم سان کوليو ويندو.
هي تجزيو هڪ اوور پيش ڪري ٿوview مسئلن جو جيڪو ٽارگيٽ سسٽم تي توهان جي ايپليڪيشن جي ڪارڪردگي کي متاثر ڪري ٿو.
- WHERE پين ۾، منتخب ڪريو ريموٽ لينڪس (SSH) ۽ استعمال ڪندي ٽارگيٽ لينڪس سسٽم بيان ڪريو username@hostname[:port].
VTune Profiler لينڪس سسٽم سان ڳنڍيندو آهي ۽ ٽارگيٽ پيڪيج کي انسٽال ڪري ٿو. - WHAT پين ۾، ٽارگيٽ لينڪس سسٽم تي توهان جي ايپليڪيشن جو رستو مهيا ڪريو.
- ايپليڪيشن تي پرفارمنس سنيپ شاٽ کي هلائڻ لاءِ شروع بٽڻ تي ڪلڪ ڪريو.
قدم 3: View ۽ ڪارڪردگي ڊيٽا جو تجزيو
جڏهن ڊيٽا گڏ ڪرڻ مڪمل ٿئي ٿي، VTune Profiler ڏيکاري ٿو تجزيي جا نتيجا macOS سسٽم تي. خلاصو ونڊو ۾ پنهنجو تجزيو شروع ڪريو. هتي، توهان هڪ ڪارڪردگي تي ڏسنداview توهان جي اپليڪيشن جو.
مٿانview عام طور تي انهن جي وضاحتن سان گڏ ڪيترائي ميٽرڪ شامل آهن.
- A تعاون ڪندڙ عنصر بابت تفصيلي ڄاڻ لاءِ هر ميٽرڪ کي وڌايو.
- B هڪ پرچم ٿيل ميٽرڪ اشارو ڏئي ٿو هڪ قدر قابل قبول/عام آپريٽنگ حد کان ٻاهر. استعمال ڪريو ٽول ٽائيپ سمجھڻ لاءِ ته جھنڊو ٿيل ميٽرڪ کي ڪيئن بهتر بڻايو وڃي.
- C ٻين تجزين تي ھدايت ڏسو توھان کي اڳتي ھلڻ تي غور ڪرڻ گھرجي. تجزياتي وڻ انهن سفارشن کي نمايان ڪري ٿو.
ايندڙ قدم
ڪارڪردگي سنيپ شاٽ هڪ سٺو شروعاتي نقطو آهي VTune پرو سان ايپليڪيشن ڪارڪردگي جو مجموعي جائزو وٺڻ لاءِfiler.
اڳيون، چيڪ ڪريو ته توهان جي الگورتھم کي ٽيوننگ جي ضرورت آهي.
- توهان جي ايپليڪيشن تي Hotspot Analysis هلايو.
- هڪ Hotspot سبق جي تابعداري ڪريو. توهان جي Hotspots تجزيي مان تمام گهڻو حاصل ڪرڻ لاء ٽيڪنڪ سکو.
- هڪ دفعو توهان جو الورورٿم چڱي طرح ٺهيو، پرفارمنس سنيپ شاٽ ٻيهر هلايو نتيجن کي ترتيب ڏيڻ ۽ ٻين علائقن ۾ امڪاني ڪارڪردگي بهتري جي نشاندهي ڪرڻ لاءِ.
پڻ ڏسو
مائڪرو آرڪيٽيڪچر جي ڳولا
VTune Profiler مدد ٽور
وڌيڪ سکو
دستاويز / تفصيل
- استعمال ڪندڙ ھدايت
يوزر گائيڊ VTune پرو لاءِ بنيادي دستاويز آهيfiler.
نوٽ
توهان VTune پرو جو آف لائن ورزن پڻ ڊائون لوڊ ڪري سگهو ٿاfileآر دستاويز. - آن لائين ٽريننگ
آن لائن ٽريننگ سائيٽ VTune Pro جي بنياديات سکڻ لاءِ هڪ بهترين وسيلو آهيfiler شروع ڪرڻ جي رهنمائي سان، وڊيوز، سبق، webinars، ۽ ٽيڪنيڪل مضمون. - ڪڪ بڪ
ڪارڪردگي جو تجزيو ڪڪ بڪ جنهن ۾ وي ٽيون پرو ۾ تجزيي جي قسمن کي استعمال ڪندي مشهور ڪارڪردگي جي مسئلن کي سڃاڻڻ ۽ حل ڪرڻ لاءِ ترڪيبون شامل آهنfiler. - ونڊوز لاءِ انسٽاليشن گائيڊ | لينڪس | macOS ميزبان
انسٽاليشن گائيڊ VTune پرو لاءِ بنيادي تنصيب جي هدايتن تي مشتمل آهيfiler ۽ پوسٽ انسٽاليشن جي ترتيب جي هدايتون مختلف ڊرائيورن ۽ ڪليڪٽرن لاءِ. - سبق
VTune Profiler سبق هڪ نئين استعمال ڪندڙ کي بنيادي خصوصيتن ذريعي رهنمائي ڪن ٿا مختصر s سانampدرخواست. - رليز نوٽس
VTune Pro جي جديد ورزن بابت ڄاڻ حاصل ڪريوfiler، نئين خاصيتن جي جامع وضاحت، سسٽم گهرجن، ۽ ٽيڪنيڪل مسئلن کي حل ڪيو ويو.
VTune Pro جي اسٽينڊل ۽ ٽول ڪٽ ورزن لاءِfiler، موجوده سسٽم جي ضرورتن کي سمجھو.
نوٽس ۽ رد ڪرڻ وارا
انٽيليجنس ٽيڪنالاجي جي ضرورت هارڊويئر ، سافٽ ويئر يا سروس چالو هجڻ جي ضرورت آهي.
ڪابه پيداوار يا جزو بلڪل محفوظ نه ٿي سگهي.
توهان جا خرچ ۽ نتيجا مختلف ٿي سگهن ٿا.
© Intel Corporation. Intel، Intel لوگو، ۽ ٻيا Intel نشان آھن Intel Corporation يا ان جي ماتحت ادارن جا ٽريڊ مارڪ. ٻيا نالا ۽ برانڊ ٻين جي ملڪيت طور دعوي ڪري سگھن ٿا.
Intel, the Intel لوگو, Intel Atom, Intel Core, Intel Xeon Phi, VTune ۽ Xeon آمريڪا ۽/يا ٻين ملڪن ۾ Intel Corporation جا ٽريڊ مارڪ آھن.
* ٻيا نالا ۽ برانڊ ٻين جي ملڪيت جي طور تي دعوي ڪري سگھن ٿا.
Microsoft، Windows، ۽ Windows لوگو ٽريڊمارڪس آھن، يا آمريڪا ۽/يا ٻين ملڪن ۾ Microsoft Corporation جا رجسٽرڊ ٽريڊمارڪس.
جاوا اوراڙي جو رجسٽرڊ ٽريڊ مارڪ آهي ۽ / يا انهي سان لاڳاپيل ادارا.
OpenCL ۽ OpenCL لوگو Apple Inc. جا ٽريڊ مارڪ آھن جيڪي Khronos جي اجازت سان استعمال ڪيا ويا آھن.
انٽيليجنس ٽيڪنالاجي جي ضرورت هارڊويئر ، سافٽ ويئر يا سروس چالو هجڻ جي ضرورت آهي.
ڪابه پيداوار يا جزو بلڪل محفوظ نه ٿي سگهي.
توهان جا خرچ ۽ نتيجا مختلف ٿي سگهن ٿا.
© Intel Corporation. Intel، Intel لوگو، ۽ ٻيا Intel نشان آھن Intel Corporation يا ان جي ماتحت ادارن جا ٽريڊ مارڪ. ٻيا نالا ۽ برانڊ ٻين جي ملڪيت طور دعوي ڪري سگھن ٿا.
Intel, the Intel لوگو, Intel Atom, Intel Core, Intel Xeon Phi, VTune ۽ Xeon آمريڪا ۽/يا ٻين ملڪن ۾ Intel Corporation جا ٽريڊ مارڪ آھن.
* ٻيا نالا ۽ برانڊ ٻين جي ملڪيت جي طور تي دعوي ڪري سگھن ٿا.
Microsoft، Windows، ۽ Windows لوگو ٽريڊمارڪس آھن، يا آمريڪا ۽/يا ٻين ملڪن ۾ Microsoft Corporation جا رجسٽرڊ ٽريڊمارڪس.
جاوا اوراڙي جو رجسٽرڊ ٽريڊ مارڪ آهي ۽ / يا انهي سان لاڳاپيل ادارا.
OpenCL ۽ OpenCL لوگو Apple Inc. جا ٽريڊ مارڪ آھن جيڪي Khronos جي اجازت سان استعمال ڪيا ويا آھن.
دستاويز / وسيلا
![]() |
intel شروع ڪريو VTune Pro سانfiler [pdf] استعمال ڪندڙ ھدايت VTune پرو سان شروع ڪريوfiler، شروع ڪريو، VTune پرو سانfiler، VTune پروfiler |