intel د VTune پرو سره پیل کړئfiler
د Intel® VTune™ پرو سره پیل کړئfiler
د Intel VTune Pro وکاروئfileد وینډوز *، macOS*، او لینکس * کوربه څخه د محلي او لیرې هدف سیسټمونو تحلیل کولو لپاره. د دې عملیاتو له لارې د غوښتنلیک او سیسټم فعالیت ښه کړئ:
- د الګوریتم انتخابونه تحلیل کړئ.
- سیریل او موازي کوډ خنډونه ومومئ.
- پوه شئ چې چیرې او څنګه ستاسو غوښتنلیک د موجود هارډویر سرچینو څخه ګټه پورته کولی شي.
- ستاسو د غوښتنلیک اجرا کول ګړندي کړئ.
د Intel VTune Pro ډاونلوډ کړئfileستاسو په سیسټم کې د دې لارو څخه یو له لارې: - د سټنډرډ نسخه ډاونلوډ کړئ.
- د Intel VTune Pro ترلاسه کړئfileد Intel® oneAPI بیس Toolkit د یوې برخې په توګه.
د VTune پرو وګورئfileد ویډیوګانو لپاره د روزنې پاڼه، webinars، او نور مواد چې تاسو سره د پیل کولو کې مرسته کوي.
نوټ
د Intel® VTune™ پرو نسخو لپاره اسنادfileد 2021 ریلیز څخه دمخه یوازې د ډاونلوډ لپاره شتون لري. د محصول نسخه لخوا د شته اسنادو ډاونلوډونو لیست لپاره، دا پاڼې وګورئ:
- د Intel Parallel Studio XE لپاره اسناد ډاونلوډ کړئ
- د انټیل سیسټم سټوډیو لپاره اسناد ډاونلوډ کړئ
د کار جریان درک کړئ
د Intel VTune Pro وکاروئfiler to profile د فعالیت ښه کولو لپاره غوښتنلیک او پایلې تحلیل کړئ.
عمومي کاري جریان دا مرحلې لري:
د پیل کولو لپاره خپل کوربه سیسټم غوره کړئ
د وینډوز*، لینکس*، یا macOS* لپاره د سیسټم ځانګړي کاري فلو په اړه نور معلومات ترلاسه کړئ.
د Intel® VTune™ پرو سره پیل کړئfileد وینډوز * OS لپاره
مخکې له دې چې تاسو پیل کړئ
- Intel® VTune™ Pro نصب کړئfileستاسو په وینډوز * سیسټم کې.
- خپل غوښتنلیک د سمبول معلوماتو سره جوړ کړئ او په ریلیز حالت کې د ټولو اصلاحونو فعالولو سره. د تالیف کونکي تنظیماتو په اړه د تفصيلي معلوماتو لپاره ، VTune Pro وګورئfileد آنلاین کاروونکي لارښود.
تاسو کولی شئ د میټریکس s هم وکاروئampد غوښتنلیک شتون شتون لري \VTune\Samples\matrix. تاسو کولی شئ اړوند s وګورئampپه پایله کې \VTune\پروژې\sample (میتریک). - د چاپیریال تغیرات تنظیم کړئ: چلول \setvars.bat سکریپټ.
په ترتیب سره، د د OneAPI برخو لپاره برنامه ده Files (x86)\Intel\oneAPI.
نوټ تاسو اړتیا نلرئ setvars.bat چلولو کله چې Intel® VTune™ پرو کاروئfiler په مایکروسافټ * بصری سټوډیو* کې.
1 ګام: Intel® VTune™ پرو پیل کړئfiler
Intel VTune Pro پیل کړئfileد دې لارو څخه یوه له لارې او یوه پروژه جوړه کړئ. پروژه د هغه غوښتنلیک لپاره یو کانټینر دی چې تاسو یې تحلیل کول غواړئ، د تحلیل ډول، او د معلوماتو راټولولو پایلې.
سرچینه / د VTune پرو پیل کړئfiler
یوازینی (GUI)
- د vtune-gui کمانډ چل کړئ یا Intel® VTune™ پرو چل کړئfileد سټارټ مینو څخه.
- کله چې GUI خلاص شي، د ښه راغلاست په سکرین کې کلیک وکړئ.
- د پروژې د جوړولو ډیالوګ بکس کې، د پروژې نوم او ځای مشخص کړئ.
- د پروژې په جوړولو کلیک وکړئ.
یوازینی (د کمانډ لاین)
د vtune کمانډ چل کړئ.
مایکروسافټ * ویژول سټوډیو * IDE
خپل حل په بصری سټوډیو کې خلاص کړئ. د VTune پروfiler اوزار بار په اوتومات ډول فعال شوی او ستاسو د لید سټوډیو پروژه د تحلیل هدف په توګه ټاکل شوې.
نوټ
تاسو اړتیا نلرئ یوه پروژه رامینځته کړئ کله چې Intel® VTune™ Pro چلويfileد کمانډ لاین څخه یا د مایکروسافټ * لید سټوډیو کې دننه.
2 ګام: تحلیل تنظیم او چلول
د نوې پروژې رامینځته کولو وروسته ، د تحلیل تحلیل کړکۍ د دې ډیفالټ ارزښتونو سره خلاصیږي:
- د لانچ غوښتنلیک برخه کې، د خپل غوښتنلیک د اجرا وړ ځای ته لټون وکړئ file.
- په خپل غوښتنلیک کې د فعالیت سنیپ شاټ چلولو لپاره پیل کلیک وکړئ. دا تحلیل یو عمومي اوور وړاندې کويview هغه مسلې چې په هدف سیسټم کې ستاسو د غوښتنلیک فعالیت اغیزه کوي.
لومړی ګام: View او د فعالیت ډاټا تحلیل کړئ
کله چې د معلوماتو راټولول بشپړ شي، VTune Profiler د لنډیز په کړکۍ کې د تحلیل پایلې ښیې. دلته، تاسو یو فعالیت وګورئview ستاسو د غوښتنې.
اوورview په عموم ډول د دوی توضیحاتو سره ډیری میټریکونه شامل دي.
- A د ونډه اخیستونکو فکتورونو په اړه د مفصلو معلوماتو لپاره هر میټریک پراخ کړئ.
- B یو بیرغ شوی میټریک د منلو وړ / نورمال عملیاتي حد څخه بهر ارزښت په ګوته کوي. د وسیلې لارښوونې وکاروئ ترڅو پوه شئ چې څنګه د پرچم شوي میټریک ښه کول.
- C د نورو تحلیلونو لارښود وګورئ چې تاسو یې باید په راتلونکي کې په پام کې ونیسئ. د تحلیل ونې دا سپارښتنې په ګوته کوي.
راتلونکی ګامونه
د فعالیت سنیپ شاټ د VTune Pro سره د غوښتنلیک فعالیت عمومي ارزونې ترلاسه کولو لپاره یو ښه پیل ټکی دیfiler. بیا، وګورئ چې ایا ستاسو الګوریتم ټوننګ ته اړتیا لري.
- د عام فعالیت خنډونو تحلیل کولو لپاره لارښود تعقیب کړئ.
- یوځل چې ستاسو الګوریتم ښه تنظیم شوی وي ، د فعالیت سنیپ شاټ بیا چل کړئ ترڅو پایلې محاسبه کړي او په نورو برخو کې د فعالیت احتمالي پرمختګونه وپیژني.
دا هم وګورئ
د مایکرو آرکیټیکچر سپړنه
VTune Profileد مرستې سفر
ExampLe: پروfile په وینډوز کې د OpenMP* غوښتنلیک*
د Intel VTune Pro وکاروئfileپه وینډوز ماشین کې پرو تهfile لکهample iso3dfd_omp_offload OpenMP غوښتنلیک په Intel GPU کې اپلوډ شوی. د GPU تحلیل چلولو څرنګوالی زده کړئ او پایلې معاینه کړئ.
شرطونه
- ډاډ ترلاسه کړئ چې ستاسو سیسټم د مایکروسافټ * وینډوز 10 یا نوې نسخه پرمخ وړي.
- د Intel پروسیسر ګرافیک له دې نسخو څخه یوه وکاروئ:
- جنرال ۲
- جنرال ۲
- جنرال ۲
- ستاسو سیسټم باید د دې Intel پروسیسرونو څخه یو روان وي:
- د اووم نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم Kaby Lake)
- د اتم نسل Intel® Core™ i8 پروسیسرونه (د کوډ نوم کافي لیک)
- د 10th نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم آیس لیک)
- د Intel VTune Pro نصب کړئfileد دې سرچینو څخه یوه څخه:
- یوازینی محصول ډاونلوډ کړئ
- Intel® oneAPI بیس Toolkit
- د Intel® سیسټم راوستلو وسیله
- د Intel® oneAPI HPC Toolkit ډاونلوډ کړئ کوم چې د Intel® oneAPI DPC++/C++ کمپیلر (icx/icpx) لري چې تاسو ورته اړتیا لرئfile د OpenMP غوښتنلیکونه.
- د چاپیریال تغیرات تنظیم کړئ. د vars.bat سکریپټ اجرا کړئ چې په کې موقعیت لري \env لارښود.
- خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.
نوټ
د Intel VTune Pro نصبولو لپارهfileد مایکروسافټ * ویژول سټوډیو چاپیریال کې ، د VTune پرو وګورئfiler د کارونکي لارښود.
د OpenMP آفلوډ غوښتنلیک جوړ او تالیف کړئ
- iso3dfd_omp_offload OpenMP Offload s ډاونلوډ کړئample.
- s ته خلاص کړئampد لارښود.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - د OpenMP آفلوډ غوښتنلیک تالیف کړئ.
mkdir جوړول
سي ډي جوړول
icx /std:c++17 /EHsc /Qiopenmp /I../شامل\ /Qopenmp هدفونه:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
د OpenMP آفلوډ غوښتنلیک کې د GPU تحلیل پرمخ وړئ
تاسو اوس چمتو یاست چې د OpenMP غوښتنلیک کې د GPU آفلوډ تحلیل چل کړئ چې تاسو یې ترتیب کړی.
- VTune Pro خلاص کړئfiler او د پروژې جوړولو لپاره په نوې پروژه کلیک وکړئ.
- د ښه راغلاست په پا onه کې ، د تحلیل تنظیم کولو لپاره کلیک وکړئ خپل تحلیل تنظیم کړئ.
- د خپل تحلیل لپاره دا ترتیبات غوره کړئ.
- په WHERE پین کې، ځایی کوربه غوره کړئ.
- په WHAT پین کې ، د لانچ غوښتنلیک غوره کړئ او د پرو لپاره د غوښتنلیک په توګه iso3dfd_omp_offload بائنری مشخص کړئfile.
- په HOW پین کې، د تحلیل ونې کې د سرعت ګروپ څخه د GPU آفلوډ تحلیل ډول غوره کړئ.
- د تحلیل پرمخ وړلو لپاره د پیل تڼۍ کلیک وکړئ.
VTune Profiler ډاټا راټولوي او د GPU آفلوډ کې د تحلیل پایلې ښیې viewټکی
- د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ. دا ډاټا وکاروئ ترڅو معلومه کړئ چې ستاسو غوښتنلیک دا دی:
- د GPU سره تړلی
- CPU پورې تړلی
- ستاسو د سیسټم محاسبې سرچینې په غیر موثر ډول کارول
- د لومړني CPU او GPU میټریکونو لیدلو لپاره د پلیټ فارم کړکۍ کې معلومات وکاروئ.
- د ګرافیک کړکۍ کې ځانګړي کمپیوټري دندې وپلټئ.
د ژورې تحلیل لپاره، په VTune Pro کې اړوند ترکیب وګورئfiler د فعالیت تحلیل کک کتاب. تاسو کولی شئ د GPU کمپیوټ/میډیا هټ سپاټ تحلیل سره خپل پروفایل کولو ته هم دوام ورکړئ.
Example: پروfile په وینډوز کې د SYCL* غوښتنلیک
پروfile لکهample matrix_multiply SYCL غوښتنلیک د Intel® VTune™ پرو سرهfiler. د محصول سره آشنا شئ او د GPU پورې تړلي غوښتنلیکونو لپاره راټول شوي احصایې پوهیږئ.
شرطونه
- ډاډ ترلاسه کړئ چې تاسو په خپل سیسټم کې د مایکروسافټ * لید سټوډیو (v2017 یا نوي) نصب کړی.
- د Intel VTune Pro نصب کړئfileد Intel® oneAPI Base Toolkit یا Intel® System Bring-up Toolkit څخه. دا اوزار کټونه د Intel® oneAPI DPC++/C++ کمپیلر (icpx -fsycl) کمپیلر لري چې د پروفایل کولو پروسې لپاره اړین دي.
- د چاپیریال تغیرات تنظیم کړئ. د vars.bat سکریپټ اجرا کړئ چې په کې موقعیت لري \env لارښود.
- ډاډ ترلاسه کړئ چې د Intel oneAPI DPC++ کمپیلر (د Intel oneAPI بیس وسیلې کټ سره نصب شوی) د مایکروسافټ ویژول سټوډیو کې مدغم شوی.
- د Intel oneAPI DPC++ کمپیلر لپاره د -gline-tables-only او -fdebug-info-for-profiling اختیارونو په کارولو سره کوډ تالیف کړئ.
- خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.
د Intel VTune Pro نصبولو په اړه د معلوماتو لپارهfileد مایکروسافټ * ویژول سټوډیو چاپیریال کې ، VTune Pro وګورئfiler د کارونکي لارښود.
د میټریکس اپلیکیشن جوړ کړئ
د matrix_multiply_vtune کوډ ډاونلوډ کړئampد Intel oneAPI اوزار کټونو لپاره لی پیکج. پدې کې شامل ديample کوم چې تاسو کولی شئ د جوړولو او پرو لپاره وکاروئfile د SYCL غوښتنلیک.
- د مایکروسافټ * بصری سټوډیو خلاص کړئ.
- کلیک وکړئ File > خلاص > پروژه/حل. د matrix_multiply_vtune فولډر ومومئ او matrix_multiply.sln غوره کړئ.
- دا ترتیب جوړ کړئ (پروژه> جوړ کړئ).
- برنامه پرمخ وړئ (ډیبګ> د ډیبګ کولو پرته پیل کړئ).
- د DPC++ یا د s تریډ شوی نسخه غوره کولو لپارهample، د پروسیسر تعریفونه وکاروئ.
- د پروژې ملکیتونو ته لاړ شئ> DPC++> پری پروسیسر> پری پروسیسر تعریف.
- icpx -fsycl یا USE_THR تعریف کړئ.
د GPU تحلیل پرمخ وړئ
په میټریکس کې د GPU تحلیل پرمخ وړئample.
- د بصری سټوډیو وسیلې بار څخه ، د تحلیل تنظیم کولو تڼۍ کلیک وکړئ.
د تنظیم تحلیل کړکۍ خلاصیږي. په ډیفالټ ډول، دا ستاسو د VS پروژې ترتیبات میراث کوي او د پرو لپاره د غوښتنلیک په توګه matrix_multiply.exe مشخص کويfile. - د تنظیم تحلیل کړکۍ کې، کلیک وکړئ
په HOW پین کې د لټون تڼۍ.
- د تحلیل ونې کې د سرعت کونکي ګروپ څخه د GPU کمپیوټ/میډیا هټ سپاټ تحلیل ډول غوره کړئ.
- د وړاندې شوي انتخابونو سره تحلیل پیل کولو لپاره د پیل تڼۍ کلیک وکړئ.
د کمانډ لاین څخه د GPU تحلیل پرمخ وړئ:
- s خلاص کړئampلارښود:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - په دې لارښود کې، د بصری سټوډیو * پروژه پرانیزئ file د matrix_multiply.sln په نوم
- د multiply.cpp file د میټریکس ضرب څو نسخې لري. په multiply.hpp کې د اړونده # تعریف MULTIPLY لاین ایډیټ کولو سره یوه نسخه غوره کړئ
- ټوله پروژه د ریلیز ترتیب سره جوړه کړئ.
دا د matrix_multiply.exe په نوم یو اجرا وړ تولیدوي. - د GPU تحلیل چلولو لپاره سیسټم چمتو کړئ. د GPU تحلیل لپاره سیسټم تنظیم کړئ وګورئ.
- VTune Pro تنظیم کړئfileد بیچ په چلولو سره د چاپیریال تغیرات file: صادرول \env\vars.bat
- د تحلیل کمانډ چل کړئ:
vtune.exe -gpu-offload راټول کړئ - matrix_multiply.exe
VTune Profiler ډاټا راټولوي او د GPU کمپیوټ/میډیا هټ سپاټونو کې د تحلیل پایلې ښیې viewټکی د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ ترڅو پوه شئ چې آیا ستاسو غوښتنلیک د GPU پورې تړلی دی. د ګرافیک کړکۍ ته لاړشئ ترڅو لومړني CPU او GPU میټریکونه وګورئ چې د وخت په تیریدو سره د کوډ اجرا کولو نمایندګي کوي.
د Intel® VTune™ پرو سره پیل کړئfiler د لینکس * OS لپاره
مخکې له دې چې تاسو پیل کړئ
- Intel® VTune™ Pro نصب کړئfileستاسو په لینکس * سیسټم کې.
- خپل غوښتنلیک د سمبول معلوماتو سره جوړ کړئ او په ریلیز حالت کې د ټولو اصلاحونو فعالولو سره. د تالیف کونکي تنظیماتو په اړه د تفصيلي معلوماتو لپاره ، VTune Pro وګورئfileد آنلاین کاروونکي لارښود.
تاسو کولی شئ د میټریکس s هم وکاروئampد غوښتنلیک شتون شتون لري \sample\matrix. تاسو کولی شئ وګورئampپه پایله کې \sample (میتریک). - د چاپیریال تغیرات تنظیم کړئ: سرچینه /setvars.sh
په ترتیب سره، د دی:- $HOME/intel/oneapi/ کله چې د کارونکي اجازې سره نصب شي؛
- /opt/intel/oneapi/ کله چې د روټ اجازې سره نصب شي.
1 ګام: د VTune پرو پیل کړئfiler
VTune پرو پیل کړئfileد دې لارو څخه یوه له لارې:
سرچینه / د VTune پرو پیل کړئfiler
واحد/IDE (GUI)
- د vtunegui کمانډ چل کړئ. د VTune پرو پیل کولو لپارهfileد انټیل سیسټم سټوډیو IDE څخه ، وسیلې> VTune Pro غوره کړئfiler> VTune Pro لانچ کړئfiler. دا ټول مناسب چاپیریال متغیرونه ټاکي او د محصول یو واحد انٹرفیس پیلوي.
- کله چې GUI خلاص شي، د ښه راغلاست په سکرین کې نوې پروژه کلیک وکړئ.
- د پروژې د جوړولو ډیالوګ بکس کې، د پروژې نوم او ځای مشخص کړئ.
- د پروژې په جوړولو کلیک وکړئ.
یوازینی (د کمانډ لاین)
- د vtune کمانډ چل کړئ.
2 ګام: تحلیل تنظیم او چلول
د نوې پروژې رامینځته کولو وروسته ، د تحلیل تحلیل کړکۍ د دې ډیفالټ ارزښتونو سره خلاصیږي:
- د غوښتنلیک لانچ برخه کې، د خپل غوښتنلیک ځای ته لټون وکړئ.
- په خپل غوښتنلیک کې د فعالیت سنیپ شاټ چلولو لپاره پیل کلیک وکړئ. دا تحلیل یو عمومي اوور وړاندې کويview هغه مسلې چې په هدف سیسټم کې ستاسو د غوښتنلیک فعالیت اغیزه کوي.
لومړی ګام: View او د فعالیت ډاټا تحلیل کړئ
کله چې د معلوماتو راټولول بشپړ شي، VTune Profiler د لنډیز په کړکۍ کې د تحلیل پایلې ښیې. دلته، تاسو یو فعالیت وګورئview ستاسو د غوښتنې.
اوورview په عموم ډول د دوی توضیحاتو سره ډیری میټریکونه شامل دي.
- A د ونډه اخیستونکو فکتورونو په اړه د مفصلو معلوماتو لپاره هر میټریک پراخ کړئ.
- B یو بیرغ شوی میټریک د منلو وړ / نورمال عملیاتي حد څخه بهر ارزښت په ګوته کوي. د وسیلې لارښوونې وکاروئ ترڅو پوه شئ چې څنګه د پرچم شوي میټریک ښه کول.
- C د نورو تحلیلونو لارښود وګورئ چې تاسو یې باید په راتلونکي کې په پام کې ونیسئ. د تحلیل ونې دا سپارښتنې په ګوته کوي.
راتلونکی ګامونه
د فعالیت سنیپ شاټ د VTune Pro سره د غوښتنلیک فعالیت عمومي ارزونې ترلاسه کولو لپاره یو ښه پیل ټکی دیfiler. بیا، وګورئ چې ایا ستاسو الګوریتم ټوننګ ته اړتیا لري.
- د عام فعالیت خنډونو تحلیل کولو لپاره لارښود تعقیب کړئ.
- یوځل چې ستاسو الګوریتم ښه تنظیم شوی وي ، د فعالیت سنیپ شاټ بیا چل کړئ ترڅو پایلې محاسبه کړي او په نورو برخو کې د فعالیت احتمالي پرمختګونه وپیژني.
دا هم وګورئ
د مایکرو آرکیټیکچر سپړنه
VTune Profileد مرستې سفر
Example: پروfile په لینکس کې د OpenMP غوښتنلیک*
د Intel VTune Pro وکاروئfileپه لینوکس ماشین کې پرو تهfile لکهample iso3dfd_omp_offload OpenMP غوښتنلیک په Intel GPU کې اپلوډ شوی. د GPU تحلیل چلولو څرنګوالی زده کړئ او پایلې معاینه کړئ.
شرطونه
- ډاډ ترلاسه کړئ چې ستاسو سیسټم د لینکس * OS کرنل 4.14 یا نوې نسخه پرمخ وړي.
- د Intel پروسیسر ګرافیک له دې نسخو څخه یوه وکاروئ:
- جنرال ۲
- جنرال ۲
- جنرال ۲
- ستاسو سیسټم باید د دې Intel پروسیسرونو څخه یو روان وي:
- د اووم نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم Kaby Lake)
- د اتم نسل Intel® Core™ i8 پروسیسرونه (د کوډ نوم کافي لیک)
- د 10th نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم آیس لیک)
- د لینکس GUI لپاره، وکاروئ:
- د GTK+ نسخه 2.10 یا نوې (2.18 او نوې نسخې وړاندیز کیږي)
- د پینګو نسخه 1.14 یا نوی
- د X.Org نسخه 1.0 یا نوې (1.7 او نوې نسخې وړاندیز کیږي)
- د Intel VTune Pro نصب کړئfileد دې سرچینو څخه یوه څخه:
- یوازینی محصول ډاونلوډ کړئ
- Intel® oneAPI بیس Toolkit
- د Intel® سیسټم راوستلو وسیله
- د Intel® oneAPI HPC Toolkit ډاونلوډ کړئ کوم چې د Intel® oneAPI DPC++/C++ کمپیلر (icx/icpx) لري چې تاسو ورته اړتیا لرئfile د OpenMP غوښتنلیکونه.
- د چاپیریال تغیرات تنظیم کړئ. vars.sh سکریپټ اجرا کړئ.
- خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.
د OpenMP آفلوډ غوښتنلیک جوړ او تالیف کړئ
- iso3dfd_omp_offload OpenMP Offload s ډاونلوډ کړئample.
- s ته خلاص کړئampد لارښود.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - د OpenMP آفلوډ غوښتنلیک تالیف کړئ.
mkdir جوړول
cmake -DVERIFY_RESULTS=0 ..
جوړ - j
دا د اجرا وړ src/iso3dfd تولیدوي.
د برنامه حذف کولو لپاره ، ټایپ کړئ:
پاکول
دا د اجرا وړ او اعتراض لرې کوي fileهغه چې تاسو د میک کمانډ سره رامینځته کړی.
د OpenMP آفلوډ غوښتنلیک کې د GPU تحلیل پرمخ وړئ
تاسو اوس چمتو یاست چې د OpenMP غوښتنلیک کې د GPU آفلوډ تحلیل چل کړئ چې تاسو یې ترتیب کړی.
- VTune Pro خلاص کړئfiler او د پروژې جوړولو لپاره په نوې پروژه کلیک وکړئ.
- د ښه راغلاست په پا onه کې ، د تحلیل تنظیم کولو لپاره کلیک وکړئ خپل تحلیل تنظیم کړئ.
- د خپل تحلیل لپاره دا ترتیبات غوره کړئ.
- په WHERE پین کې، ځایی کوربه غوره کړئ.
- په WHAT پین کې ، د لانچ غوښتنلیک غوره کړئ او د پرو لپاره د غوښتنلیک په توګه iso3dfd_omp_offload بائنری مشخص کړئfile.
- په HOW پین کې، د تحلیل ونې کې د سرعت ګروپ څخه د GPU آفلوډ تحلیل ډول غوره کړئ.
- د تحلیل پرمخ وړلو لپاره د پیل تڼۍ کلیک وکړئ.
VTune Profiler ډاټا راټولوي او د GPU آفلوډ کې د تحلیل پایلې ښیې viewټکی
- د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ. دا ډاټا وکاروئ ترڅو معلومه کړئ چې ستاسو غوښتنلیک دا دی:
- د GPU سره تړلی
- CPU پورې تړلی
- ستاسو د سیسټم محاسبې سرچینې په غیر موثر ډول کارول
- د لومړني CPU او GPU میټریکونو لیدلو لپاره د پلیټ فارم کړکۍ کې معلومات وکاروئ.
- د ګرافیک کړکۍ کې ځانګړي کمپیوټري دندې وپلټئ.
د ژورې تحلیل لپاره، په VTune Pro کې اړوند ترکیب وګورئfiler د فعالیت تحلیل کک کتاب. تاسو کولی شئ د GPU کمپیوټ/میډیا هټ سپاټ تحلیل سره خپل پروفایل کولو ته هم دوام ورکړئ.
Example: پروfile یو SYCL* په لینکس کې غوښتنلیک*
د VTune پرو وکاروئfiler سره لکهample matrix_multiply SYCL غوښتنلیک د GPU- پابند غوښتنلیکونو لپاره راټول شوي محصول او احصایو سره ګړندي آشنا کیدو لپاره.
شرطونه
- VTune Pro نصب کړئfiler او Intel® oneAPI DPC++/C++ د Intel® oneAPI بیس Toolkit یا Intel® System Bring-up Toolkit څخه کمپیلر.
- د vars.sh سکریپټ په اجرا کولو سره د چاپیریال تغیرات تنظیم کړئ.
- خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.
د میټریکس غوښتنلیک جوړ کړئ
د matrix_multiply_vtune کوډ ډاونلوډ کړئampد Intel oneAPI اوزار کټونو لپاره لی پیکج. پدې کې شامل ديample کوم چې تاسو کولی شئ د جوړولو او پرو لپاره وکاروئfile د SYCL غوښتنلیک.
پرو تهfile د SYCL غوښتنلیک، ډاډ ترلاسه کړئ چې کوډ د -gline-tables-only او -fdebug-info-for-profiling Intel oneAPI DPC++ کمپیلر انتخابونو په کارولو سره تالیف کړئ.
د دې تالیف کولو لپاره sampد غوښتنلیک، لاندې کار وکړئ:
- ته لاړ شهampد لارښود.
cd <sample_dir/VtuneProfiler/matrix_multiply> - د multiply.cpp file په src فولډر کې د میټریکس ضرب څو نسخې شاملې دي. په multiply.h کې د اړوند # تعریف MULTIPLY لاین په سمولو سره یوه نسخه غوره کړئ.
- د موجوده میک په کارولو سره اپلیکیشن جوړ کړئfile:
cmake
جوړول
دا باید د اجرا وړ matrix.icpx -fsycl تولید کړي.
د برنامه حذف کولو لپاره ، ټایپ کړئ:
پاکول
دا د اجرا وړ او اعتراض لرې کوي files چې د make کمانډ لخوا رامینځته شوي.
د GPU تحلیل پرمخ وړئ
په میټریکس کې د GPU تحلیل پرمخ وړئample.
- VTune Pro لانچ کړئfiler د vtune-gui کمانډ سره.
- د ښه راغلاست پاڼې څخه نوې پروژه کلیک وکړئ.
- ستاسو لپاره نوم او ځای مشخص کړئampپه پروژه کې کلیک وکړئ او د پروژې رامینځته کولو کلیک وکړئ.
- په WHAT پین کې، matrix.icpx-fsycl ته لټون وکړئ file.
- په HOW پین کې، کلیک وکړئ
د لټون تڼۍ وټاکئ او د تحلیل ونې کې د سرعت کونکي ګروپ څخه د GPU کمپیوټ/میډیا هټ سپاټ تحلیل غوره کړئ.
- په ښکته کې د پیل تڼۍ کلیک وکړئ ترڅو د مخکې غوره شوي انتخابونو سره تحلیل پیل کړئ.
د کمانډ لاین څخه د GPU تحلیل پرمخ وړئ:
- د GPU تحلیل چلولو لپاره سیسټم چمتو کړئ. د GPU تحلیل لپاره سیسټم تنظیم کړئ وګورئ.
- د Intel سافټویر وسیلو لپاره د چاپیریال تغیرات تنظیم کړئ:
سرچینه $ONEAPI_ROOT/setvars.sh - د GPU کمپیوټ/میډیا هټ سپاټ تحلیل پرمخ وړئ:
vtune -gpu-hotspots راټول کړئ -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
د لنډیز راپور لیدو لپاره، ټایپ کړئ:
vtune -د راپور لنډیز -r ./result_gpu-hotspots
VTune Profiler ډاټا راټولوي او د GPU کمپیوټ/میډیا هټ سپاټونو کې د تحلیل پایلې ښیې viewټکی د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ ترڅو پوه شئ چې آیا ستاسو غوښتنلیک د GPU پورې تړلی دی. د ګرافیک کړکۍ ته لاړشئ ترڅو لومړني CPU او GPU میټریکونه وګورئ چې د وخت په تیریدو سره د کوډ اجرا کولو نمایندګي کوي.
د Intel® VTune™ پرو سره پیل کړئfileد macOS لپاره r*
د VTune پرو وکاروئfiler په macOS سیسټم کې د ریموټ هدف تحلیل په غیر macOS سیسټم کې ترسره کړئ (یوازې لینکس* یا Android*).
تاسو نشئ کولی VTune Pro وکاروئfileد دې موخو لپاره په macOS چاپیریال کې:
- پروfile د macOS سیسټم چې دا نصب شوی.
- په لرې پرتو میکوس سیسټم کې ډاټا راټول کړئ.
د MacOS کوربه څخه د لرې پرتو لینکس * یا Android * هدف فعالیت تحلیل کولو لپاره ، له دې مرحلو څخه یو وکړئ:
- د VTune پرو چلولfileد هدف په توګه مشخص شوي ریموټ سیسټم سره د macOS سیسټم تحلیل. کله چې تحلیل پیل شي، VTune Profiler د ډیټا راټولولو لپاره ریموټ سیسټم سره وصل کیږي ، بیا پایلې بیرته د macOS کوربه ته راوړي viewing.
- په سیمه ایزه توګه د هدف سیسټم کې تحلیل پرمخ وړئ او پایلې یې د MacOS سیسټم ته کاپي کړئ viewپه VTune Pro کېfiler.
په دې سند کې مرحلې د لینوکس هدف سیسټم لیرې کوي او د VTune Pro څخه د SSH لاسرسي په کارولو سره د فعالیت ډیټا راټولويfiler په macOS کوربه سیسټم کې.
مخکې له دې چې تاسو پیل کړئ
- Intel® VTune™ Pro نصب کړئfileستاسو په macOS* سیسټم کې.
- خپل د لینکس غوښتنلیک د سمبول معلوماتو سره جوړ کړئ او په ریلیز حالت کې د ټولو اصلاحونو فعالولو سره. د تفصيلي معلوماتو لپاره، په VTune Pro کې د کمپیلر ترتیبات وګورئfiler مرسته.
- د کوربه macOS سیسټم څخه د هدف لینکس سیسټم ته د SSH لاسرسی تنظیم کړئ ترڅو د پاسورډ کم حالت کې کار وکړي.
1 ګام: د VTune پرو پیل کړئfiler
- VTune Pro لانچ کړئfiler د vtune-gui کمانډ سره.
په ترتیب سره، د دی /opt/intel/oneapi/. - کله چې GUI خلاص شي، د ښه راغلاست په سکرین کې نوې پروژه کلیک وکړئ.
- د پروژې د جوړولو ډیالوګ بکس کې، د پروژې نوم او ځای مشخص کړئ.
- د پروژې په جوړولو کلیک وکړئ.
2 ګام: تحلیل تنظیم او چلول
وروسته له دې چې تاسو یوه نوې پروژه جوړه کړئ، د تحلیل تحلیل کړکۍ د فعالیت سنیپ شاټ تحلیل ډول سره خلاصیږي.
دا تحلیل یو اوور وړاندې کويview د هغو مسلو څخه چې په نښه شوي سیسټم کې ستاسو د غوښتنلیک فعالیت اغیزه کوي.
- په WHERE پین کې، ریموټ لینکس (SSH) غوره کړئ او د هدف لینکس سیسټم د username@hostname [:port] په کارولو سره مشخص کړئ.
VTune Profiler د لینکس سیسټم سره وصل کیږي او د هدف کڅوړه نصبوي. - په WHAT پین کې، د هدف لینکس سیسټم کې ستاسو غوښتنلیک ته لاره چمتو کړئ.
- په غوښتنلیک کې د فعالیت سنیپ شاټ چلولو لپاره د سټارټ تڼۍ کلیک وکړئ.
لومړی ګام: View او د فعالیت ډاټا تحلیل کړئ
کله چې د معلوماتو راټولول بشپړ شي، VTune Profiler د macOS سیسټم کې د تحلیل پایلې ښیې. خپل تحلیل د لنډیز کړکۍ کې پیل کړئ. دلته، تاسو یو فعالیت وګورئview ستاسو د غوښتنې.
اوورview په عموم ډول د دوی توضیحاتو سره ډیری میټریکونه شامل دي.
- A د ونډه اخیستونکو فکتورونو په اړه د مفصلو معلوماتو لپاره هر میټریک پراخ کړئ.
- B یو بیرغ شوی میټریک د منلو وړ / نورمال عملیاتي حد څخه بهر ارزښت په ګوته کوي. د وسیلې لارښوونې وکاروئ ترڅو پوه شئ چې څنګه د پرچم شوي میټریک ښه کول.
- C د نورو تحلیلونو لارښود وګورئ چې تاسو یې باید په راتلونکي کې په پام کې ونیسئ. د تحلیل ونې دا سپارښتنې په ګوته کوي.
راتلونکی ګامونه
د فعالیت سنیپ شاټ د VTune Pro سره د غوښتنلیک فعالیت عمومي ارزونې ترلاسه کولو لپاره یو ښه پیل ټکی دیfiler.
بیا، وګورئ چې ایا ستاسو الګوریتم ټوننګ ته اړتیا لري.
- په خپل غوښتنلیک کې د هټ سپاټونو تحلیل پرمخ وړئ.
- د Hotspots ټیوټوریل تعقیب کړئ. ستاسو د Hotspots تحلیل څخه ډیره ګټه ترلاسه کولو تخنیکونه زده کړئ.
- یوځل چې ستاسو الګوریتم ښه تنظیم شوی وي ، د فعالیت سنیپ شاټ بیا چل کړئ ترڅو پایلې محاسبه کړي او په نورو برخو کې د فعالیت احتمالي پرمختګونه وپیژني.
دا هم وګورئ
د مایکرو آرکیټیکچر سپړنه
VTune Profileد مرستې سفر
نور زده کړئ
سند / توضیحات
- د کارن لارښود
د کارونکي لارښود د VTune پرو لپاره لومړني اسناد ديfiler.
نوټ
تاسو کولی شئ د VTune پرو آفلاین نسخه هم ډاونلوډ کړئfiler اسناد. - آنلاین روزنه
د آنلاین روزنې سایټ د VTune Pro اساساتو زده کولو لپاره عالي سرچینه دهfileد پیل کولو لارښودونو، ویډیوګانو، درسونو، webinars، او تخنیکي مقالې. - د پخلي کتاب
د فعالیت تحلیل کک بوک چې په VTune Pro کې د تحلیل ډولونو په کارولو سره د مشهور فعالیت ستونزې پیژندلو او حل کولو ترکیبونه لريfiler. - د وینډوز لپاره د نصبولو لارښود | لینکس | macOS کوربه
د نصبولو لارښود د VTune Pro لپاره د نصب کولو لومړني لارښوونې لريfileد مختلف چلوونکو او راټولونکو لپاره د نصب کولو وروسته ترتیب کولو لارښوونې. - درسونه
VTune Profiler ښوونې د لنډیز سره د لومړني ځانګړتیاو له لارې نوي کارونکي ته لارښوونه کويampد غوښتنلیک. - د خوشې یادښتونه
د VTune Pro د وروستي نسخې په اړه معلومات ترلاسه کړئfiler، د نویو ځانګړتیاوو، د سیسټم اړتیاو، او تخنیکي مسلو چې حل شوي جامع توضیحات شامل دي.
د VTune Pro د سټایلون او تولک کټ نسخو لپارهfiler، د اوسني سیسټم اړتیاوې درک کړئ.
خبرتیاوې او اعلانونه
انٹیل ټیکنالوژي ممکن وړ هارډویر ، سافټویر یا خدمت فعالولو ته اړتیا ولري.
هیڅ محصول یا برخه نشي کولی په بشپړ ډول خوندي وي.
ستاسو لګښتونه او پایلې ممکن توپیر ولري.
© Intel Corporation. Intel، د Intel لوگو، او د Intel نورې نښې د Intel Corporation یا د هغې د فرعي شرکتونو سوداګریزې نښې دي. نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
Intel، د Intel لوگو، Intel Atom، Intel Core، Intel Xeon Phi، VTune او Xeon په متحده ایالاتو او/یا نورو هیوادونو کې د انټل کارپوریشن سوداګریزې نښې دي.
* نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
مایکروسافټ، وینډوز، او وینډوز لوگو په متحده ایالاتو او/یا نورو هیوادونو کې د مایکروسافټ کارپوریشن سوداګریزې نښې یا راجستر شوي سوداګریزې نښې دي.
جاوا د اوریکل او / یا د هغې اړوند ملګرو راجسټر شوی سوداګریز نښه ده.
OpenCL او OpenCL لوگو د Apple Inc. سوداګریزې نښې دي چې د Khronos لخوا په اجازې کارول کیږي.
انٹیل ټیکنالوژي ممکن وړ هارډویر ، سافټویر یا خدمت فعالولو ته اړتیا ولري.
هیڅ محصول یا برخه نشي کولی په بشپړ ډول خوندي وي.
ستاسو لګښتونه او پایلې ممکن توپیر ولري.
© Intel Corporation. Intel، د Intel لوگو، او د Intel نورې نښې د Intel Corporation یا د هغې د فرعي شرکتونو سوداګریزې نښې دي. نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
Intel، د Intel لوگو، Intel Atom، Intel Core، Intel Xeon Phi، VTune او Xeon په متحده ایالاتو او/یا نورو هیوادونو کې د انټل کارپوریشن سوداګریزې نښې دي.
* نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
مایکروسافټ، وینډوز، او وینډوز لوگو په متحده ایالاتو او/یا نورو هیوادونو کې د مایکروسافټ کارپوریشن سوداګریزې نښې یا راجستر شوي سوداګریزې نښې دي.
جاوا د اوریکل او / یا د هغې اړوند ملګرو راجسټر شوی سوداګریز نښه ده.
OpenCL او OpenCL لوگو د Apple Inc. سوداګریزې نښې دي چې د Khronos لخوا په اجازې کارول کیږي.
اسناد / سرچینې
![]() |
intel د VTune پرو سره پیل کړئfiler [pdf] د کارونکي لارښود د VTune پرو سره پیل کړئfiler، د VTune پرو سره پیل کړئfiler، VTune Profiler |