intel-Get-Started-with-VTune-Profiler-لوګو

intel د VTune پرو سره پیل کړئfiler

د Intel® VTune™ پرو سره پیل کړئfiler

د Intel VTune Pro وکاروئfileد وینډوز *، macOS*، او لینکس * کوربه څخه د محلي او لیرې هدف سیسټمونو تحلیل کولو لپاره. د دې عملیاتو له لارې د غوښتنلیک او سیسټم فعالیت ښه کړئ:

  • د الګوریتم انتخابونه تحلیل کړئ.
  • سیریل او موازي کوډ خنډونه ومومئ.
  • پوه شئ چې چیرې او څنګه ستاسو غوښتنلیک د موجود هارډویر سرچینو څخه ګټه پورته کولی شي.
  • ستاسو د غوښتنلیک اجرا کول ګړندي کړئ.
    د Intel VTune Pro ډاونلوډ کړئfileستاسو په سیسټم کې د دې لارو څخه یو له لارې:
  • د سټنډرډ نسخه ډاونلوډ کړئ.
  • د Intel VTune Pro ترلاسه کړئfileد Intel® oneAPI بیس Toolkit د یوې برخې په توګه.
    د VTune پرو وګورئfileد ویډیوګانو لپاره د روزنې پاڼه، webinars، او نور مواد چې تاسو سره د پیل کولو کې مرسته کوي.

نوټ
د Intel® VTune™ پرو نسخو لپاره اسنادfileد 2021 ریلیز څخه دمخه یوازې د ډاونلوډ لپاره شتون لري. د محصول نسخه لخوا د شته اسنادو ډاونلوډونو لیست لپاره، دا پاڼې وګورئ:

  • د Intel Parallel Studio XE لپاره اسناد ډاونلوډ کړئ
  • د انټیل سیسټم سټوډیو لپاره اسناد ډاونلوډ کړئ

د کار جریان درک کړئ
د Intel VTune Pro وکاروئfiler to profile د فعالیت ښه کولو لپاره غوښتنلیک او پایلې تحلیل کړئ.

عمومي کاري جریان دا مرحلې لري:

intel-Get-Started-with-VTune-Profiler-01

د پیل کولو لپاره خپل کوربه سیسټم غوره کړئ
د وینډوز*، لینکس*، یا macOS* لپاره د سیسټم ځانګړي کاري فلو په اړه نور معلومات ترلاسه کړئ.

intel-Get-Started-with-VTune-Profiler-02

د Intel® VTune™ پرو سره پیل کړئfileد وینډوز * OS لپاره

مخکې له دې چې تاسو پیل کړئ

  1. Intel® VTune™ Pro نصب کړئfileستاسو په وینډوز * سیسټم کې.
  2. خپل غوښتنلیک د سمبول معلوماتو سره جوړ کړئ او په ریلیز حالت کې د ټولو اصلاحونو فعالولو سره. د تالیف کونکي تنظیماتو په اړه د تفصيلي معلوماتو لپاره ، VTune Pro وګورئfileد آنلاین کاروونکي لارښود.
    تاسو کولی شئ د میټریکس s هم وکاروئampد غوښتنلیک شتون شتون لري \VTune\Samples\matrix. تاسو کولی شئ اړوند s وګورئampپه پایله کې \VTune\پروژې\sample (میتریک).
  3. د چاپیریال تغیرات تنظیم کړئ: چلول \setvars.bat سکریپټ.
    په ترتیب سره، د د OneAPI برخو لپاره برنامه ده Files (x86)\Intel\oneAPI.
    نوټ تاسو اړتیا نلرئ setvars.bat چلولو کله چې Intel® VTune™ پرو کاروئfiler په مایکروسافټ * بصری سټوډیو* کې.

1 ګام: Intel® VTune™ پرو پیل کړئfiler
Intel VTune Pro پیل کړئfileد دې لارو څخه یوه له لارې او یوه پروژه جوړه کړئ. پروژه د هغه غوښتنلیک لپاره یو کانټینر دی چې تاسو یې تحلیل کول غواړئ، د تحلیل ډول، او د معلوماتو راټولولو پایلې.

سرچینه / د VTune پرو پیل کړئfiler

یوازینی (GUI)

  1. د vtune-gui کمانډ چل کړئ یا Intel® VTune™ پرو چل کړئfileد سټارټ مینو څخه.
  2. کله چې GUI خلاص شي، د ښه راغلاست په سکرین کې کلیک وکړئ.
  3. د پروژې د جوړولو ډیالوګ بکس کې، د پروژې نوم او ځای مشخص کړئ.
  4. د پروژې په جوړولو کلیک وکړئ.

یوازینی (د کمانډ لاین)
د vtune کمانډ چل کړئ.

مایکروسافټ * ویژول سټوډیو * IDE
خپل حل په بصری سټوډیو کې خلاص کړئ. د VTune پروfiler اوزار بار په اوتومات ډول فعال شوی او ستاسو د لید سټوډیو پروژه د تحلیل هدف په توګه ټاکل شوې.

نوټ
تاسو اړتیا نلرئ یوه پروژه رامینځته کړئ کله چې Intel® VTune™ Pro چلويfileد کمانډ لاین څخه یا د مایکروسافټ * لید سټوډیو کې دننه.

2 ګام: تحلیل تنظیم او چلول
د نوې پروژې رامینځته کولو وروسته ، د تحلیل تحلیل کړکۍ د دې ډیفالټ ارزښتونو سره خلاصیږي:

intel-Get-Started-with-VTune-Profiler-03

  1. د لانچ غوښتنلیک برخه کې، د خپل غوښتنلیک د اجرا وړ ځای ته لټون وکړئ file.
  2. په خپل غوښتنلیک کې د فعالیت سنیپ شاټ چلولو لپاره پیل کلیک وکړئ. دا تحلیل یو عمومي اوور وړاندې کويview هغه مسلې چې په هدف سیسټم کې ستاسو د غوښتنلیک فعالیت اغیزه کوي.

لومړی ګام: View او د فعالیت ډاټا تحلیل کړئ
کله چې د معلوماتو راټولول بشپړ شي، VTune Profiler د لنډیز په کړکۍ کې د تحلیل پایلې ښیې. دلته، تاسو یو فعالیت وګورئview ستاسو د غوښتنې.
اوورview په عموم ډول د دوی توضیحاتو سره ډیری میټریکونه شامل دي.

intel-Get-Started-with-VTune-Profiler-04

  • A د ونډه اخیستونکو فکتورونو په اړه د مفصلو معلوماتو لپاره هر میټریک پراخ کړئ.
  • B یو بیرغ شوی میټریک د منلو وړ / نورمال عملیاتي حد څخه بهر ارزښت په ګوته کوي. د وسیلې لارښوونې وکاروئ ترڅو پوه شئ چې څنګه د پرچم شوي میټریک ښه کول.
  • C د نورو تحلیلونو لارښود وګورئ چې تاسو یې باید په راتلونکي کې په پام کې ونیسئ. د تحلیل ونې دا سپارښتنې په ګوته کوي.

راتلونکی ګامونه
د فعالیت سنیپ شاټ د VTune Pro سره د غوښتنلیک فعالیت عمومي ارزونې ترلاسه کولو لپاره یو ښه پیل ټکی دیfiler. بیا، وګورئ چې ایا ستاسو الګوریتم ټوننګ ته اړتیا لري.

  1. د عام فعالیت خنډونو تحلیل کولو لپاره لارښود تعقیب کړئ.
  2. یوځل چې ستاسو الګوریتم ښه تنظیم شوی وي ، د فعالیت سنیپ شاټ بیا چل کړئ ترڅو پایلې محاسبه کړي او په نورو برخو کې د فعالیت احتمالي پرمختګونه وپیژني.

دا هم وګورئ
د مایکرو آرکیټیکچر سپړنه

VTune Profileد مرستې سفر

ExampLe: پروfile په وینډوز کې د OpenMP* غوښتنلیک*
د Intel VTune Pro وکاروئfileپه وینډوز ماشین کې پرو تهfile لکهample iso3dfd_omp_offload OpenMP غوښتنلیک په Intel GPU کې اپلوډ شوی. د GPU تحلیل چلولو څرنګوالی زده کړئ او پایلې معاینه کړئ.

شرطونه

  • ډاډ ترلاسه کړئ چې ستاسو سیسټم د مایکروسافټ * وینډوز 10 یا نوې نسخه پرمخ وړي.
  • د Intel پروسیسر ګرافیک له دې نسخو څخه یوه وکاروئ:
    • جنرال ۲
    • جنرال ۲
    • جنرال ۲
  • ستاسو سیسټم باید د دې Intel پروسیسرونو څخه یو روان وي:
    • د اووم نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم Kaby Lake)
    • د اتم نسل Intel® Core™ i8 پروسیسرونه (د کوډ نوم کافي لیک)
    • د 10th نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم آیس لیک)
  • د Intel VTune Pro نصب کړئfileد دې سرچینو څخه یوه څخه:
    • یوازینی محصول ډاونلوډ کړئ
    • Intel® oneAPI بیس Toolkit
    • د Intel® سیسټم راوستلو وسیله
  • د Intel® oneAPI HPC Toolkit ډاونلوډ کړئ کوم چې د Intel® oneAPI DPC++/C++ کمپیلر (icx/icpx) لري چې تاسو ورته اړتیا لرئfile د OpenMP غوښتنلیکونه.
  • د چاپیریال تغیرات تنظیم کړئ. د vars.bat سکریپټ اجرا کړئ چې په کې موقعیت لري \env لارښود.
  • خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.

نوټ
د Intel VTune Pro نصبولو لپارهfileد مایکروسافټ * ویژول سټوډیو چاپیریال کې ، د VTune پرو وګورئfiler د کارونکي لارښود.

د OpenMP آفلوډ غوښتنلیک جوړ او تالیف کړئ

  1. iso3dfd_omp_offload OpenMP Offload s ډاونلوډ کړئample.
  2. s ته خلاص کړئampد لارښود.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. د OpenMP آفلوډ غوښتنلیک تالیف کړئ.

mkdir جوړول
سي ډي جوړول
icx /std:c++17 /EHsc /Qiopenmp /I../شامل\ /Qopenmp هدفونه:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

د OpenMP آفلوډ غوښتنلیک کې د GPU تحلیل پرمخ وړئ
تاسو اوس چمتو یاست چې د OpenMP غوښتنلیک کې د GPU آفلوډ تحلیل چل کړئ چې تاسو یې ترتیب کړی.

  1. VTune Pro خلاص کړئfiler او د پروژې جوړولو لپاره په نوې پروژه کلیک وکړئ.
  2. د ښه راغلاست په پا onه کې ، د تحلیل تنظیم کولو لپاره کلیک وکړئ خپل تحلیل تنظیم کړئ.
  3. د خپل تحلیل لپاره دا ترتیبات غوره کړئ.
    • په WHERE پین کې، ځایی کوربه غوره کړئ.
    • په WHAT پین کې ، د لانچ غوښتنلیک غوره کړئ او د پرو لپاره د غوښتنلیک په توګه iso3dfd_omp_offload بائنری مشخص کړئfile.
    • په HOW پین کې، د تحلیل ونې کې د سرعت ګروپ څخه د GPU آفلوډ تحلیل ډول غوره کړئ.
      intel-Get-Started-with-VTune-Profiler-05
  4. د تحلیل پرمخ وړلو لپاره د پیل تڼۍ کلیک وکړئ.

VTune Profiler ډاټا راټولوي او د GPU آفلوډ کې د تحلیل پایلې ښیې viewټکی

  • د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ. دا ډاټا وکاروئ ترڅو معلومه کړئ چې ستاسو غوښتنلیک دا دی:
    • د GPU سره تړلی
    • CPU پورې تړلی
    • ستاسو د سیسټم محاسبې سرچینې په غیر موثر ډول کارول
  • د لومړني CPU او GPU میټریکونو لیدلو لپاره د پلیټ فارم کړکۍ کې معلومات وکاروئ.
  • د ګرافیک کړکۍ کې ځانګړي کمپیوټري دندې وپلټئ.

د ژورې تحلیل لپاره، په VTune Pro کې اړوند ترکیب وګورئfiler د فعالیت تحلیل کک کتاب. تاسو کولی شئ د GPU کمپیوټ/میډیا هټ سپاټ تحلیل سره خپل پروفایل کولو ته هم دوام ورکړئ.

Example: پروfile په وینډوز کې د SYCL* غوښتنلیک
پروfile لکهample matrix_multiply SYCL غوښتنلیک د Intel® VTune™ پرو سرهfiler. د محصول سره آشنا شئ او د GPU پورې تړلي غوښتنلیکونو لپاره راټول شوي احصایې پوهیږئ.

شرطونه

  • ډاډ ترلاسه کړئ چې تاسو په خپل سیسټم کې د مایکروسافټ * لید سټوډیو (v2017 یا نوي) نصب کړی.
  • د Intel VTune Pro نصب کړئfileد Intel® oneAPI Base Toolkit یا Intel® System Bring-up Toolkit څخه. دا اوزار کټونه د Intel® oneAPI DPC++/C++ کمپیلر (icpx -fsycl) کمپیلر لري چې د پروفایل کولو پروسې لپاره اړین دي.
  • د چاپیریال تغیرات تنظیم کړئ. د vars.bat سکریپټ اجرا کړئ چې په کې موقعیت لري \env لارښود.
  • ډاډ ترلاسه کړئ چې د Intel oneAPI DPC++ کمپیلر (د Intel oneAPI بیس وسیلې کټ سره نصب شوی) د مایکروسافټ ویژول سټوډیو کې مدغم شوی.
  • د Intel oneAPI DPC++ کمپیلر لپاره د -gline-tables-only او -fdebug-info-for-profiling اختیارونو په کارولو سره کوډ تالیف کړئ.
  • خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.

د Intel VTune Pro نصبولو په اړه د معلوماتو لپارهfileد مایکروسافټ * ویژول سټوډیو چاپیریال کې ، VTune Pro وګورئfiler د کارونکي لارښود.

د میټریکس اپلیکیشن جوړ کړئ
د matrix_multiply_vtune کوډ ډاونلوډ کړئampد Intel oneAPI اوزار کټونو لپاره لی پیکج. پدې کې شامل ديample کوم چې تاسو کولی شئ د جوړولو او پرو لپاره وکاروئfile د SYCL غوښتنلیک.

  1. د مایکروسافټ * بصری سټوډیو خلاص کړئ.
  2. کلیک وکړئ File > خلاص > پروژه/حل. د matrix_multiply_vtune فولډر ومومئ او matrix_multiply.sln غوره کړئ.
  3. دا ترتیب جوړ کړئ (پروژه> جوړ کړئ).
  4. برنامه پرمخ وړئ (ډیبګ> د ډیبګ کولو پرته پیل کړئ).
  5. د DPC++ یا د s تریډ شوی نسخه غوره کولو لپارهample، د پروسیسر تعریفونه وکاروئ.
    1. د پروژې ملکیتونو ته لاړ شئ> DPC++> پری پروسیسر> پری پروسیسر تعریف.
    2. icpx -fsycl یا USE_THR تعریف کړئ.

د GPU تحلیل پرمخ وړئ
په میټریکس کې د GPU تحلیل پرمخ وړئample.

  1. د بصری سټوډیو وسیلې بار څخه ، د تحلیل تنظیم کولو تڼۍ کلیک وکړئ.
    د تنظیم تحلیل کړکۍ خلاصیږي. په ډیفالټ ډول، دا ستاسو د VS پروژې ترتیبات میراث کوي او د پرو لپاره د غوښتنلیک په توګه matrix_multiply.exe مشخص کويfile.
  2. د تنظیم تحلیل کړکۍ کې، کلیک وکړئintel-Get-Started-with-VTune-Profiler-06 په HOW پین کې د لټون تڼۍ.
  3. د تحلیل ونې کې د سرعت کونکي ګروپ څخه د GPU کمپیوټ/میډیا هټ سپاټ تحلیل ډول غوره کړئ.
    intel-Get-Started-with-VTune-Profiler-06
  4. د وړاندې شوي انتخابونو سره تحلیل پیل کولو لپاره د پیل تڼۍ کلیک وکړئ.

د کمانډ لاین څخه د GPU تحلیل پرمخ وړئ:

  1. s خلاص کړئampلارښود:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. په دې لارښود کې، د بصری سټوډیو * پروژه پرانیزئ file د matrix_multiply.sln په نوم
  3. د multiply.cpp file د میټریکس ضرب څو نسخې لري. په multiply.hpp کې د اړونده # تعریف MULTIPLY لاین ایډیټ کولو سره یوه نسخه غوره کړئ
  4. ټوله پروژه د ریلیز ترتیب سره جوړه کړئ.
    دا د matrix_multiply.exe په نوم یو اجرا وړ تولیدوي.
  5. د GPU تحلیل چلولو لپاره سیسټم چمتو کړئ. د GPU تحلیل لپاره سیسټم تنظیم کړئ وګورئ.
  6. VTune Pro تنظیم کړئfileد بیچ په چلولو سره د چاپیریال تغیرات file: صادرول \env\vars.bat
  7. د تحلیل کمانډ چل کړئ:
    vtune.exe -gpu-offload راټول کړئ - matrix_multiply.exe

VTune Profiler ډاټا راټولوي او د GPU کمپیوټ/میډیا هټ سپاټونو کې د تحلیل پایلې ښیې viewټکی د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ ترڅو پوه شئ چې آیا ستاسو غوښتنلیک د GPU پورې تړلی دی. د ګرافیک کړکۍ ته لاړشئ ترڅو لومړني CPU او GPU میټریکونه وګورئ چې د وخت په تیریدو سره د کوډ اجرا کولو نمایندګي کوي.

د Intel® VTune™ پرو سره پیل کړئfiler د لینکس * OS لپاره

مخکې له دې چې تاسو پیل کړئ

  1. Intel® VTune™ Pro نصب کړئfileستاسو په لینکس * سیسټم کې.
  2. خپل غوښتنلیک د سمبول معلوماتو سره جوړ کړئ او په ریلیز حالت کې د ټولو اصلاحونو فعالولو سره. د تالیف کونکي تنظیماتو په اړه د تفصيلي معلوماتو لپاره ، VTune Pro وګورئfileد آنلاین کاروونکي لارښود.
    تاسو کولی شئ د میټریکس s هم وکاروئampد غوښتنلیک شتون شتون لري \sample\matrix. تاسو کولی شئ وګورئampپه پایله کې \sample (میتریک).
  3. د چاپیریال تغیرات تنظیم کړئ: سرچینه /setvars.sh
    په ترتیب سره، د دی:
    • $HOME/intel/oneapi/ کله چې د کارونکي اجازې سره نصب شي؛
    • /opt/intel/oneapi/ کله چې د روټ اجازې سره نصب شي.

1 ګام: د VTune پرو پیل کړئfiler
VTune پرو پیل کړئfileد دې لارو څخه یوه له لارې:

سرچینه / د VTune پرو پیل کړئfiler
واحد/IDE (GUI)

  1. د vtunegui کمانډ چل کړئ. د VTune پرو پیل کولو لپارهfileد انټیل سیسټم سټوډیو IDE څخه ، وسیلې> VTune Pro غوره کړئfiler> VTune Pro لانچ کړئfiler. دا ټول مناسب چاپیریال متغیرونه ټاکي او د محصول یو واحد انٹرفیس پیلوي.
  2. کله چې GUI خلاص شي، د ښه راغلاست په سکرین کې نوې پروژه کلیک وکړئ.
  3. د پروژې د جوړولو ډیالوګ بکس کې، د پروژې نوم او ځای مشخص کړئ.
  4. د پروژې په جوړولو کلیک وکړئ.

یوازینی (د کمانډ لاین)

  • د vtune کمانډ چل کړئ.

2 ګام: تحلیل تنظیم او چلول
د نوې پروژې رامینځته کولو وروسته ، د تحلیل تحلیل کړکۍ د دې ډیفالټ ارزښتونو سره خلاصیږي:

intel-Get-Started-with-VTune-Profiler-07

  1. د غوښتنلیک لانچ برخه کې، د خپل غوښتنلیک ځای ته لټون وکړئ.
  2. په خپل غوښتنلیک کې د فعالیت سنیپ شاټ چلولو لپاره پیل کلیک وکړئ. دا تحلیل یو عمومي اوور وړاندې کويview هغه مسلې چې په هدف سیسټم کې ستاسو د غوښتنلیک فعالیت اغیزه کوي.

لومړی ګام: View او د فعالیت ډاټا تحلیل کړئ
کله چې د معلوماتو راټولول بشپړ شي، VTune Profiler د لنډیز په کړکۍ کې د تحلیل پایلې ښیې. دلته، تاسو یو فعالیت وګورئview ستاسو د غوښتنې.
اوورview په عموم ډول د دوی توضیحاتو سره ډیری میټریکونه شامل دي.

intel-Get-Started-with-VTune-Profiler-08

  • A د ونډه اخیستونکو فکتورونو په اړه د مفصلو معلوماتو لپاره هر میټریک پراخ کړئ.
  • B یو بیرغ شوی میټریک د منلو وړ / نورمال عملیاتي حد څخه بهر ارزښت په ګوته کوي. د وسیلې لارښوونې وکاروئ ترڅو پوه شئ چې څنګه د پرچم شوي میټریک ښه کول.
  • C د نورو تحلیلونو لارښود وګورئ چې تاسو یې باید په راتلونکي کې په پام کې ونیسئ. د تحلیل ونې دا سپارښتنې په ګوته کوي.

راتلونکی ګامونه
د فعالیت سنیپ شاټ د VTune Pro سره د غوښتنلیک فعالیت عمومي ارزونې ترلاسه کولو لپاره یو ښه پیل ټکی دیfiler. بیا، وګورئ چې ایا ستاسو الګوریتم ټوننګ ته اړتیا لري.

  1. د عام فعالیت خنډونو تحلیل کولو لپاره لارښود تعقیب کړئ.
  2. یوځل چې ستاسو الګوریتم ښه تنظیم شوی وي ، د فعالیت سنیپ شاټ بیا چل کړئ ترڅو پایلې محاسبه کړي او په نورو برخو کې د فعالیت احتمالي پرمختګونه وپیژني.

دا هم وګورئ
د مایکرو آرکیټیکچر سپړنه

VTune Profileد مرستې سفر

Example: پروfile په لینکس کې د OpenMP غوښتنلیک*
د Intel VTune Pro وکاروئfileپه لینوکس ماشین کې پرو تهfile لکهample iso3dfd_omp_offload OpenMP غوښتنلیک په Intel GPU کې اپلوډ شوی. د GPU تحلیل چلولو څرنګوالی زده کړئ او پایلې معاینه کړئ.

شرطونه

  • ډاډ ترلاسه کړئ چې ستاسو سیسټم د لینکس * OS کرنل 4.14 یا نوې نسخه پرمخ وړي.
  • د Intel پروسیسر ګرافیک له دې نسخو څخه یوه وکاروئ:
    • جنرال ۲
    • جنرال ۲
    • جنرال ۲
  • ستاسو سیسټم باید د دې Intel پروسیسرونو څخه یو روان وي:
    • د اووم نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم Kaby Lake)
    • د اتم نسل Intel® Core™ i8 پروسیسرونه (د کوډ نوم کافي لیک)
    • د 10th نسل Intel® Core™ i7 پروسیسرونه (د کوډ نوم آیس لیک)
  • د لینکس GUI لپاره، وکاروئ:
    • د GTK+ نسخه 2.10 یا نوې (2.18 او نوې نسخې وړاندیز کیږي)
    • د پینګو نسخه 1.14 یا نوی
    • د X.Org نسخه 1.0 یا نوې (1.7 او نوې نسخې وړاندیز کیږي)
  • د Intel VTune Pro نصب کړئfileد دې سرچینو څخه یوه څخه:
    • یوازینی محصول ډاونلوډ کړئ
    • Intel® oneAPI بیس Toolkit
    • د Intel® سیسټم راوستلو وسیله
  • د Intel® oneAPI HPC Toolkit ډاونلوډ کړئ کوم چې د Intel® oneAPI DPC++/C++ کمپیلر (icx/icpx) لري چې تاسو ورته اړتیا لرئfile د OpenMP غوښتنلیکونه.
  • د چاپیریال تغیرات تنظیم کړئ. vars.sh سکریپټ اجرا کړئ.
  • خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.

د OpenMP آفلوډ غوښتنلیک جوړ او تالیف کړئ

  1. iso3dfd_omp_offload OpenMP Offload s ډاونلوډ کړئample.
  2. s ته خلاص کړئampد لارښود.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. د OpenMP آفلوډ غوښتنلیک تالیف کړئ.

mkdir جوړول
cmake -DVERIFY_RESULTS=0 ..
جوړ - j

دا د اجرا وړ src/iso3dfd تولیدوي.

د برنامه حذف کولو لپاره ، ټایپ کړئ:
پاکول

دا د اجرا وړ او اعتراض لرې کوي fileهغه چې تاسو د میک کمانډ سره رامینځته کړی.

د OpenMP آفلوډ غوښتنلیک کې د GPU تحلیل پرمخ وړئ
تاسو اوس چمتو یاست چې د OpenMP غوښتنلیک کې د GPU آفلوډ تحلیل چل کړئ چې تاسو یې ترتیب کړی.

  1. VTune Pro خلاص کړئfiler او د پروژې جوړولو لپاره په نوې پروژه کلیک وکړئ.
  2. د ښه راغلاست په پا onه کې ، د تحلیل تنظیم کولو لپاره کلیک وکړئ خپل تحلیل تنظیم کړئ.
  3. د خپل تحلیل لپاره دا ترتیبات غوره کړئ.
    • په WHERE پین کې، ځایی کوربه غوره کړئ.
    • په WHAT پین کې ، د لانچ غوښتنلیک غوره کړئ او د پرو لپاره د غوښتنلیک په توګه iso3dfd_omp_offload بائنری مشخص کړئfile.
    • په HOW پین کې، د تحلیل ونې کې د سرعت ګروپ څخه د GPU آفلوډ تحلیل ډول غوره کړئ.
      intel-Get-Started-with-VTune-Profiler-09
  4. د تحلیل پرمخ وړلو لپاره د پیل تڼۍ کلیک وکړئ.

VTune Profiler ډاټا راټولوي او د GPU آفلوډ کې د تحلیل پایلې ښیې viewټکی

  • د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ. دا ډاټا وکاروئ ترڅو معلومه کړئ چې ستاسو غوښتنلیک دا دی:
    • د GPU سره تړلی
    • CPU پورې تړلی
    • ستاسو د سیسټم محاسبې سرچینې په غیر موثر ډول کارول
  • د لومړني CPU او GPU میټریکونو لیدلو لپاره د پلیټ فارم کړکۍ کې معلومات وکاروئ.
  • د ګرافیک کړکۍ کې ځانګړي کمپیوټري دندې وپلټئ.

د ژورې تحلیل لپاره، په VTune Pro کې اړوند ترکیب وګورئfiler د فعالیت تحلیل کک کتاب. تاسو کولی شئ د GPU کمپیوټ/میډیا هټ سپاټ تحلیل سره خپل پروفایل کولو ته هم دوام ورکړئ.

Example: پروfile یو SYCL* په لینکس کې غوښتنلیک*
د VTune پرو وکاروئfiler سره لکهample matrix_multiply SYCL غوښتنلیک د GPU- پابند غوښتنلیکونو لپاره راټول شوي محصول او احصایو سره ګړندي آشنا کیدو لپاره.

شرطونه

  • VTune Pro نصب کړئfiler او Intel® oneAPI DPC++/C++ د Intel® oneAPI بیس Toolkit یا Intel® System Bring-up Toolkit څخه کمپیلر.
  • د vars.sh سکریپټ په اجرا کولو سره د چاپیریال تغیرات تنظیم کړئ.
  • خپل سیسټم د GPU تحلیل لپاره تنظیم کړئ.

د میټریکس غوښتنلیک جوړ کړئ
د matrix_multiply_vtune کوډ ډاونلوډ کړئampد Intel oneAPI اوزار کټونو لپاره لی پیکج. پدې کې شامل ديample کوم چې تاسو کولی شئ د جوړولو او پرو لپاره وکاروئfile د SYCL غوښتنلیک.

پرو تهfile د SYCL غوښتنلیک، ډاډ ترلاسه کړئ چې کوډ د -gline-tables-only او -fdebug-info-for-profiling Intel oneAPI DPC++ کمپیلر انتخابونو په کارولو سره تالیف کړئ.

د دې تالیف کولو لپاره sampد غوښتنلیک، لاندې کار وکړئ:

  1. ته لاړ شهampد لارښود.
    cd <sample_dir/VtuneProfiler/matrix_multiply>
  2. د multiply.cpp file په src فولډر کې د میټریکس ضرب څو نسخې شاملې دي. په multiply.h کې د اړوند # تعریف MULTIPLY لاین په سمولو سره یوه نسخه غوره کړئ.
  3. د موجوده میک په کارولو سره اپلیکیشن جوړ کړئfile:
    cmake
    جوړول
    دا باید د اجرا وړ matrix.icpx -fsycl تولید کړي.
    د برنامه حذف کولو لپاره ، ټایپ کړئ:
    پاکول
    دا د اجرا وړ او اعتراض لرې کوي files چې د make کمانډ لخوا رامینځته شوي.

د GPU تحلیل پرمخ وړئ
په میټریکس کې د GPU تحلیل پرمخ وړئample.

  1. VTune Pro لانچ کړئfiler د vtune-gui کمانډ سره.
  2. د ښه راغلاست پاڼې څخه نوې پروژه کلیک وکړئ.
  3. ستاسو لپاره نوم او ځای مشخص کړئampپه پروژه کې کلیک وکړئ او د پروژې رامینځته کولو کلیک وکړئ.
  4. په WHAT پین کې، matrix.icpx-fsycl ته لټون وکړئ file.
  5. په HOW پین کې، کلیک وکړئ intel-Get-Started-with-VTune-Profiler-06 د لټون تڼۍ وټاکئ او د تحلیل ونې کې د سرعت کونکي ګروپ څخه د GPU کمپیوټ/میډیا هټ سپاټ تحلیل غوره کړئ.
    intel-Get-Started-with-VTune-Profiler-10
  6. په ښکته کې د پیل تڼۍ کلیک وکړئ ترڅو د مخکې غوره شوي انتخابونو سره تحلیل پیل کړئ.

د کمانډ لاین څخه د GPU تحلیل پرمخ وړئ:

  1. د GPU تحلیل چلولو لپاره سیسټم چمتو کړئ. د GPU تحلیل لپاره سیسټم تنظیم کړئ وګورئ.
  2. د Intel سافټویر وسیلو لپاره د چاپیریال تغیرات تنظیم کړئ:
    سرچینه $ONEAPI_ROOT/setvars.sh
  3. د GPU کمپیوټ/میډیا هټ سپاټ تحلیل پرمخ وړئ:
    vtune -gpu-hotspots راټول کړئ -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    د لنډیز راپور لیدو لپاره، ټایپ کړئ:
    vtune -د راپور لنډیز -r ./result_gpu-hotspots

VTune Profiler ډاټا راټولوي او د GPU کمپیوټ/میډیا هټ سپاټونو کې د تحلیل پایلې ښیې viewټکی د لنډیز کړکۍ کې، د CPU او GPU سرچینې کارولو احصایې وګورئ ترڅو پوه شئ چې آیا ستاسو غوښتنلیک د GPU پورې تړلی دی. د ګرافیک کړکۍ ته لاړشئ ترڅو لومړني CPU او GPU میټریکونه وګورئ چې د وخت په تیریدو سره د کوډ اجرا کولو نمایندګي کوي.

د Intel® VTune™ پرو سره پیل کړئfileد macOS لپاره r*

د VTune پرو وکاروئfiler په macOS سیسټم کې د ریموټ هدف تحلیل په غیر macOS سیسټم کې ترسره کړئ (یوازې لینکس* یا Android*).

تاسو نشئ کولی VTune Pro وکاروئfileد دې موخو لپاره په macOS چاپیریال کې:

  • پروfile د macOS سیسټم چې دا نصب شوی.
  • په لرې پرتو میکوس سیسټم کې ډاټا راټول کړئ.

د MacOS کوربه څخه د لرې پرتو لینکس * یا Android * هدف فعالیت تحلیل کولو لپاره ، له دې مرحلو څخه یو وکړئ:

  • د VTune پرو چلولfileد هدف په توګه مشخص شوي ریموټ سیسټم سره د macOS سیسټم تحلیل. کله چې تحلیل پیل شي، VTune Profiler د ډیټا راټولولو لپاره ریموټ سیسټم سره وصل کیږي ، بیا پایلې بیرته د macOS کوربه ته راوړي viewing.
  • په سیمه ایزه توګه د هدف سیسټم کې تحلیل پرمخ وړئ او پایلې یې د MacOS سیسټم ته کاپي کړئ viewپه VTune Pro کېfiler.

په دې سند کې مرحلې د لینوکس هدف سیسټم لیرې کوي او د VTune Pro څخه د SSH لاسرسي په کارولو سره د فعالیت ډیټا راټولويfiler په macOS کوربه سیسټم کې.

مخکې له دې چې تاسو پیل کړئ

  1. Intel® VTune™ Pro نصب کړئfileستاسو په macOS* سیسټم کې.
  2. خپل د لینکس غوښتنلیک د سمبول معلوماتو سره جوړ کړئ او په ریلیز حالت کې د ټولو اصلاحونو فعالولو سره. د تفصيلي معلوماتو لپاره، په VTune Pro کې د کمپیلر ترتیبات وګورئfiler مرسته.
  3. د کوربه macOS سیسټم څخه د هدف لینکس سیسټم ته د SSH لاسرسی تنظیم کړئ ترڅو د پاسورډ کم حالت کې کار وکړي.

1 ګام: د VTune پرو پیل کړئfiler

  1. VTune Pro لانچ کړئfiler د vtune-gui کمانډ سره.
    په ترتیب سره، د دی /opt/intel/oneapi/.
  2. کله چې GUI خلاص شي، د ښه راغلاست په سکرین کې نوې پروژه کلیک وکړئ.
  3. د پروژې د جوړولو ډیالوګ بکس کې، د پروژې نوم او ځای مشخص کړئ.
  4. د پروژې په جوړولو کلیک وکړئ.

2 ګام: تحلیل تنظیم او چلول
وروسته له دې چې تاسو یوه نوې پروژه جوړه کړئ، د تحلیل تحلیل کړکۍ د فعالیت سنیپ شاټ تحلیل ډول سره خلاصیږي.
دا تحلیل یو اوور وړاندې کويview د هغو مسلو څخه چې په نښه شوي سیسټم کې ستاسو د غوښتنلیک فعالیت اغیزه کوي.

intel-Get-Started-with-VTune-Profiler-11

  1. په WHERE پین کې، ریموټ لینکس (SSH) غوره کړئ او د هدف لینکس سیسټم د username@hostname [:port] په کارولو سره مشخص کړئ.
    VTune Profiler د لینکس سیسټم سره وصل کیږي او د هدف کڅوړه نصبوي.
  2. په WHAT پین کې، د هدف لینکس سیسټم کې ستاسو غوښتنلیک ته لاره چمتو کړئ.
  3. په غوښتنلیک کې د فعالیت سنیپ شاټ چلولو لپاره د سټارټ تڼۍ کلیک وکړئ.

لومړی ګام: View او د فعالیت ډاټا تحلیل کړئ
کله چې د معلوماتو راټولول بشپړ شي، VTune Profiler د macOS سیسټم کې د تحلیل پایلې ښیې. خپل تحلیل د لنډیز کړکۍ کې پیل کړئ. دلته، تاسو یو فعالیت وګورئview ستاسو د غوښتنې.

اوورview په عموم ډول د دوی توضیحاتو سره ډیری میټریکونه شامل دي.

intel-Get-Started-with-VTune-Profiler-12

  • A د ونډه اخیستونکو فکتورونو په اړه د مفصلو معلوماتو لپاره هر میټریک پراخ کړئ.
  • B یو بیرغ شوی میټریک د منلو وړ / نورمال عملیاتي حد څخه بهر ارزښت په ګوته کوي. د وسیلې لارښوونې وکاروئ ترڅو پوه شئ چې څنګه د پرچم شوي میټریک ښه کول.
  • C د نورو تحلیلونو لارښود وګورئ چې تاسو یې باید په راتلونکي کې په پام کې ونیسئ. د تحلیل ونې دا سپارښتنې په ګوته کوي.

راتلونکی ګامونه
د فعالیت سنیپ شاټ د VTune Pro سره د غوښتنلیک فعالیت عمومي ارزونې ترلاسه کولو لپاره یو ښه پیل ټکی دیfiler.
بیا، وګورئ چې ایا ستاسو الګوریتم ټوننګ ته اړتیا لري.

  1. په خپل غوښتنلیک کې د هټ سپاټونو تحلیل پرمخ وړئ.
  2. د Hotspots ټیوټوریل تعقیب کړئ. ستاسو د Hotspots تحلیل څخه ډیره ګټه ترلاسه کولو تخنیکونه زده کړئ.
  3. یوځل چې ستاسو الګوریتم ښه تنظیم شوی وي ، د فعالیت سنیپ شاټ بیا چل کړئ ترڅو پایلې محاسبه کړي او په نورو برخو کې د فعالیت احتمالي پرمختګونه وپیژني.

دا هم وګورئ
د مایکرو آرکیټیکچر سپړنه

VTune Profileد مرستې سفر

نور زده کړئ
سند / توضیحات

  • د کارن لارښود
    د کارونکي لارښود د VTune پرو لپاره لومړني اسناد ديfiler.
    نوټ
    تاسو کولی شئ د VTune پرو آفلاین نسخه هم ډاونلوډ کړئfiler اسناد.
  • آنلاین روزنه
    د آنلاین روزنې سایټ د VTune Pro اساساتو زده کولو لپاره عالي سرچینه دهfileد پیل کولو لارښودونو، ویډیوګانو، درسونو، webinars، او تخنیکي مقالې.
  • د پخلي کتاب
    د فعالیت تحلیل کک بوک چې په VTune Pro کې د تحلیل ډولونو په کارولو سره د مشهور فعالیت ستونزې پیژندلو او حل کولو ترکیبونه لريfiler.
  • د وینډوز لپاره د نصبولو لارښود | لینکس | macOS کوربه
    د نصبولو لارښود د VTune Pro لپاره د نصب کولو لومړني لارښوونې لريfileد مختلف چلوونکو او راټولونکو لپاره د نصب کولو وروسته ترتیب کولو لارښوونې.
  • درسونه
    VTune Profiler ښوونې د لنډیز سره د لومړني ځانګړتیاو له لارې نوي کارونکي ته لارښوونه کويampد غوښتنلیک.
  • د خوشې یادښتونه
    د VTune Pro د وروستي نسخې په اړه معلومات ترلاسه کړئfiler، د نویو ځانګړتیاوو، د سیسټم اړتیاو، او تخنیکي مسلو چې حل شوي جامع توضیحات شامل دي.
    د VTune Pro د سټایلون او تولک کټ نسخو لپارهfiler، د اوسني سیسټم اړتیاوې درک کړئ.

خبرتیاوې او اعلانونه
انٹیل ټیکنالوژي ممکن وړ هارډویر ، سافټویر یا خدمت فعالولو ته اړتیا ولري.
هیڅ محصول یا برخه نشي کولی په بشپړ ډول خوندي وي.
ستاسو لګښتونه او پایلې ممکن توپیر ولري.
© Intel Corporation. Intel، د Intel لوگو، او د Intel نورې نښې د Intel Corporation یا د هغې د فرعي شرکتونو سوداګریزې نښې دي. نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
Intel، د Intel لوگو، Intel Atom، Intel Core، Intel Xeon Phi، VTune او Xeon په متحده ایالاتو او/یا نورو هیوادونو کې د انټل کارپوریشن سوداګریزې نښې دي.
* نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
مایکروسافټ، وینډوز، او وینډوز لوگو په متحده ایالاتو او/یا نورو هیوادونو کې د مایکروسافټ کارپوریشن سوداګریزې نښې یا راجستر شوي سوداګریزې نښې دي.
جاوا د اوریکل او / یا د هغې اړوند ملګرو راجسټر شوی سوداګریز نښه ده.
OpenCL او OpenCL لوگو د Apple Inc. سوداګریزې نښې دي چې د Khronos لخوا په اجازې کارول کیږي.

انٹیل ټیکنالوژي ممکن وړ هارډویر ، سافټویر یا خدمت فعالولو ته اړتیا ولري.
هیڅ محصول یا برخه نشي کولی په بشپړ ډول خوندي وي.
ستاسو لګښتونه او پایلې ممکن توپیر ولري.
© Intel Corporation. Intel، د Intel لوگو، او د Intel نورې نښې د Intel Corporation یا د هغې د فرعي شرکتونو سوداګریزې نښې دي. نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
Intel، د Intel لوگو، Intel Atom، Intel Core، Intel Xeon Phi، VTune او Xeon په متحده ایالاتو او/یا نورو هیوادونو کې د انټل کارپوریشن سوداګریزې نښې دي.
* نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
مایکروسافټ، وینډوز، او وینډوز لوگو په متحده ایالاتو او/یا نورو هیوادونو کې د مایکروسافټ کارپوریشن سوداګریزې نښې یا راجستر شوي سوداګریزې نښې دي.
جاوا د اوریکل او / یا د هغې اړوند ملګرو راجسټر شوی سوداګریز نښه ده.
OpenCL او OpenCL لوگو د Apple Inc. سوداګریزې نښې دي چې د Khronos لخوا په اجازې کارول کیږي.

اسناد / سرچینې

intel د VTune پرو سره پیل کړئfiler [pdf] د کارونکي لارښود
د VTune پرو سره پیل کړئfiler، د VTune پرو سره پیل کړئfiler، VTune Profiler

حوالې

یو نظر پریږدئ

ستاسو بریښنالیک پته به خپره نشي. اړین ساحې په نښه شوي *