د انټیل ټریس تحلیل کونکي او راټولونکي سره پیل وکړئ
د Intel® ټریس تحلیل کونکي او راټولونکي سره پیل وکړئ
دا د پیل کولو سند او دمخه راټول شوي ټریس وکاروئ file د Intel® Trace Analyzer او Collector سره د MPI فعالیت د بنسټیز تحلیل له لارې تګ کول.
د انټیل ټریس تحلیل کونکی او راټولونکی د پیغام لیږدونکي انٹرفیس (MPI) کارولو موثریت سپړلو کې مرسته کوي او د مخابراتو هټ سپاټونه ، همغږي خنډونه ، او د بار توازن پیژندلو کې مرسته کوي. د Intel Trace Analyzer and Collector Product پاڼې اړوند نور معلومات په فسبوک کې اوګورئ
د انټیل ټریس تحلیل کونکی او راټولونکی ډاونلوډ کړئ
- د Intel® oneAPI HPC Toolkit د یوې برخې په توګه
- د یوې واحدې وسیلې په توګه
شرطونه
- د Intel Trace Analyzer او Collector چلولو دمخه، ډاډ ترلاسه کړئ چې تاسو وروستی Intel® MPI کتابتون او Intel® oneAPI DPC++/C++ کمپیلر یا Intel® Fortran Compiler نصب کړی دی.
- دا د تالیف کونکو ، Intel MPI کتابتون ، او Intel Trace Analyzer او Collector لپاره اړین چاپیریال تغیرات ټاکي ، او تاسو چمتو یاست چې خپل غوښتنلیکونه تعقیب کړئ.
- د نورو معلوماتو لپاره، وګورئ: Intel® oneAPI HPC Toolkit System Requirements.
د کار جریان درک کړئ
- خپل غوښتنلیک تعقیب کړئ
- د MPI خورا فعال فعالیتونه تحلیل کړئ
- ستونزمن تعاملات په ګوته کړئ
- د ستونزې رامینځته کونکي فعالیت ځای په ځای کولو سره د خپل غوښتنلیک فعالیت ښه کړئ
ستاسو د MPI غوښتنلیک تعقیب کړئ
یوه نښه پیدا کړئ file د لاندې غوښتنلیک چلند تحلیل لپاره د پیښې لاګ راټولولو لپاره.
- د OneAPI نصبولو رییس څخه د setvars سکریپټ په چلولو سره د Intel® Trace Analyzer او Collector په لاره اچولو لپاره چاپیریال تنظیم کړئ
نوټ
د ډیفالټ په واسطه، د Intel Trace Analyzer او Collector د لینکس* OS لپاره /opt/intel/oneapi/itac او پروګرام ته نصب شوی. Files (x86)\Intel\oneAPI\itac\د وینډوز OS لپاره وروستی.
په لینکس کې:
$ سرچینه /opt/intel/oneapi/setvars.sh
په وینډوز کې:
C:\پروګرام Files (x86)\Intel\oneAPI\setvars.bat" - خپل MPI غوښتنلیک چل کړئ او د -ټریس اختیار سره ټریس تولید کړئ.
په لینکس کې:
$ mpirun -trace -n 4 ./poisson_sendrecv.single
په وینډوز کې:
ایپ تالیف کړئ او ټریس راټول کړئ.
د Intel oneAPI DPC++/C++ کمپیلر لپاره، چلول:
> mpiicc -trace poisson_sendrecv.single.c
د Intel Fortran Compiler لپاره، چلول:
> mpiifort -trace poisson_sendrecv.single.f
دا پخوانیample د دې لپاره یو ټریس (stf*) تولیدويample poisson_sendrcv.single MPI غوښتنلیک - پیدا شوی .stf خلاص کړئ file د Intel Trace Analyzer سره Intel Trace Analyzer او Collector سره.
په لینکس کې:
$ traceanalyzer ./ poisson_sendrecv.single.stf
په وینډوز کې:
traceanalyzer poisson_sendrecv.single.stf
نوټ
د ازموینې موخو لپاره، تاسو کولی شئ مخکې راټول شوي ټریس ډاونلوډ کړئ file poisson_sendrecv.single.stf په دې سند کې کارول شوي زهر لپاره او د Intel Trace Analyzer او Collector سره یې خلاص کړئ.
د .stf file په لنډیز پاڼه کې خلاصیږي view، کوم چې ستاسو د غوښتنلیک فعالیت په اړه عمومي معلومات څرګندوي:نوټ د Intel Trace Analyzer او Collector فعالیت په اړه د لا زیاتو معلوماتو لپاره، نور معلومات وګورئ.
د MPI خورا فعال فعالیتونه تحلیل کړئ
د MPI غوښتنلیک چلند تحلیل کړئ ، خنډونه ومومئ او د غوښتنلیک فعالیت ښه کولو لارې موندلو لپاره سیریلائزیشن وپیژنئ.
- د لنډیز پاڼې څخه د پیښې مهال ویش خلاص کړئ view د دوام> چارټونو> د پیښې مهال ویش په کلیک کولو سره د لوړ MPI دندو ژور تحلیل لپاره.
چارټ د وخت په تیریدو سره د انفرادي پروسې فعالیتونه ښیې.
د غوښتنلیک کار تکراري دی، چیرې چې هر تکرار د کمپیوټري برخې او MPI مخابراتو څخه جوړ دی. - د تمرکز کولو لپاره یو واحد تکرار وپیژنئ او د اړین وخت وقفې په اوږدو کې خپل موږک په کشولو سره یې زوم کړئ:
ټریس view هغه برخه ښیي چې تاسو یې غوره کړې. د پیښې مهال ویش چارټ هغه پیښې ښیې چې د ټاکل شوي تکرار پرمهال فعالې وې.
- افقي بارونه د پروسو نمایندګي کوي چې په دې پروسو کې ویل کیږي.
- تورې کرښې د پروسو ترمنځ لیږل شوي پیغامونه په ګوته کوي. دا لینونه د لیږلو او ترلاسه کولو پروسې سره نښلوي.
- نیلي کرښې د ډله ایزو عملیاتو استازیتوب کوي، لکه نشر یا کمول.
- فلیټ پرو ته لاړشئfile tab (A) د دې لپاره چې د وخت په نقطه کې اجرا شوي دندو ته نږدې لید ولرئ (د پیښې مهال ویش کې غوره شوی.
- ستاسو په غوښتنلیک کې د MPI پروسې فعالیت تحلیل کولو لپاره د MPI دندې غیر ګروپ کړئ.
د دې کولو لپاره ، په فلیټ پرو کې ټولې پروسې > ګروپ MPI (B) ښیې کلیک وکړئfile او UngroupMPI غوره کړئ. دا عملیات د انفرادي MPI تلیفونونه افشا کوي. - د تکرار په پیل کې د MPI_Sendrecv په کارولو سره د خپلو مستقیم ګاونډیانو سره د خبرو اترو پروسې تحلیل کړئ. د مثال لپارهampLe:
- a. په sample، د MPI_Sendrecv ډیټا تبادله کې خنډ شتون لري: پروسه د خپل راتلونکي ګاونډي سره ډیټا نه تبادله کوي تر هغه چې د تیر سره تبادله بشپړ نشي. د پیښې مهال ویش view دا خنډ د زینې په توګه ښیې.
- ب. د تکرار په پای کې MPI_Allreduce ټولې پروسې بیا همغږي کوي؛ له همدې امله دا بلاک د ستنې د ستنې بڼه لري.
- د فنکشن پرو په کارولو سره سیریلائزیشن وپیژنئfile او پیغام پروfile views.
- a. په ورته وخت کې چارټونه خلاص کړئ:
په فنکشن کې پروfile چارټ، د بار بیلانس ټاب خلاص کړئ. - د پیغام پرو خلاصولو لپاره د چارټونو مینو ته لاړشئfile.
- ب. د بار بیلانس ټب کې، MPI_Sendrecv او MPI_Allreduce پراخ کړئ. د بار توازن په ګوته کوي چې په MPI_Sendrecv کې مصرف شوي وخت د پروسې شمیر سره ډیریږي ، پداسې حال کې چې د MPI_Allreduce لپاره وخت کمیږي.
- ج. د پیغام پرو معاینه کړئfile چارټ ښکته ښي کونج ته.
د بلاکونو رنګ کوډ کول په ګوته کوي چې هغه پیغامونه چې له لوړې رتبې څخه ټیټې رتبې ته سفر کوي متناسب ډیر وخت ته اړتیا لري پداسې حال کې چې هغه پیغامونه چې له ټیټې رتبې څخه لوړې رتبې ته سفر کوي یو ضعیف حتی عجیب ډول نمونه څرګندوي:
- a. په ورته وخت کې چارټونه خلاص کړئ:
د مقایسوي تحلیل پایلې ښیې چې په غوښتنلیک کې د تبادلې پیچلې نمونې شتون نلري، تبادله یوازې د ګاونډیو پروسو سره ترسره کیږي. معلومات به د غوښتنلیک د مخابراتو ماډل اصلاح کولو لپاره د مخابراتو ګام بدلولو سره ستاسو د غوښتنلیک فعالیت ښه کولو لپاره اړین وي.
د غیر متوازن اړیکو پیژندل
خپل غوښتنلیک په مناسبو شرایطو کې وګورئ او اصلي نښه پرتله کړئ file د ایډیډیز شوي سره د ستونزې متقابل عمل جلا کولو لپاره.
- یو مثالی جوړ کړئ file:
- a. پرمختللی> مثالی کول غوره کړئ یا کلیک وکړئ
(Idealization) د وسیلې تڼۍ.
- ب. د ایډیالیزیشن پارامترونه د ایډیالیزیشن ډیالوګ بکس کې چیک کړئ (مثالی ټریس file د تبادلې لپاره نوم او د وخت حد).
- ج. د خپل ټریس مثالی کولو لپاره پیل کلیک وکړئ.
- a. پرمختللی> مثالی کول غوره کړئ یا کلیک وکړئ
- اصلي ټریس د مثالي ټریس سره پرتله کړئ:
- a. پرمختللی> د عدم توازن ډیاګرام غوره کړئ یا کلیک وکړئ
(عدم توازن ډیاګرام) د وسیلې تڼۍ.
- ب. د عدم توازن ډیاګرام ډیالوګ بکس کې ، بل خلاص کړئ کلیک وکړئ File تڼۍ، مثالی ټریس ته لاړ شئ، او غوره کړئ.
- ج. د عدم توازن ډیاګرام کړکۍ کې، د ټول حالت تڼۍ کلیک وکړئ او د ماتولو حالت غوره کړئ.
- a. پرمختللی> د عدم توازن ډیاګرام غوره کړئ یا کلیک وکړئ
تاسو لیدلی شئ چې MPI_Sendrecv خورا ډیر وخت مصرفونکی فعالیت دی. د عدم توازن وزن په کې ښودل شوی
روښانه رنګ او د MPI_Sendrecv فعالیت لپاره شاوخوا 10٪ لري. دا هغه وخت دی چې پروسې یو بل ته انتظار باسي.
د مخابراتو په بدلولو سره ستاسو د غوښتنلیک فعالیت ښه کړئ
- د غیر بلاک کولو مخابراتو ته د بلاک کولو بدلولو سره د MPI غوښتنلیک فعالیت ته وده ورکړئ.
ستاسو په کوډ کې سیریل MPI_Sendrcv د غیر بلاک کولو اړیکو سره بدل کړئ: MPI_Isend او MPI_Irecv. د مثال لپارهample: د اصلي کوډ ټوټه:
// د سرحد تبادله
باطل تبادله (para*p, grid* gr){
int i,j;
د MPI_Status status_100, status_200, status_300, status_400;
// لومړی قطار واستوئ
MPI_Send(gr->x_new[1], gr->lcol+2, MPI_DOUBLE, gr->down, 100, MPI_COMM_WORLD); MPI_Recv(gr->x_new[gr->lrow+1], gr->lcol+2, MPI_DOUBLE, gr->up, 100, MPI_COMM_WORLD,
&status_100);
// وروستی قطار واستوئ
MPI_Send(gr->x_new[gr->lrow], gr->lcol+2, MPI_DOUBLE, gr->up, 200, MPI_COMM_WORLD);
MPI_Recv(gr->x_new[0], gr->lcol+2, MPI_DOUBLE, gr->down, 200, MPI_COMM_WORLD, &status_200);
د Intel Trace Analyzer پرتله کول وکاروئ view د سیریل شوي غوښتنلیک د بیاکتنې سره پرتله کول
// بائیں کالم د tmp صفونو ته کاپي کړئ
که (gr->کیڼ اړخ!= MPI_PROC_NULL){
gr->x_new[i][gr->lcol+1] = right_col[i]; right_col[i] = gr->x_new[i][gr->lcol]؛
// حق لیږل
MPI_Send(right_col, gr->lrow+2, MPI_DOUBLE, gr-> right, 400, MPI_COMM_WORLD); }
که (gr->کیڼ اړخ!= MPI_PROC_NULL)
{
MPI_Recv(left_col, gr->lrow+2, MPI_DOUBLE, gr-> left, 400, MPI_COMM_WORLD,&status_400); لپاره(i=0; i< gr->lrow+2; i++
{
gr->x_new[i][0] = left_col[i];
}
}
تازه شوی کوډ ټوټه
د MPI_Request غوښتنه[7]؛
// لومړی قطار واستوئ
MPI_Isend(gr->x_new[1], gr->lcol+2, MPI_DOUBLE, gr->down, 100, MPI_COMM_WORLD, &req[0]);
MPI_Irecv(gr->x_new[gr->lrow+1], gr->lcol+2, MPI_DOUBLE, gr->up, 100, MPI_COMM_WORLD, &req[1]);
…..
MPI_Waitall(7, req, MPI_STATUSES_IGNORE);
یوځل چې سم شي ، د بیاکتل شوي غوښتنلیک واحد تکرار به د لاندې پخواني په څیر ښکاريampLe: - د Intel Trace Analyzer پرتله کول وکاروئ view د سیریل شوي غوښتنلیک د بیاکتنې سره پرتله کول. د پرتله کولو په مرسته دوه نښې پرتله کړئ View، ورتګ ... ورته View > پرتله کول. پرتله کول View ورته ښکاري:
په پرتله View، تاسو لیدلی شئ چې د غیر بلاک کولو مخابراتو کارول د سیریل کولو لرې کولو او د پروسو د مخابراتو وخت کمولو کې مرسته کوي.
نوټ ستاسو د غوښتنلیک د نوډ کچې فعالیت په اړه د نورو معلوماتو لپاره ، د اړوندو وسیلو لپاره اسناد وګورئ: Intel® VTune™ Profileد MPI کوډ تحلیل او تحلیل د Intel® MPI غوښتنلیکونه د Intel® مشاور په کارولو سره.
نور زده کړئ
د Intel Trace Analyzer او Collector په اړه د لا زیاتو معلوماتو لپاره لاندې سرچینې وپلټئ.
خبرتیاوې او اعلانونه
- انٹیل ټیکنالوژي ممکن وړ هارډویر ، سافټویر یا خدمت فعالولو ته اړتیا ولري.
- هیڅ محصول یا برخه نشي کولی په بشپړ ډول خوندي وي.
- ستاسو لګښتونه او پایلې ممکن توپیر ولري.
- © Intel Corporation. Intel، د Intel لوگو، او د Intel نورې نښې د Intel Corporation یا د هغې د فرعي شرکتونو سوداګریزې نښې دي. نور نومونه او نښې ممکن د نورو ملکیت په توګه ادعا شي.
- د دې سند لخوا د فکري ملکیت حقونو ته هیڅ جواز (ظاهري یا ضمیمه ، د ایسټوپیل یا بل ډول) نه ورکول کیږي.
- تشریح شوي محصولات ممکن د ډیزاین نیمګړتیاوې یا غلطۍ ولري چې د خطا په نوم پیژندل کیږي کوم چې ممکن محصول د خپاره شوي مشخصاتو څخه انحراف لامل شي. اوسني مشخصات شوي خطا په غوښتنه کې شتون لري.
- Intel ټول څرګند او ضمیمه تضمینونه ردوي، پشمول د محدودیت پرته، د سوداګریزې وړتیا تضمین شوي تضمین، د یو ځانګړي هدف لپاره فټنس، او غیر سرغړونې، او همدارنګه د فعالیت، معاملې کورس، یا په سوداګرۍ کې د کارونې له لارې هر ډول تضمین.
اسناد / سرچینې
![]() |
intel د Intel Trace Analyzer او Collector سره پیل کړئ [pdf] د کارونکي لارښود د انټیل ټریس تحلیل کونکي او راټولونکي سره پیل وکړئ ، د انټیل سره پیل وکړئ ، ټریس تحلیل کونکي او راټولونکی ، راټولونکی |