اینتل با VTune Pro شروع کنیدfiler
با Intel® VTune™ Pro شروع کنیدfiler
از Intel VTune Pro استفاده کنیدfiler برای تجزیه و تحلیل سیستم های هدف محلی و راه دور از میزبان های Windows*، macOS* و Linux*. بهبود عملکرد برنامه و سیستم از طریق این عملیات:
- تجزیه و تحلیل انتخاب های الگوریتم
- گلوگاه های کد سریال و موازی را پیدا کنید.
- بدانید کجا و چگونه برنامه شما می تواند از منابع سخت افزاری موجود بهره مند شود.
- سرعت اجرای برنامه خود را افزایش دهید.
دانلود Intel VTune Profiler بر روی سیستم خود از طریق یکی از این راه ها: - نسخه مستقل را دانلود کنید.
- Intel VTune Pro را دریافت کنیدfiler به عنوان بخشی از Intel® OneAPI Base Toolkit.
VTune Pro را ببینیدfileصفحه آموزش r برای فیلم ها، webinars و مطالب بیشتری برای کمک به شما در شروع کار.
توجه
مستندات نسخه های Intel® VTune™ Profiler قبل از انتشار 2021 فقط برای دانلود در دسترس هستند. برای لیستی از دانلود اسناد موجود بر اساس نسخه محصول، به این صفحات مراجعه کنید:
- دانلود مستندات برای Intel Parallel Studio XE
- دانلود Documentation for Intel System Studio
گردش کار را درک کنید
از Intel VTune Pro استفاده کنیدfiler به حرفه ایfile یک برنامه کاربردی و تجزیه و تحلیل نتایج برای بهبود عملکرد.
گردش کار کلی شامل این مراحل است:
سیستم میزبان خود را برای شروع انتخاب کنید
درباره گردشهای کاری خاص سیستم برای Windows*، Linux* یا macOS* بیشتر بیاموزید.
با Intel® VTune™ Pro شروع کنیدfiler برای سیستم عامل ویندوز*
قبل از شروع
- Intel® VTune™ Pro را نصب کنیدfiler در سیستم ویندوز* خود.
- برنامه خود را با اطلاعات نماد و در حالت انتشار با فعال بودن همه بهینه سازی ها بسازید. برای اطلاعات دقیق در مورد تنظیمات کامپایلر، VTune Pro را ببینیدfiler راهنمای کاربر آنلاین.
می توانید از ماتریس s نیز استفاده کنیدampبرنامه موجود در \VTune\Sampماتریس les شما می توانید s مربوطه را ببینیدampمنجر به \VTune\Projects\sample (ماتریس). - تنظیم متغیرهای محیطی: اجرا کنید اسکریپت \setvars.bat.
به طور پیش فرض، برای اجزای oneAPI برنامه است Files (x86)\Intel\oneAPI.
توجه هنگام استفاده از Intel® VTune™ Pro، نیازی به اجرای setvars.bat نداریدfiler در Microsoft* Visual Studio*.
مرحله 1: Intel® VTune™ Pro را راه اندازی کنیدfiler
Intel VTune Pro را راه اندازی کنیدfileاز یکی از این راه ها استفاده کنید و یک پروژه راه اندازی کنید. پروژه محفظهای برای برنامهای است که میخواهید تحلیل کنید، نوع تجزیه و تحلیل و نتایج جمعآوری دادهها.
منبع / VTune Pro را شروع کنیدfiler
مستقل (GUI)
- دستور vtune-gui را اجرا کنید یا Intel® VTune™ Pro را اجرا کنیدfiler از منوی Start.
- وقتی رابط کاربری گرافیکی باز شد، در صفحه خوش آمدید کلیک کنید.
- در کادر محاوره ای Create Project نام و محل پروژه را مشخص کنید.
- روی ایجاد پروژه کلیک کنید.
مستقل (خط فرمان)
دستور vtune را اجرا کنید.
Microsoft* Visual Studio* IDE
راه حل خود را در ویژوال استودیو باز کنید. VTune Profileنوار ابزار r به طور خودکار فعال می شود و پروژه ویژوال استودیو شما به عنوان یک هدف تجزیه و تحلیل تنظیم می شود.
توجه
هنگام اجرای Intel® VTune™ Pro نیازی به ایجاد پروژه نداریدfiler از خط فرمان یا داخل Microsoft* Visual Studio.
مرحله 2: پیکربندی و اجرای تجزیه و تحلیل
پس از ایجاد یک پروژه جدید، پنجره Configure Analysis با مقادیر پیش فرض باز می شود:
- در بخش Launch Application، به مکان برنامه اجرایی خود مراجعه کنید file.
- روی Start کلیک کنید تا Performance Snapshot روی برنامه شما اجرا شود. این تجزیه و تحلیل کلی را ارائه می دهدview مسائلی که بر عملکرد برنامه شما در سیستم هدف تأثیر می گذارد.
مرحله 3: View و داده های عملکرد را تجزیه و تحلیل کنید
هنگامی که جمع آوری داده ها کامل شد، VTune Profiler نتایج تجزیه و تحلیل را در پنجره Summary نمایش می دهد. در اینجا، یک اجرای کامل را می بینیدview درخواست شما
تمام شدview به طور معمول شامل چندین معیار به همراه توضیحات آنها می شود.
- A برای اطلاعات دقیق در مورد عوامل مؤثر، هر معیار را گسترش دهید.
- B یک متریک پرچمدار مقداری خارج از محدوده عملیاتی قابل قبول/عادی را نشان می دهد. از نکات ابزار برای درک نحوه بهبود معیارهای پرچمدار استفاده کنید.
- C راهنمایی در مورد تجزیه و تحلیل های دیگری را که باید در مرحله بعدی در نظر بگیرید، ببینید. درخت تجزیه و تحلیل این توصیه ها را برجسته می کند.
مراحل بعدی
Performance Snapshot نقطه شروع خوبی برای ارزیابی کلی عملکرد برنامه با VTune Pro استfiler بعد، بررسی کنید که آیا الگوریتم شما نیاز به تنظیم دارد.
- برای تجزیه و تحلیل گلوگاه های رایج عملکرد، یک آموزش را دنبال کنید.
- هنگامی که الگوریتم شما به خوبی تنظیم شد، دوباره Performance Snapshot را اجرا کنید تا نتایج را کالیبره کنید و بهبودهای بالقوه عملکرد را در سایر زمینه ها شناسایی کنید.
همچنین ببینید
کاوش ریزمعماری
VTune Profiler راهنما تور
Exampدر: حرفه ایfile یک برنامه OpenMP* در ویندوز*
از Intel VTune Pro استفاده کنیدfiler در یک دستگاه ویندوز به حرفه ایfile به عنوانample iso3dfd_omp_offload برنامه OpenMP بر روی یک پردازنده گرافیکی اینتل بارگذاری شده است. نحوه اجرای تجزیه و تحلیل GPU و بررسی نتایج را بیاموزید.
پیش نیازها
- مطمئن شوید که سیستم شما از Microsoft* Windows 10 یا نسخه جدیدتر استفاده می کند.
- از یکی از این نسخه های گرافیک پردازنده اینتل استفاده کنید:
- ژنرال 8
- ژنرال 9
- ژنرال 11
- سیستم شما باید روی یکی از این پردازنده های اینتل اجرا شود:
- پردازنده های نسل هفتم Intel® Core™ i7 (نام رمز Kaby Lake)
- پردازنده های نسل هشتم Intel® Core™ i8 (نام رمز Coffee Lake)
- نسل دهم پردازنده های Intel® Core™ i10 (نام رمز Ice Lake)
- Intel VTune Pro را نصب کنیدfiler از یکی از این منابع:
- دانلود محصول مستقل
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Intel® oneAPI HPC Toolkit را دانلود کنید که حاوی کامپایلر Intel® oneAPI DPC++/C++ (icx/icpx) است که باید آن را حرفهای کنید.file برنامه های OpenMP
- تنظیم متغیرهای محیطی اسکریپت vars.bat واقع در دایرکتوری \env.
- سیستم خود را برای تجزیه و تحلیل GPU تنظیم کنید.
توجه
برای نصب Intel VTune Profiler در محیط Microsoft* Visual Studio، VTune Pro را ببینیدfiler راهنمای کاربر.
برنامه OpenMP Offload را بسازید و کامپایل کنید
- iso3dfd_omp_offload OpenMP Offload s را دانلود کنیدampله
- باز به sampدایرکتوری le.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - برنامه OpenMP Offload را کامپایل کنید.
ساخت mkdir
ساخت سی دی
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
یک تجزیه و تحلیل GPU را در برنامه OpenMP Offload اجرا کنید
اکنون آماده اجرای تجزیه و تحلیل GPU Offload در برنامه OpenMP که کامپایل کرده اید هستید.
- VTune Pro را باز کنیدfiler و برای ایجاد پروژه بر روی New Project کلیک کنید.
- در صفحه خوش آمدگویی، روی Configure Analysis کلیک کنید تا تجزیه و تحلیل خود را تنظیم کنید.
- این تنظیمات را برای تحلیل خود انتخاب کنید.
- در پنجره WHERE، Local Host را انتخاب کنید.
- در پنجره WHAT، Launch Application را انتخاب کنید و باینری iso3dfd_omp_offload را به عنوان برنامه برای pro مشخص کنید.file.
- در صفحه HOW، نوع تجزیه و تحلیل GPU Offload را از گروه Accelerators در درخت تجزیه و تحلیل انتخاب کنید.
- برای اجرای آنالیز روی دکمه Start کلیک کنید.
VTune Profiler داده ها را جمع آوری می کند و نتایج تجزیه و تحلیل را در GPU Offload نمایش می دهد viewنقطه
- در پنجره خلاصه، آمار مصرف منابع CPU و GPU را ببینید. از این داده ها برای تعیین اینکه آیا برنامه شما است استفاده کنید:
- متصل به GPU
- محدود به CPU
- استفاده ناکارآمد از منابع محاسباتی سیستم شما
- از اطلاعات پنجره پلتفرم برای مشاهده معیارهای اصلی CPU و GPU استفاده کنید.
- وظایف محاسباتی خاص را در پنجره Graphics بررسی کنید.
برای تجزیه و تحلیل عمیق تر، دستور العمل مربوطه را در VTune Pro ببینیدfiler کتاب آشپزی تجزیه و تحلیل عملکرد. همچنین می توانید پروفایل خود را با تجزیه و تحلیل GPU Compute/Media Hotspots ادامه دهید.
Example: حرفه ایfile یک برنامه SYCL* در ویندوز*
حرفه ایfile به عنوانample matrix_multiply برنامه SYCL با Intel® VTune™ Profiler با محصول آشنا شوید و آمار جمع آوری شده برای برنامه های کاربردی متصل به GPU را درک کنید.
پیش نیازها
- مطمئن شوید که Microsoft* Visual Studio (نسخه 2017 یا جدیدتر) را روی سیستم خود نصب کرده اید.
- Intel VTune Pro را نصب کنیدfiler از Intel® OneAPI Base Toolkit یا Intel® System Bring-up Toolkit. این جعبه ابزار حاوی کامپایلر Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) است که برای فرآیند نمایه سازی لازم است.
- تنظیم متغیرهای محیطی اسکریپت vars.bat واقع در دایرکتوری \env.
- اطمینان حاصل کنید که کامپایلر OneAPI DPC++ Intel (نصب شده با جعبه ابزار Intel oneAPI Base) در Microsoft Visual Studio یکپارچه شده است.
- کد را با استفاده از گزینه های -gline-tables-only و -fdebug-info-for-profiling برای کامپایلر OneAPI DPC++ اینتل کامپایل کنید.
- سیستم خود را برای تجزیه و تحلیل GPU تنظیم کنید.
برای اطلاعات در مورد نصب اینتل VTune Profiler در محیط Microsoft* Visual Studio، VTune Pro را ببینیدfiler راهنمای کاربر.
اپلیکیشن ماتریکس را بسازید
کد matrix_multiply_vtune s را دانلود کنیدampبسته le برای جعبه ابزار اینتل oneAPI. این شامل sample که می توانید برای ساخت و حرفه ای استفاده کنیدfile یک برنامه SYCL
- Microsoft* Visual Studio را باز کنید.
- کلیک کنید File > باز > پروژه/راه حل. پوشه matrix_multiply_vtune را پیدا کنید و matrix_multiply.sln را انتخاب کنید.
- این پیکربندی را بسازید (Project > Build).
- برنامه را اجرا کنید (Debug > Start Without Debugging).
- برای انتخاب یک نسخه DPC++ یا رشته ای از sample، از تعاریف پیش پردازنده استفاده کنید.
- به Project Properties > DPC++ > Preprocessor > Preprocessor Definition بروید.
- icpx -fsycl یا USE_THR را تعریف کنید.
تجزیه و تحلیل GPU را اجرا کنید
تجزیه و تحلیل GPU را روی Matrix s اجرا کنیدampله
- از نوار ابزار ویژوال استودیو، روی دکمه Configure Analysis کلیک کنید.
پنجره Configure Analysis باز می شود. بهطور پیشفرض، تنظیمات پروژه VS شما را به ارث میبرد و matrix_multiply.exe را بهعنوان برنامهای برای pro مشخص میکند.file. - در پنجره Configure Analysis روی آن کلیک کنید
دکمه مرور در صفحه HOW.
- نوع تجزیه و تحلیل GPU Compute/Media Hotspots را از گروه Accelerators در درخت تجزیه و تحلیل انتخاب کنید.
- روی دکمه Start کلیک کنید تا تجزیه و تحلیل با گزینه های از پیش تعریف شده اجرا شود.
اجرای تجزیه و تحلیل GPU از خط فرمان:
- s را باز کنیدampدایرکتوری le:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - در این فهرست، یک پروژه Visual Studio* را باز کنید file با نام matrix_multiply.sln
- multiply.cpp file شامل چندین نسخه از ضرب ماتریس است. یک نسخه را با ویرایش خط #define MULTIPLY مربوطه در multiply.hpp انتخاب کنید
- کل پروژه را با پیکربندی Release بسازید.
این یک فایل اجرایی به نام matrix_multiply.exe تولید می کند. - سیستم را برای اجرای تجزیه و تحلیل GPU آماده کنید. به تنظیم سیستم برای تجزیه و تحلیل GPU مراجعه کنید.
- VTune Pro را تنظیم کنیدfiler متغیرهای محیطی را با اجرای دسته file: صادرات \env\vars.bat
- دستور تجزیه و تحلیل را اجرا کنید:
vtune.exe -collect gpu-offload — matrix_multiply.exe
VTune Profiler دادهها را جمعآوری میکند و نتایج تجزیه و تحلیل را در GPU Compute/Media Hotspots نمایش میدهد viewنقطه. در پنجره Summary، آمار مصرف منابع CPU و GPU را ببینید تا متوجه شوید که آیا برنامه شما محدود به GPU است یا خیر. برای مشاهده معیارهای اصلی CPU و GPU که اجرای کد را در طول زمان نشان میدهند، به پنجره گرافیک بروید.
با Intel® VTune™ Pro شروع کنیدfiler برای سیستم عامل لینوکس*
قبل از شروع
- Intel® VTune™ Pro را نصب کنیدfiler در سیستم لینوکس* شما.
- برنامه خود را با اطلاعات نماد و در حالت انتشار با فعال بودن همه بهینه سازی ها بسازید. برای اطلاعات دقیق در مورد تنظیمات کامپایلر، VTune Pro را ببینیدfiler راهنمای کاربر آنلاین.
می توانید از ماتریس s نیز استفاده کنیدampبرنامه موجود در \sample\matrix. می توانید s را ببینیدampمنجر به \sample (ماتریس). - تنظیم متغیرهای محیطی: منبع /setvars.sh
به طور پیش فرض، است:- $HOME/intel/oneapi/ در صورت نصب با مجوزهای کاربر.
- /opt/intel/oneapi/ در صورت نصب با مجوزهای روت.
مرحله 1: VTune Pro را راه اندازی کنیدfiler
VTune Pro را راه اندازی کنیدfiler از طریق یکی از این راه ها:
منبع / VTune Pro را شروع کنیدfiler
مستقل/IDE (GUI)
- دستور vtunegui را اجرا کنید. برای راه اندازی VTune Profiler از Intel System Studio IDE، Tools > VTune Pro را انتخاب کنیدfiler > VTune Pro را راه اندازی کنیدfiler این همه متغیرهای محیطی مناسب را تنظیم می کند و یک رابط مستقل از محصول را راه اندازی می کند.
- وقتی رابط کاربری گرافیکی باز شد، روی NEW PROJECT در صفحه خوش آمدید کلیک کنید.
- در کادر محاوره ای Create Project نام و محل پروژه را مشخص کنید.
- روی ایجاد پروژه کلیک کنید.
مستقل (خط فرمان)
- دستور vtune را اجرا کنید.
مرحله 2: پیکربندی و اجرای تجزیه و تحلیل
پس از ایجاد یک پروژه جدید، پنجره Configure Analysis با مقادیر پیش فرض باز می شود:
- در بخش Launch Application، به مکان برنامه خود مراجعه کنید.
- روی Start کلیک کنید تا Performance Snapshot روی برنامه شما اجرا شود. این تجزیه و تحلیل کلی را ارائه می دهدview مسائلی که بر عملکرد برنامه شما در سیستم هدف تأثیر می گذارد.
مرحله 3: View و داده های عملکرد را تجزیه و تحلیل کنید
هنگامی که جمع آوری داده ها کامل شد، VTune Profiler نتایج تجزیه و تحلیل را در پنجره Summary نمایش می دهد. در اینجا، یک اجرای کامل را می بینیدview درخواست شما
تمام شدview به طور معمول شامل چندین معیار به همراه توضیحات آنها می شود.
- A برای اطلاعات دقیق در مورد عوامل مؤثر، هر معیار را گسترش دهید.
- B یک متریک پرچمدار مقداری خارج از محدوده عملیاتی قابل قبول/عادی را نشان می دهد. از نکات ابزار برای درک نحوه بهبود معیارهای پرچمدار استفاده کنید.
- C راهنمایی در مورد تجزیه و تحلیل های دیگری را که باید در مرحله بعدی در نظر بگیرید، ببینید. درخت تجزیه و تحلیل این توصیه ها را برجسته می کند.
مراحل بعدی
Performance Snapshot نقطه شروع خوبی برای ارزیابی کلی عملکرد برنامه با VTune Pro استfiler بعد، بررسی کنید که آیا الگوریتم شما نیاز به تنظیم دارد.
- برای تجزیه و تحلیل گلوگاه های رایج عملکرد، یک آموزش را دنبال کنید.
- هنگامی که الگوریتم شما به خوبی تنظیم شد، دوباره Performance Snapshot را اجرا کنید تا نتایج را کالیبره کنید و بهبودهای بالقوه عملکرد را در سایر زمینه ها شناسایی کنید.
همچنین ببینید
کاوش ریزمعماری
VTune Profiler راهنما تور
Example: حرفه ایfile یک برنامه OpenMP در لینوکس*
از Intel VTune Pro استفاده کنیدfiler در یک ماشین لینوکس به حرفه ایfile به عنوانample iso3dfd_omp_offload برنامه OpenMP بر روی یک پردازنده گرافیکی اینتل بارگذاری شده است. نحوه اجرای تجزیه و تحلیل GPU و بررسی نتایج را بیاموزید.
پیش نیازها
- مطمئن شوید که سیستم شما دارای هسته سیستم عامل Linux* 4.14 یا نسخه جدیدتر است.
- از یکی از این نسخه های گرافیک پردازنده اینتل استفاده کنید:
- ژنرال 8
- ژنرال 9
- ژنرال 11
- سیستم شما باید روی یکی از این پردازنده های اینتل اجرا شود:
- پردازنده های نسل هفتم Intel® Core™ i7 (نام رمز Kaby Lake)
- پردازنده های نسل هشتم Intel® Core™ i8 (نام رمز Coffee Lake)
- نسل دهم پردازنده های Intel® Core™ i10 (نام رمز Ice Lake)
- برای رابط کاربری گرافیکی لینوکس، از:
- GTK+ نسخه 2.10 یا جدیدتر (نسخه های 2.18 و جدیدتر توصیه می شود)
- Pango نسخه 1.14 یا جدیدتر
- X.Org نسخه 1.0 یا جدیدتر (نسخه های 1.7 و جدیدتر توصیه می شود)
- Intel VTune Pro را نصب کنیدfiler از یکی از این منابع:
- دانلود محصول مستقل
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Intel® oneAPI HPC Toolkit را دانلود کنید که حاوی کامپایلر Intel® oneAPI DPC++/C++ (icx/icpx) است که باید آن را حرفهای کنید.file برنامه های OpenMP
- تنظیم متغیرهای محیطی اسکریپت vars.sh را اجرا کنید.
- سیستم خود را برای تجزیه و تحلیل GPU تنظیم کنید.
برنامه OpenMP Offload را بسازید و کامپایل کنید
- iso3dfd_omp_offload OpenMP Offload s را دانلود کنیدampله
- باز به sampدایرکتوری le.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - برنامه OpenMP Offload را کامپایل کنید.
ساخت mkdir;
cmake -DVERIFY_RESULTS=0 ..
ساختن -j
این یک فایل اجرایی src/iso3dfd تولید می کند.
برای حذف برنامه، تایپ کنید:
تمیز کردن
با این کار فایل اجرایی و شی حذف می شود files که با دستور make ایجاد کردید.
یک تجزیه و تحلیل GPU را در برنامه OpenMP Offload اجرا کنید
اکنون آماده اجرای تجزیه و تحلیل GPU Offload در برنامه OpenMP که کامپایل کرده اید هستید.
- VTune Pro را باز کنیدfiler و برای ایجاد پروژه بر روی New Project کلیک کنید.
- در صفحه خوش آمدگویی، روی Configure Analysis کلیک کنید تا تجزیه و تحلیل خود را تنظیم کنید.
- این تنظیمات را برای تحلیل خود انتخاب کنید.
- در پنجره WHERE، Local Host را انتخاب کنید.
- در پنجره WHAT، Launch Application را انتخاب کنید و باینری iso3dfd_omp_offload را به عنوان برنامه برای pro مشخص کنید.file.
- در صفحه HOW، نوع تجزیه و تحلیل GPU Offload را از گروه Accelerators در درخت تجزیه و تحلیل انتخاب کنید.
- برای اجرای آنالیز روی دکمه Start کلیک کنید.
VTune Profiler داده ها را جمع آوری می کند و نتایج تجزیه و تحلیل را در GPU Offload نمایش می دهد viewنقطه
- در پنجره خلاصه، آمار مصرف منابع CPU و GPU را ببینید. از این داده ها برای تعیین اینکه آیا برنامه شما است استفاده کنید:
- متصل به GPU
- محدود به CPU
- استفاده ناکارآمد از منابع محاسباتی سیستم شما
- از اطلاعات پنجره پلتفرم برای مشاهده معیارهای اصلی CPU و GPU استفاده کنید.
- وظایف محاسباتی خاص را در پنجره Graphics بررسی کنید.
برای تجزیه و تحلیل عمیق تر، دستور العمل مربوطه را در VTune Pro ببینیدfiler کتاب آشپزی تجزیه و تحلیل عملکرد. همچنین می توانید پروفایل خود را با تجزیه و تحلیل GPU Compute/Media Hotspots ادامه دهید.
Example: حرفه ایfile یک برنامه SYCL* در لینوکس*
از VTune Pro استفاده کنیدfiler با به عنوانample matrix_multiply برنامه SYCL برای آشنایی سریع با محصول و آمار جمع آوری شده برای برنامه های کاربردی متصل به GPU.
پیش نیازها
- VTune Pro را نصب کنیدfiler و کامپایلر OneAPI DPC++/C++ Intel® از Intel® OneAPI Base Toolkit یا Intel® System Bring-up Toolkit.
- با اجرای اسکریپت vars.sh متغیرهای محیطی را تنظیم کنید.
- سیستم خود را برای تجزیه و تحلیل GPU تنظیم کنید.
برنامه ماتریس را بسازید
کد matrix_multiply_vtune s را دانلود کنیدampبسته le برای جعبه ابزار اینتل oneAPI. این شامل sample که می توانید برای ساخت و حرفه ای استفاده کنیدfile یک برنامه SYCL
به حرفه ایfile یک برنامه SYCL، مطمئن شوید که کد را با استفاده از گزینه های -gline-tables-only و -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler کامپایل کرده اید.
برای تدوین این sampبرنامه، موارد زیر را انجام دهید:
- برو به اسampدایرکتوری le.
cd <sample_dir/VtuneProfiler/matrix_multiply> - multiply.cpp file در پوشه src چندین نسخه از ضرب ماتریس وجود دارد. یک نسخه را با ویرایش خط #define MULTIPLY مربوطه در multiply.h انتخاب کنید.
- برنامه را با استفاده از Make موجود بسازیدfile:
cmake .
ساختن
این باید یک فایل اجرایی matrix.icpx -fsycl ایجاد کند.
برای حذف برنامه، تایپ کنید:
تمیز کردن
با این کار فایل اجرایی و شی حذف می شود files که توسط دستور make ایجاد شده اند.
تجزیه و تحلیل GPU را اجرا کنید
تجزیه و تحلیل GPU را روی Matrix s اجرا کنیدampله
- VTune Pro را راه اندازی کنیدfiler با دستور vtune-gui.
- از صفحه خوش آمدید روی New Project کلیک کنید.
- یک نام و مکان برای s خود مشخص کنیدample project را بزنید و روی Create Project کلیک کنید.
- در پنجره WHAT، به matrix.icpx-fsycl بروید file.
- در صفحه HOW، روی آن کلیک کنید
دکمه مرور و تجزیه و تحلیل GPU Compute/Media Hotspots را از گروه Accelerators در درخت تجزیه و تحلیل انتخاب کنید.
- روی دکمه Start در پایین کلیک کنید تا تجزیه و تحلیل با گزینه های از پیش انتخاب شده اجرا شود.
اجرای تجزیه و تحلیل GPU از خط فرمان:
- سیستم را برای اجرای تجزیه و تحلیل GPU آماده کنید. به تنظیم سیستم برای تجزیه و تحلیل GPU مراجعه کنید.
- تنظیم متغیرهای محیطی برای ابزارهای نرم افزاری اینتل:
منبع $ONEAPI_ROOT/setvars.sh - تجزیه و تحلیل GPU Compute/Media Hotspots را اجرا کنید:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
برای مشاهده خلاصه گزارش، تایپ کنید:
vtune -report خلاصه -r ./result_gpu-hotspots
VTune Profiler دادهها را جمعآوری میکند و نتایج تجزیه و تحلیل را در GPU Compute/Media Hotspots نمایش میدهد viewنقطه. در پنجره Summary، آمار مصرف منابع CPU و GPU را ببینید تا متوجه شوید که آیا برنامه شما محدود به GPU است یا خیر. برای مشاهده معیارهای اصلی CPU و GPU که اجرای کد را در طول زمان نشان میدهند، به پنجره گرافیک بروید.
با Intel® VTune™ Pro شروع کنیدfiler برای macOS*
از VTune Pro استفاده کنیدfiler در سیستم macOS برای انجام تجزیه و تحلیل هدف از راه دور در سیستم غیر macOS (فقط لینوکس* یا اندروید*).
شما نمی توانید از VTune Pro استفاده کنیدfiler در محیط macOS برای این اهداف:
- حرفه ایfile سیستم macOS که روی آن نصب شده است.
- جمع آوری داده ها در یک سیستم macOS راه دور.
برای تجزیه و تحلیل عملکرد هدف از راه دور لینوکس* یا اندروید* از میزبان macOS، یکی از این مراحل را انجام دهید:
- VTune Pro را اجرا کنیدfileتجزیه و تحلیل r در سیستم macOS با یک سیستم راه دور مشخص شده به عنوان هدف. هنگامی که تجزیه و تحلیل شروع می شود، VTune Profiler برای جمعآوری دادهها به سیستم راه دور متصل میشود، سپس نتایج را به میزبان macOS برمیگرداند viewing.
- تجزیه و تحلیلی را روی سیستم هدف به صورت محلی اجرا کنید و نتایج را در یک سیستم macOS کپی کنید viewدر VTune Profiler.
مراحل این سند یک سیستم هدف لینوکس از راه دور را فرض می کند و داده های عملکرد را با استفاده از دسترسی SSH از VTune Pro جمع آوری می کند.filer در یک سیستم میزبان macOS.
قبل از شروع
- Intel® VTune™ Pro را نصب کنیدfiler در سیستم macOS* شما.
- برنامه لینوکس خود را با اطلاعات نماد و در حالت انتشار با فعال بودن همه بهینه سازی ها بسازید. برای اطلاعات دقیق، تنظیمات کامپایلر را در VTune Pro ببینیدfiler کمک کند.
- دسترسی SSH را از سیستم macOS میزبان به سیستم لینوکس هدف تنظیم کنید تا در حالت بدون رمز عبور کار کند.
مرحله 1: VTune Pro را راه اندازی کنیدfiler
- VTune Pro را راه اندازی کنیدfiler با دستور vtune-gui.
به طور پیش فرض، /opt/intel/oneapi/ است. - وقتی رابط کاربری گرافیکی باز شد، روی NEW PROJECT در صفحه خوش آمدید کلیک کنید.
- در کادر محاوره ای Create Project نام و محل پروژه را مشخص کنید.
- روی ایجاد پروژه کلیک کنید.
مرحله 2: پیکربندی و اجرای تجزیه و تحلیل
پس از ایجاد یک پروژه جدید، پنجره Configure Analysis با نوع Performance Snapshot Analysis باز می شود.
این تجزیه و تحلیل یک پایان را ارائه می دهدview مسائلی که بر عملکرد برنامه شما در سیستم هدف تاثیر می گذارد.
- در پنجره WHERE، Remote Linux (SSH) را انتخاب کنید و سیستم لینوکس مورد نظر را با استفاده از username@ hostname[:port] مشخص کنید.
VTune Profiler به سیستم لینوکس متصل می شود و بسته هدف را نصب می کند. - در پنجره WHAT، مسیر برنامه خود را در سیستم لینوکس مورد نظر ارائه دهید.
- روی دکمه Start کلیک کنید تا Performance Snapshot روی برنامه اجرا شود.
مرحله 3: View و داده های عملکرد را تجزیه و تحلیل کنید
هنگامی که جمع آوری داده ها کامل شد، VTune Profiler نتایج تجزیه و تحلیل را در سیستم macOS نمایش می دهد. تحلیل خود را در پنجره Summary شروع کنید. در اینجا، یک اجرای کامل را می بینیدview درخواست شما
تمام شدview به طور معمول شامل چندین معیار به همراه توضیحات آنها می شود.
- A برای اطلاعات دقیق در مورد عوامل مؤثر، هر معیار را گسترش دهید.
- B یک متریک پرچمدار مقداری خارج از محدوده عملیاتی قابل قبول/عادی را نشان می دهد. از نکات ابزار برای درک نحوه بهبود معیارهای پرچمدار استفاده کنید.
- C راهنمایی در مورد تجزیه و تحلیل های دیگری را که باید در مرحله بعدی در نظر بگیرید، ببینید. درخت تجزیه و تحلیل این توصیه ها را برجسته می کند.
مراحل بعدی
Performance Snapshot نقطه شروع خوبی برای ارزیابی کلی عملکرد برنامه با VTune Pro استfiler.
بعد، بررسی کنید که آیا الگوریتم شما نیاز به تنظیم دارد.
- Hotspots Analysis را روی برنامه خود اجرا کنید.
- یک آموزش Hotspots را دنبال کنید. تکنیک هایی را بیاموزید تا بیشترین بهره را از تجزیه و تحلیل Hotspots خود ببرید.
- هنگامی که الگوریتم شما به خوبی تنظیم شد، دوباره Performance Snapshot را اجرا کنید تا نتایج را کالیبره کنید و بهبودهای بالقوه عملکرد را در سایر زمینه ها شناسایی کنید.
همچنین ببینید
کاوش ریزمعماری
VTune Profiler راهنما تور
بیشتر بدانید
سند / شرح
- راهنمای کاربر
راهنمای کاربر مستندات اولیه VTune Pro استfiler.
توجه
همچنین می توانید نسخه آفلاین VTune Pro را دانلود کنیدfileمستندات r - آموزش آنلاین
سایت آموزش آنلاین یک منبع عالی برای یادگیری اصول اولیه VTune Pro استfiler با راهنماهای شروع، فیلم ها، آموزش ها، webinars و مقالات فنی. - کتاب آشپزی
کتاب آشپزی تجزیه و تحلیل عملکرد که حاوی دستور العمل هایی برای شناسایی و حل مشکلات عملکرد رایج با استفاده از انواع تجزیه و تحلیل در VTune Pro استfiler. - راهنمای نصب ویندوز | لینوکس | میزبان macOS
راهنمای نصب حاوی دستورالعملهای اولیه نصب VTune Pro استfiler و دستورالعمل های پیکربندی پس از نصب برای درایورها و کلکتورهای مختلف. - آموزش ها
VTune Profileآموزش های r کاربر جدید را از طریق ویژگی های اساسی با یک s کوتاه راهنمایی می کندampبرنامه کاربردی - یادداشت های انتشار
اطلاعاتی در مورد آخرین نسخه VTune Pro پیدا کنیدfiler، شامل شرح جامعی از ویژگیهای جدید، نیازمندیهای سیستم و مسائل فنی که حل شدهاند.
برای نسخه های مستقل و جعبه ابزار VTune Profiler، نیازهای سیستم فعلی را درک کنید.
اطلاعیه ها و سلب مسئولیت
فن آوری های اینتل ممکن است نیاز به فعال سازی سخت افزار ، نرم افزار یا سرویس داشته باشند.
هیچ محصول یا م componentلفه ای نمی تواند کاملاً ایمن باشد.
هزینه ها و نتایج شما ممکن است متفاوت باشد.
© شرکت اینتل. اینتل، لوگوی اینتل و سایر علائم اینتل علائم تجاری Intel Corporation یا شرکت های تابعه آن هستند. نام ها و مارک های دیگر ممکن است به عنوان دارایی دیگران ادعا شود.
اینتل، آرم اینتل، Intel Atom، Intel Core، Intel Xeon Phi، VTune و Xeon علائم تجاری Intel Corporation در ایالات متحده و/یا سایر کشورها هستند.
*اسامی و برندهای دیگر ممکن است به عنوان دارایی دیگران ادعا شود.
Microsoft، Windows و لوگوی Windows علائم تجاری یا علائم تجاری ثبت شده Microsoft Corporation در ایالات متحده و/یا سایر کشورها هستند.
جاوا یک علامت تجاری ثبت شده Oracle و/یا شرکت های وابسته به آن است.
OpenCL و لوگوی OpenCL علائم تجاری Apple Inc. هستند که با مجوز Khronos استفاده می شوند.
فن آوری های اینتل ممکن است نیاز به فعال سازی سخت افزار ، نرم افزار یا سرویس داشته باشند.
هیچ محصول یا م componentلفه ای نمی تواند کاملاً ایمن باشد.
هزینه ها و نتایج شما ممکن است متفاوت باشد.
© شرکت اینتل. اینتل، لوگوی اینتل و سایر علائم اینتل علائم تجاری Intel Corporation یا شرکت های تابعه آن هستند. نام ها و مارک های دیگر ممکن است به عنوان دارایی دیگران ادعا شود.
اینتل، آرم اینتل، Intel Atom، Intel Core، Intel Xeon Phi، VTune و Xeon علائم تجاری Intel Corporation در ایالات متحده و/یا سایر کشورها هستند.
*اسامی و برندهای دیگر ممکن است به عنوان دارایی دیگران ادعا شود.
Microsoft، Windows و لوگوی Windows علائم تجاری یا علائم تجاری ثبت شده Microsoft Corporation در ایالات متحده و/یا سایر کشورها هستند.
جاوا یک علامت تجاری ثبت شده Oracle و/یا شرکت های وابسته به آن است.
OpenCL و لوگوی OpenCL علائم تجاری Apple Inc. هستند که با مجوز Khronos استفاده می شوند.
اسناد / منابع
![]() |
اینتل با VTune Pro شروع کنیدfiler [pdfراهنمای کاربر با VTune Pro شروع کنیدfiler، با VTune Pro شروع کنیدfiler، VTune Profiler |