Intel Пачатак працы з VTune Profiler
Пачніце з Intel® VTune™ Profiler
Выкарыстоўвайце Intel VTune Profiler для аналізу лакальных і аддаленых мэтавых сістэм з хастоў Windows*, macOS* і Linux*. Палепшыце прадукцыйнасць прыкладанняў і сістэмы з дапамогай гэтых аперацый:
- Прааналізуйце выбар алгарытму.
- Знайдзіце вузкія месцы паслядоўнага і паралельнага кода.
- Зразумейце, дзе і як ваша прыкладанне можа атрымаць выгаду з даступных апаратных рэсурсаў.
- Паскорыць выкананне вашага прыкладання.
Спампаваць Intel VTune Profiler у вашай сістэме адным з наступных спосабаў: - Спампуйце аўтаномную версію.
- Атрымаць Intel VTune Profiler як частка Intel® oneAPI Base Toolkit.
Глядзіце VTune Profiler навучальная старонка для відэа, webinars і іншыя матэрыялы, якія дапамогуць вам пачаць працу.
УВАГА
Дакументацыя для версій Intel® VTune™ Profiler да выпуску 2021 г. даступныя толькі для спампоўкі. Спіс даступнай для загрузкі дакументацыі па версіях прадукту глядзіце на гэтых старонках:
- Спампаваць дакументацыю для Intel Parallel Studio XE
- Спампаваць дакументацыю для Intel System Studio
Зразумець працоўны працэс
Выкарыстоўвайце Intel VTune Profileг да праfile прыкладанне і аналізаваць вынікі для павышэння прадукцыйнасці.
Агульны працоўны працэс змяшчае наступныя этапы:
Каб пачаць, абярыце хост-сістэму
Даведацца больш аб сістэмных працоўных працэсах для Windows*, Linux* або macOS*.
Пачніце з Intel® VTune™ Profiler для АС Windows*
Перш чым пачаць
- Усталюйце Intel® VTune™ Profiler у вашай сістэме Windows*.
- Стварыце сваё прыкладанне з інфармацыяй аб сімвалах і ў рэжыме выпуску з уключанымі ўсімі аптымізацыямі. Для атрымання падрабязнай інфармацыі аб наладах кампілятара глядзіце VTune Profiler онлайн кіраўніцтва карыстальніка.
Вы таксама можаце выкарыстоўваць матрыцу sampДадатак le даступна ў \VTune\Sampлес\матрыца. Вы можаце ўбачыць адпаведныя sample вынікі ў \VTune\Projects\sampле (матрыца). - Наладзьце зменныя асяроддзя: запусціце Скрыпт \setvars.bat.
Па змаўчанні, для кампанентаў oneAPI - гэта праграма Files (x86)\Intel\oneAPI.
УВАГА Вам не трэба запускаць setvars.bat пры выкарыстанні Intel® VTune™ Profiler у Microsoft* Visual Studio*.
Крок 1: Запусціце Intel® VTune™ Profiler
Запусціце Intel VTune Profiler адным з гэтых спосабаў і наладзьце праект. Праект - гэта кантэйнер для прыкладання, якое вы хочаце прааналізаваць, тыпу аналізу і вынікаў збору даных.
Крыніца / Запусціце VTune Profiler
Аўтаномны (графічны інтэрфейс)
- Выканайце каманду vtune-gui або запусціце Intel® VTune™ Profiler з меню «Пуск».
- Калі адкрыецца графічны інтэрфейс, націсніце на экране прывітання.
- У дыялогавым акне «Стварыць праект» укажыце імя і месцазнаходжанне праекта.
- Націсніце Стварыць праект.
Аўтаномны (Камандны радок)
Выканайце каманду vtune.
Microsoft* Visual Studio* IDE
Адкрыйце сваё рашэнне ў Visual Studio. VTune ProfileПанэль інструментаў r аўтаматычна ўключаецца, і ваш праект Visual Studio усталёўваецца ў якасці мэты аналізу.
УВАГА
Вам не трэба ствараць праект пры запуску Intel® VTune™ Profiler з каманднага радка або ў Microsoft* Visual Studio.
Крок 2: Налада і запуск аналізу
Пасля стварэння новага праекта адкрыецца акно Configure Analysis з наступнымі значэннямі па змаўчанні:
- У раздзеле "Запуск прыкладання" знайдзіце месцазнаходжанне выкананага файла вашага прыкладання file.
- Націсніце "Пуск", каб запусціць здымак прадукцыйнасці вашага прыкладання. Гэты аналіз прадстаўляе агульны надview праблем, якія ўплываюць на прадукцыйнасць вашага прыкладання ў мэтавай сістэме.
крок 3: View і Аналіз дадзеных прадукцыйнасці
Пасля завяршэння збору даных VTune Profiler адлюстроўвае вынікі аналізу ў акне зводкі. Вось вы бачыце, што спектакль скончыўсяview Вашай заявы.
Надview звычайна ўключае некалькі паказчыкаў разам з іх апісаннямі.
- A Разгарніце кожную метрыку, каб атрымаць падрабязную інфармацыю пра спрыяльныя фактары.
- B Пазначаная метрыка паказвае значэнне за межамі прымальнага/нармальнага працоўнага дыяпазону. Скарыстайцеся падказкамі, каб зразумець, як палепшыць пазначаны паказчык.
- C Глядзіце рэкамендацыі па іншых аналізах, якія вам варта правесці наступным. Дрэва аналізу вылучае гэтыя рэкамендацыі.
Наступныя крокі
Здымак прадукцыйнасці з'яўляецца добрай адпраўной кропкай для атрымання агульнай ацэнкі прадукцыйнасці прыкладання з VTune Profileр. Далей праверце, ці патрабуе налада ваш алгарытм.
- Выконвайце падручнік, каб прааналізаваць агульныя вузкія месцы ў прадукцыйнасці.
- Пасля таго, як ваш алгарытм будзе добра наладжаны, зноў запусціце здымак прадукцыйнасці, каб адкалібраваць вынікі і вызначыць магчымыя паляпшэнні прадукцыйнасці ў іншых галінах.
Глядзіце таксама
Даследаванне мікраархітэктуры
VTune Profiler Дапаможны тур
Exampль: профіfile Прыкладанне OpenMP* для Windows*
Выкарыстоўвайце Intel VTune Profiler на машыне з Windows у Profile якample iso3dfd_omp_offload Прыкладанне OpenMP выгружана на графічны працэсар Intel. Даведайцеся, як запусціць аналіз GPU і праверыць вынікі.
Перадумовы
- Пераканайцеся, што ваша сістэма працуе пад кіраваннем Microsoft* Windows 10 або больш новай версіі.
- Выкарыстоўвайце адну з наступных версій Intel Processor Graphics:
- Пакаленне 8
- Пакаленне 9
- Пакаленне 11
- Ваша сістэма павінна працаваць на адным з гэтых працэсараў Intel:
- Працэсары Intel® Core™ i7 7-га пакалення (кодавая назва Kaby Lake)
- Працэсары Intel® Core™ i8 7-га пакалення (кодавая назва Coffee Lake)
- Працэсары Intel® Core™ i10 7-га пакалення (кодавая назва Ice Lake)
- Усталюйце Intel VTune Profiler з адной з гэтых крыніц:
- Спампоўка аўтаномнага прадукту
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Спампуйце Intel® oneAPI HPC Toolkit, які змяшчае кампілятар Intel® oneAPI DPC++/C++ (icx/icpx), неабходны для праfile Прыкладання OpenMP.
- Наладзьце зменныя асяроддзя. Выканайце скрыпт vars.bat, размешчаны ў каталог \env.
- Наладзьце сістэму для аналізу GPU.
УВАГА
Каб усталяваць Intel VTune Profiler у асяроддзі Microsoft* Visual Studio, глядзіце VTune Profiler Кіраўніцтва карыстальніка.
Стварыце і скампілюйце дадатак OpenMP Offload
- Спампуйце iso3dfd_omp_offload OpenMP Offload sampле.
- Адкрыты да сampкаталог le.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Скампілюйце прыкладанне OpenMP Offload.
зборка mkdir
зборка cd
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-мэты:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Запусціце аналіз графічнага працэсара ў дадатку OpenMP Offload
Цяпер вы гатовыя запусціць аналіз разгрузкі GPU для скампіляванага вамі прыкладання OpenMP.
- Адкрыйце VTune Profiler і націсніце «Новы праект», каб стварыць праект.
- На старонцы прывітання націсніце «Наладзіць аналіз», каб наладзіць аналіз.
- Выберыце гэтыя параметры для аналізу.
- На панэлі WHERE выберыце «Лакальны хост».
- На панэлі WHAT выберыце Launch Application і ўкажыце двайковы файл iso3dfd_omp_offload у якасці прыкладання для праfile.
- На панэлі "ЯК" выберыце тып аналізу разгрузкі GPU з групы "Паскаральнікі" ў дрэве аналізу.
- Націсніце кнопку Пуск, каб запусціць аналіз.
VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Offload viewкропка.
- У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў ЦП і ГП. Выкарыстоўвайце гэтыя даныя, каб вызначыць, ці з'яўляецца ваша заяўка:
- Прывязаны да GPU
- Прывязаны да працэсара
- Неэфектыўнае выкарыстанне вылічальных рэсурсаў вашай сістэмы
- Выкарыстоўвайце інфармацыю ў акне платформы, каб убачыць асноўныя паказчыкі ЦП і ГП.
- Даследуйце канкрэтныя вылічальныя задачы ў акне Графіка.
Для больш глыбокага аналізу глядзіце адпаведны рэцэпт у VTune Profiler Кулінарная кніга па аналізе прадукцыйнасці. Вы таксама можаце працягнуць прафіляванне з дапамогай аналізу GPU Compute/Media Hotspots.
Example: Profile Прыкладанне SYCL* у Windows*
профіfile якample matrix_multiply SYCL прыкладанне з Intel® VTune™ Profileр. Азнаёмцеся з прадуктам і зразумейце статыстыку, сабраную для прыкладанняў, звязаных з GPU.
Перадумовы
- Пераканайцеся, што ў вашай сістэме ўсталявана Microsoft* Visual Studio (версія 2017 або навейшая).
- Усталюйце Intel VTune Profiler з Intel® oneAPI Base Toolkit або Intel® System Bring-up Toolkit. Гэтыя наборы інструментаў утрымліваюць кампілятар Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl), неабходны для працэсу прафілявання.
- Наладзьце зменныя асяроддзя. Выканайце скрыпт vars.bat, размешчаны ў каталог \env.
- Пераканайцеся, што кампілятар Intel oneAPI DPC++ (усталяваны разам з наборам інструментаў Intel oneAPI Base) інтэграваны ў Microsoft Visual Studio.
- Скампілюйце код з дапамогай параметраў -gline-tables-only і -fdebug-info-for-profiling для кампілятара Intel oneAPI DPC++.
- Наладзьце сістэму для аналізу GPU.
Для атрымання інфармацыі аб усталяванні Intel VTune Profiler у асяроддзі Microsoft* Visual Studio, гл. VTune Profiler Кіраўніцтва карыстальніка.
Стварыце праграму Matrix
Спампуйце код matrix_multiply_vtune sampпакет le для набораў інструментаў Intel oneAPI. Гэта змяшчае sample, які вы можаце выкарыстоўваць для стварэння і праfile дадатак SYCL.
- Адкрыйце Microsoft* Visual Studio.
- Націсніце File > Адкрыць > Праект/Рашэнне. Знайдзіце тэчку matrix_multiply_vtune і абярыце matrix_multiply.sln.
- Стварыце гэтую канфігурацыю (Праект > Зборка).
- Запусціце праграму (Debug > Start Without Debugging).
- Каб выбраць DPC++ або разьбовую версію sample, выкарыстоўваць азначэнні прэпрацэсара.
- Перайдзіце ў раздзел Уласцівасці праекта > DPC++ > Прэпрацэсар > Вызначэнне прэпрацэсара.
- Вызначце icpx -fsycl або USE_THR.
Запусціце аналіз GPU
Запусціце аналіз GPU на Matrix sampле.
- На панэлі інструментаў Visual Studio націсніце кнопку «Наладзіць аналіз».
Адкрыецца акно Configure Analysis. Па змаўчанні ён успадкоўвае налады вашага праекта VS і вызначае matrix_multiply.exe як дадатак для праfile. - У акне Configure Analysis націсніце
Кнопка "Агляд" на панэлі "ЯК".
- Выберыце тып аналізу GPU Compute/Media Hotspots з групы Accelerators у дрэве аналізу.
- Націсніце кнопку Пуск, каб запусціць аналіз з прадусталяванымі опцыямі.
Запусціце аналіз GPU з каманднага радка:
- Адкрыйце сampкаталог файлаў:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - У гэтым каталогу адкрыйце праект Visual Studio* file пад назвай matrix_multiply.sln
- Multiply.cpp file змяшчае некалькі варыянтаў матрычнага множання. Выберыце версію, адрэдагаваўшы адпаведны радок #define MULTIPLY у multiply.hpp
- Стварыце ўвесь праект з канфігурацыяй Release.
Гэта стварае выкананы файл пад назвай matrix_multiply.exe. - Падрыхтуйце сістэму да запуску аналізу GPU. Гл. Налада сістэмы для аналізу GPU.
- Усталюйце VTune Profiler зменныя асяроддзя, запускаючы пакет file: экспарт \env\vars.bat
- Выканайце каманду аналізу:
vtune.exe -collect gpu-offload — matrix_multiply.exe
VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Compute/Media Hotspots viewкропка. У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў працэсара і графічнага працэсара, каб зразумець, ці прывязана ваша прыкладанне да графічнага працэсара. Пераключыцеся ў акно Графіка, каб убачыць асноўныя паказчыкі працэсара і графічнага працэсара, якія прадстаўляюць выкананне кода з цягам часу.
Пачніце з Intel® VTune™ Profiler для АС Linux*
Перш чым пачаць
- Усталюйце Intel® VTune™ Profiler у вашай сістэме Linux*.
- Стварыце сваё прыкладанне з інфармацыяй аб сімвалах і ў рэжыме выпуску з уключанымі ўсімі аптымізацыямі. Для атрымання падрабязнай інфармацыі аб наладах кампілятара глядзіце VTune Profiler онлайн кіраўніцтва карыстальніка.
Вы таксама можаце выкарыстоўваць матрыцу sampДадатак le даступна ў \sampле\матрыца. Вы можаце ўбачыць сample вынікі ў \sampле (матрыца). - Наладзьце зменныя асяроддзя: крыніца /setvars.sh
Па змаўчанні, гэта:- $HOME/intel/oneapi/ пры ўсталёўцы з правамі карыстальніка;
- /opt/intel/oneapi/ пры ўсталёўцы з правамі root.
Крок 1: Запусціце VTune Profiler
Запусціце VTune Profiler адным з гэтых спосабаў:
Крыніца / Запусціце VTune Profiler
Аўтаномны/IDE (графічны інтэрфейс)
- Выканайце каманду vtunegui. Каб запусціць VTune Profiler у IDE Intel System Studio абярыце Інструменты > VTune Profiler > Запусціце VTune Profileр. Гэта задае ўсе адпаведныя зменныя асяроддзя і запускае аўтаномны інтэрфейс прадукту.
- Калі адкрыецца графічны інтэрфейс, націсніце НОВЫ ПРАЕКТ на экране прывітання.
- У дыялогавым акне «Стварыць праект» укажыце імя і месцазнаходжанне праекта.
- Націсніце Стварыць праект.
Аўтаномны (Камандны радок)
- Выканайце каманду vtune.
Крок 2: Налада і запуск аналізу
Пасля стварэння новага праекта адкрыецца акно Configure Analysis з наступнымі значэннямі па змаўчанні:
- У раздзеле "Запуск прыкладання" перайдзіце да месцазнаходжання вашага прыкладання.
- Націсніце «Пуск», каб запусціць здымак прадукцыйнасці вашага прыкладання. Гэты аналіз прадстаўляе агульны надview праблем, якія ўплываюць на прадукцыйнасць вашага прыкладання ў мэтавай сістэме.
крок 3: View і Аналіз дадзеных прадукцыйнасці
Пасля завяршэння збору даных VTune Profiler адлюстроўвае вынікі аналізу ў акне зводкі. Вось вы бачыце, што спектакль скончыўсяview Вашай заявы.
Надview звычайна ўключае некалькі паказчыкаў разам з іх апісаннямі.
- A Разгарніце кожную метрыку, каб атрымаць падрабязную інфармацыю пра спрыяльныя фактары.
- B Пазначаная метрыка паказвае значэнне за межамі прымальнага/нармальнага працоўнага дыяпазону. Скарыстайцеся падказкамі, каб зразумець, як палепшыць пазначаны паказчык.
- C Глядзіце рэкамендацыі па іншых аналізах, якія вам варта правесці наступным. Дрэва аналізу вылучае гэтыя рэкамендацыі.
Наступныя крокі
Здымак прадукцыйнасці з'яўляецца добрай адпраўной кропкай для атрымання агульнай ацэнкі прадукцыйнасці прыкладання з VTune Profileр. Далей праверце, ці патрабуе налада ваш алгарытм.
- Выконвайце падручнік, каб прааналізаваць агульныя вузкія месцы ў прадукцыйнасці.
- Пасля таго, як ваш алгарытм будзе добра наладжаны, зноў запусціце здымак прадукцыйнасці, каб адкалібраваць вынікі і вызначыць магчымыя паляпшэнні прадукцыйнасці ў іншых галінах.
Глядзіце таксама
Даследаванне мікраархітэктуры
VTune Profiler Дапаможны тур
Example: Profile Прыкладанне OpenMP на Linux*
Выкарыстоўвайце Intel VTune Profiler на машыне Linux у Profile якample iso3dfd_omp_offload Прыкладанне OpenMP выгружана на графічны працэсар Intel. Даведайцеся, як запусціць аналіз GPU і праверыць вынікі.
Перадумовы
- Пераканайцеся, што ваша сістэма працуе пад кіраваннем ядра АС Linux* 4.14 або больш новай версіі.
- Выкарыстоўвайце адну з наступных версій Intel Processor Graphics:
- Пакаленне 8
- Пакаленне 9
- Пакаленне 11
- Ваша сістэма павінна працаваць на адным з гэтых працэсараў Intel:
- Працэсары Intel® Core™ i7 7-га пакалення (кодавая назва Kaby Lake)
- Працэсары Intel® Core™ i8 7-га пакалення (кодавая назва Coffee Lake)
- Працэсары Intel® Core™ i10 7-га пакалення (кодавая назва Ice Lake)
- Для графічнага інтэрфейсу Linux выкарыстоўвайце:
- GTK+ версія 2.10 або навейшая (рэкамендуюцца версіі 2.18 і навейшыя)
- Pango версія 1.14 або навей
- X.Org версіі 1.0 або навей (рэкамендуюцца версіі 1.7 і навей)
- Усталюйце Intel VTune Profiler з адной з гэтых крыніц:
- Спампоўка аўтаномнага прадукту
- Intel® oneAPI Base Toolkit
- Intel® System Bring-up Toolkit
- Спампуйце Intel® oneAPI HPC Toolkit, які змяшчае кампілятар Intel® oneAPI DPC++/C++ (icx/icpx), неабходны для праfile Прыкладання OpenMP.
- Наладзьце зменныя асяроддзя. Выканайце скрыпт vars.sh.
- Наладзьце сістэму для аналізу GPU.
Стварыце і скампілюйце дадатак OpenMP Offload
- Спампуйце iso3dfd_omp_offload OpenMP Offload sampле.
- Адкрыты да сampкаталог le.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Скампілюйце прыкладанне OpenMP Offload.
зборка mkdir;
cmake -DVERIFY_RESULTS=0 ..
зрабіць -j
Гэта стварае выкананы файл src/iso3dfd.
Каб выдаліць праграму, увядзіце:
зрабіць чыстым
Гэта выдаляе выкананы файл і аб'ект files, якія вы стварылі з дапамогай каманды make.
Запусціце аналіз графічнага працэсара ў дадатку OpenMP Offload
Цяпер вы гатовыя запусціць аналіз разгрузкі GPU для скампіляванага вамі прыкладання OpenMP.
- Адкрыйце VTune Profiler і націсніце «Новы праект», каб стварыць праект.
- На старонцы прывітання націсніце «Наладзіць аналіз», каб наладзіць аналіз.
- Выберыце гэтыя параметры для аналізу.
- На панэлі WHERE выберыце «Лакальны хост».
- На панэлі WHAT выберыце Launch Application і ўкажыце двайковы файл iso3dfd_omp_offload у якасці прыкладання для праfile.
- На панэлі "ЯК" выберыце тып аналізу разгрузкі GPU з групы "Паскаральнікі" ў дрэве аналізу.
- Націсніце кнопку Пуск, каб запусціць аналіз.
VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Offload viewкропка.
- У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў ЦП і ГП. Выкарыстоўвайце гэтыя даныя, каб вызначыць, ці з'яўляецца ваша заяўка:
- Прывязаны да GPU
- Прывязаны да працэсара
- Неэфектыўнае выкарыстанне вылічальных рэсурсаў вашай сістэмы
- Выкарыстоўвайце інфармацыю ў акне платформы, каб убачыць асноўныя паказчыкі ЦП і ГП.
- Даследуйце канкрэтныя вылічальныя задачы ў акне Графіка.
Для больш глыбокага аналізу глядзіце адпаведны рэцэпт у VTune Profiler Кулінарная кніга па аналізе прадукцыйнасці. Вы таксама можаце працягнуць прафіляванне з дапамогай аналізу GPU Compute/Media Hotspots.
Example: Profile Прыкладанне SYCL* на Linux*
Выкарыстоўвайце VTune Profileг з асampДадатак le matrix_multiply SYCL для хуткага азнаямлення з прадуктам і статыстыкай, сабранай для прыкладанняў, звязаных з GPU.
Перадумовы
- Усталюйце VTune Profiler і кампілятар Intel® oneAPI DPC++/C++ з Intel® oneAPI Base Toolkit або Intel® System Bring-up Toolkit.
- Наладзьце зменныя асяроддзя, выканаўшы скрыпт vars.sh.
- Наладзьце сістэму для аналізу GPU.
Стварыце прыкладанне Matrix
Спампуйце код matrix_multiply_vtune sampпакет le для набораў інструментаў Intel oneAPI. Гэта змяшчае sample, які вы можаце выкарыстоўваць для стварэння і праfile дадатак SYCL.
Для профіfile прыкладанне SYCL, не забудзьцеся скампіляваць код з дапамогай параметраў -gline-tables-only і -fdebug-info-for-profiling Кампілятар Intel oneAPI DPC++.
Каб скласці гэты sampу дадатку, зрабіце наступнае:
- Перайсці да сampкаталог le.
cd <sample_dir/VtuneProfiler/matrix_multiply> - Multiply.cpp file у тэчцы src змяшчаецца некалькі варыянтаў матрычнага множання. Выберыце версію, адрэдагаваўшы адпаведны радок #define MULTIPLY у multiply.h.
- Стварыце праграму з дапамогай існуючага Makefile:
cmake .
зрабіць
Гэта павінна стварыць выканальны файл matrix.icpx -fsycl.
Каб выдаліць праграму, увядзіце:
зрабіць чыстым
Гэта выдаляе выкананы файл і аб'ект files, якія былі створаны камандай make.
Запусціце аналіз GPU
Запусціце аналіз GPU на Matrix sampле.
- Запусціце VTune Profiler з дапамогай каманды vtune-gui.
- Націсніце «Новы праект» на старонцы прывітання.
- Укажыце імя і месца для вашага sample project і націсніце «Стварыць праект».
- На панэлі ШТО перайдзіце да matrix.icpx-fsycl file.
- На панэлі ЯК націсніце
Кнопка "Агляд" і выберыце аналіз GPU Compute/Media Hotspots з групы "Паскаральнікі" ў дрэве аналізу.
- Націсніце кнопку Пуск унізе, каб запусціць аналіз з загадзя выбранымі параметрамі.
Запусціце аналіз GPU з каманднага радка:
- Падрыхтуйце сістэму да запуску аналізу GPU. Гл. Налада сістэмы для аналізу GPU.
- Наладзьце зменныя асяроддзя для праграмных сродкаў Intel:
крыніца $ONEAPI_ROOT/setvars.sh - Запусціце аналіз GPU Compute/Media Hotspots:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
Каб убачыць зводную справаздачу, увядзіце:
vtune -report summary -r ./result_gpu-hotspots
VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Compute/Media Hotspots viewкропка. У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў працэсара і графічнага працэсара, каб зразумець, ці прывязана ваша прыкладанне да графічнага працэсара. Пераключыцеся ў акно Графіка, каб убачыць асноўныя паказчыкі працэсара і графічнага працэсара, якія прадстаўляюць выкананне кода з цягам часу.
Пачніце з Intel® VTune™ Profiler для macOS*
Выкарыстоўвайце VTune Profiler у сістэме macOS для выканання аддаленага мэтавага аналізу ў сістэме без macOS (толькі для Linux* або Android*).
Вы не можаце выкарыстоўваць VTune Profiler у асяроддзі macOS для гэтых мэтаў:
- профіfile сістэма macOS, у якой ён усталяваны.
- Збірайце даныя ў аддаленай сістэме macOS.
Каб прааналізаваць прадукцыйнасць выдаленай мэты Linux* або Android* з хоста macOS, выканайце адзін з наступных крокаў:
- Запусціце VTune Profiler аналіз у сістэме macOS з аддаленай сістэмай, указанай у якасці мэты. Калі пачынаецца аналіз, VTune Profiler падключаецца да аддаленай сістэмы для збору даных, а затым вяртае вынікі на хост macOS для viewінж.
- Запусціце аналіз у мэтавай сістэме лакальна і скапіруйце вынікі ў сістэму macOS для viewу VTune Profiler.
Крокі ў гэтым дакуменце прадугледжваюць аддаленую мэтавую сістэму Linux і збор даных аб прадукцыйнасці з дапамогай SSH-доступу з VTune Profiler на хост-сістэме macOS.
Перш чым пачаць
- Усталюйце Intel® VTune™ Profiler у вашай сістэме macOS*.
- Стварыце сваё прыкладанне Linux з інфармацыяй аб сімвалах і ў рэжыме выпуску з уключанымі ўсімі аптымізацыямі. Для атрымання падрабязнай інфармацыі глядзіце налады кампілятара ў VTune Profileг дапамагчы.
- Наладзьце доступ SSH ад хост-сістэмы macOS да мэтавай сістэмы Linux для працы ў рэжыме без пароля.
Крок 1: Запусціце VTune Profiler
- Запусціце VTune Profiler з дапамогай каманды vtune-gui.
Па змаўчанні, гэта /opt/intel/oneapi/. - Калі адкрыецца графічны інтэрфейс, націсніце НОВЫ ПРАЕКТ на экране прывітання.
- У дыялогавым акне «Стварыць праект» укажыце імя і месцазнаходжанне праекта.
- Націсніце Стварыць праект.
Крок 2: Налада і запуск аналізу
Пасля стварэння новага праекта адкрыецца акно Configure Analysis з тыпам аналізу Performance Snapshot.
Гэты аналіз уяўляе сабой надview праблем, якія ўплываюць на прадукцыйнасць вашага прыкладання ў мэтавай сістэме.
- На панэлі WHERE выберыце Remote Linux (SSH) і ўкажыце мэтавую сістэму Linux, выкарыстоўваючы імя карыстальніка@ імя хаста[:порт].
VTune Profiler падключаецца да сістэмы Linux і ўсталёўвае мэтавы пакет. - На панэлі WHAT увядзіце шлях да вашага прыкладання ў мэтавай сістэме Linux.
- Націсніце кнопку "Пуск", каб запусціць здымак прадукцыйнасці праграмы.
крок 3: View і Аналіз дадзеных прадукцыйнасці
Пасля завяршэння збору даных VTune Profiler адлюстроўвае вынікі аналізу ў сістэме macOS. Пачніце аналіз у акне зводкі. Вось вы бачыце, што спектакль скончыўсяview Вашай заявы.
Надview звычайна ўключае некалькі паказчыкаў разам з іх апісаннямі.
- A Разгарніце кожную метрыку, каб атрымаць падрабязную інфармацыю пра спрыяльныя фактары.
- B Пазначаная метрыка паказвае значэнне за межамі прымальнага/нармальнага працоўнага дыяпазону. Скарыстайцеся падказкамі, каб зразумець, як палепшыць пазначаны паказчык.
- C Глядзіце рэкамендацыі па іншых аналізах, якія вам варта правесці наступным. Дрэва аналізу вылучае гэтыя рэкамендацыі.
Наступныя крокі
Здымак прадукцыйнасці з'яўляецца добрай адпраўной кропкай для атрымання агульнай ацэнкі прадукцыйнасці прыкладання з VTune Profiler.
Далей праверце, ці патрабуе налада ваш алгарытм.
- Запусціце аналіз гарачых кропак у вашым дадатку.
- Выконвайце падручнік Hotspots. Вывучыце метады, каб атрымаць максімальную карысць ад аналізу Hotspots.
- Пасля таго, як ваш алгарытм будзе добра наладжаны, зноў запусціце здымак прадукцыйнасці, каб адкалібраваць вынікі і вызначыць магчымыя паляпшэнні прадукцыйнасці ў іншых галінах.
Глядзіце таксама
Даследаванне мікраархітэктуры
VTune Profiler Дапаможны тур
Даведайцеся больш
Дакумент / Апісанне
- Кіраўніцтва карыстальніка
Кіраўніцтва карыстальніка з'яўляецца асноўнай дакументацыяй для VTune Profiler.
УВАГА
Вы таксама можаце загрузіць афлайн-версію VTune Profiler дакументацыя. - Навучанне онлайн
Інтэрнэт-навучальны сайт - выдатны рэсурс для вывучэння асноў VTune Profiler з кіраўніцтвамі па пачатку працы, відэа, падручнікамі, webінары, тэхнічныя артыкулы. - Кулінарная кніга
Кулінарная кніга аналізу прадукцыйнасці, якая змяшчае рэцэпты для выяўлення і вырашэння папулярных праблем з прадукцыйнасцю з выкарыстаннем тыпаў аналізу ў VTune Profiler. - Кіраўніцтва па ўстаноўцы для Windows | Linux | хасты macOS
Кіраўніцтва па ўстаноўцы змяшчае асноўныя інструкцыі па ўстаноўцы VTune Profiler і інструкцыі па канфігурацыі пасля ўстаноўкі для розных драйвераў і калектараў. - Падручнікі
VTune Profiler падручнікі пракансультуюць новага карыстальніка па асноўных функцыях з дапамогай кароткага sampпрыкладанне. - Заўвагі да выпуску
Знайдзіце інфармацыю аб апошняй версіі VTune Profiler, уключаючы поўнае апісанне новых функцый, сістэмных патрабаванняў і тэхнічных праблем, якія былі вырашаны.
Для аўтаномных версій і версій інструментарыя VTune Profiler, зразумець бягучыя сістэмныя патрабаванні.
Заўвагі і адмова ад адказнасці
Тэхналогіі Intel могуць запатрабаваць актываванага абсталявання, праграмнага забеспячэння або актывацыі службы.
Ні адзін прадукт ці кампанент не можа быць абсалютна бяспечным.
Вашы выдаткі і вынікі могуць адрознівацца.
© Карпарацыя Intel. Intel, лагатып Intel і іншыя знакі Intel з'яўляюцца гандлёвымі маркамі карпарацыі Intel або яе даччыных кампаній. Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Intel, лагатып Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune і Xeon з'яўляюцца гандлёвымі маркамі карпарацыі Intel у ЗША і/ці іншых краінах.
*Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Microsoft, Windows і лагатып Windows з'яўляюцца гандлёвымі маркамі або зарэгістраванымі гандлёвымі маркамі карпарацыі Microsoft у Злучаных Штатах і/ці іншых краінах.
Java з'яўляецца зарэгістраванай гандлёвай маркай Oracle і/або яе філіялаў.
OpenCL і лагатып OpenCL з'яўляюцца гандлёвымі маркамі Apple Inc., якія выкарыстоўваюцца з дазволу Khronos.
Тэхналогіі Intel могуць запатрабаваць актываванага абсталявання, праграмнага забеспячэння або актывацыі службы.
Ні адзін прадукт ці кампанент не можа быць абсалютна бяспечным.
Вашы выдаткі і вынікі могуць адрознівацца.
© Карпарацыя Intel. Intel, лагатып Intel і іншыя знакі Intel з'яўляюцца гандлёвымі маркамі карпарацыі Intel або яе даччыных кампаній. Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Intel, лагатып Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune і Xeon з'яўляюцца гандлёвымі маркамі карпарацыі Intel у ЗША і/ці іншых краінах.
*Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Microsoft, Windows і лагатып Windows з'яўляюцца гандлёвымі маркамі або зарэгістраванымі гандлёвымі маркамі карпарацыі Microsoft у Злучаных Штатах і/ці іншых краінах.
Java з'яўляецца зарэгістраванай гандлёвай маркай Oracle і/або яе філіялаў.
OpenCL і лагатып OpenCL з'яўляюцца гандлёвымі маркамі Apple Inc., якія выкарыстоўваюцца з дазволу Khronos.
Дакументы / Рэсурсы
![]() |
Intel Пачатак працы з VTune Profiler [pdfКіраўніцтва карыстальніка Пачніце з VTune Profiler, Пачніце, з VTune Profiler, VTune Profiler |