intel-Get-Started-with-VTune-Profiler-лагатып

Intel Пачатак працы з VTune Profiler

Пачніце з Intel® VTune™ Profiler

Выкарыстоўвайце Intel VTune Profiler для аналізу лакальных і аддаленых мэтавых сістэм з хастоў Windows*, macOS* і Linux*. Палепшыце прадукцыйнасць прыкладанняў і сістэмы з дапамогай гэтых аперацый:

  • Прааналізуйце выбар алгарытму.
  • Знайдзіце вузкія месцы паслядоўнага і паралельнага кода.
  • Зразумейце, дзе і як ваша прыкладанне можа атрымаць выгаду з даступных апаратных рэсурсаў.
  • Паскорыць выкананне вашага прыкладання.
    Спампаваць Intel VTune Profiler у вашай сістэме адным з наступных спосабаў:
  • Спампуйце аўтаномную версію.
  • Атрымаць Intel VTune Profiler як частка Intel® oneAPI Base Toolkit.
    Глядзіце VTune Profiler навучальная старонка для відэа, webinars і іншыя матэрыялы, якія дапамогуць вам пачаць працу.

УВАГА
Дакументацыя для версій Intel® VTune™ Profiler да выпуску 2021 г. даступныя толькі для спампоўкі. Спіс даступнай для загрузкі дакументацыі па версіях прадукту глядзіце на гэтых старонках:

  • Спампаваць дакументацыю для Intel Parallel Studio XE
  • Спампаваць дакументацыю для Intel System Studio

Зразумець працоўны працэс
Выкарыстоўвайце Intel VTune Profileг да праfile прыкладанне і аналізаваць вынікі для павышэння прадукцыйнасці.

Агульны працоўны працэс змяшчае наступныя этапы:

intel-Get-Started-with-VTune-Profileр-01

Каб пачаць, абярыце хост-сістэму
Даведацца больш аб сістэмных працоўных працэсах для Windows*, Linux* або macOS*.

intel-Get-Started-with-VTune-Profileр-02

Пачніце з Intel® VTune™ Profiler для АС Windows*

Перш чым пачаць

  1. Усталюйце Intel® VTune™ Profiler у вашай сістэме Windows*.
  2. Стварыце сваё прыкладанне з інфармацыяй аб сімвалах і ў рэжыме выпуску з уключанымі ўсімі аптымізацыямі. Для атрымання падрабязнай інфармацыі аб наладах кампілятара глядзіце VTune Profiler онлайн кіраўніцтва карыстальніка.
    Вы таксама можаце выкарыстоўваць матрыцу sampДадатак le даступна ў \VTune\Sampлес\матрыца. Вы можаце ўбачыць адпаведныя sample вынікі ў \VTune\Projects\sampле (матрыца).
  3. Наладзьце зменныя асяроддзя: запусціце Скрыпт \setvars.bat.
    Па змаўчанні, для кампанентаў oneAPI - гэта праграма Files (x86)\Intel\oneAPI.
    УВАГА Вам не трэба запускаць setvars.bat пры выкарыстанні Intel® VTune™ Profiler у Microsoft* Visual Studio*.

Крок 1: Запусціце Intel® VTune™ Profiler
Запусціце Intel VTune Profiler адным з гэтых спосабаў і наладзьце праект. Праект - гэта кантэйнер для прыкладання, якое вы хочаце прааналізаваць, тыпу аналізу і вынікаў збору даных.

Крыніца / Запусціце VTune Profiler

Аўтаномны (графічны інтэрфейс)

  1. Выканайце каманду vtune-gui або запусціце Intel® VTune™ Profiler з меню «Пуск».
  2. Калі адкрыецца графічны інтэрфейс, націсніце на экране прывітання.
  3. У дыялогавым акне «Стварыць праект» укажыце імя і месцазнаходжанне праекта.
  4. Націсніце Стварыць праект.

Аўтаномны (Камандны радок)
Выканайце каманду vtune.

Microsoft* Visual Studio* IDE
Адкрыйце сваё рашэнне ў Visual Studio. VTune ProfileПанэль інструментаў r аўтаматычна ўключаецца, і ваш праект Visual Studio усталёўваецца ў якасці мэты аналізу.

УВАГА
Вам не трэба ствараць праект пры запуску Intel® VTune™ Profiler з каманднага радка або ў Microsoft* Visual Studio.

Крок 2: Налада і запуск аналізу
Пасля стварэння новага праекта адкрыецца акно Configure Analysis з наступнымі значэннямі па змаўчанні:

intel-Get-Started-with-VTune-Profileр-03

  1. У раздзеле "Запуск прыкладання" знайдзіце месцазнаходжанне выкананага файла вашага прыкладання file.
  2. Націсніце "Пуск", каб запусціць здымак прадукцыйнасці вашага прыкладання. Гэты аналіз прадстаўляе агульны надview праблем, якія ўплываюць на прадукцыйнасць вашага прыкладання ў мэтавай сістэме.

крок 3: View і Аналіз дадзеных прадукцыйнасці
Пасля завяршэння збору даных VTune Profiler адлюстроўвае вынікі аналізу ў акне зводкі. Вось вы бачыце, што спектакль скончыўсяview Вашай заявы.
Надview звычайна ўключае некалькі паказчыкаў разам з іх апісаннямі.

intel-Get-Started-with-VTune-Profileр-04

  • A Разгарніце кожную метрыку, каб атрымаць падрабязную інфармацыю пра спрыяльныя фактары.
  • B Пазначаная метрыка паказвае значэнне за межамі прымальнага/нармальнага працоўнага дыяпазону. Скарыстайцеся падказкамі, каб зразумець, як палепшыць пазначаны паказчык.
  • C Глядзіце рэкамендацыі па іншых аналізах, якія вам варта правесці наступным. Дрэва аналізу вылучае гэтыя рэкамендацыі.

Наступныя крокі
Здымак прадукцыйнасці з'яўляецца добрай адпраўной кропкай для атрымання агульнай ацэнкі прадукцыйнасці прыкладання з VTune Profileр. Далей праверце, ці патрабуе налада ваш алгарытм.

  1. Выконвайце падручнік, каб прааналізаваць агульныя вузкія месцы ў прадукцыйнасці.
  2. Пасля таго, як ваш алгарытм будзе добра наладжаны, зноў запусціце здымак прадукцыйнасці, каб адкалібраваць вынікі і вызначыць магчымыя паляпшэнні прадукцыйнасці ў іншых галінах.

Глядзіце таксама
Даследаванне мікраархітэктуры

VTune Profiler Дапаможны тур

Exampль: профіfile Прыкладанне OpenMP* для Windows*
Выкарыстоўвайце Intel VTune Profiler на машыне з Windows у Profile якample iso3dfd_omp_offload Прыкладанне OpenMP выгружана на графічны працэсар Intel. Даведайцеся, як запусціць аналіз GPU і праверыць вынікі.

Перадумовы

  • Пераканайцеся, што ваша сістэма працуе пад кіраваннем Microsoft* Windows 10 або больш новай версіі.
  • Выкарыстоўвайце адну з наступных версій Intel Processor Graphics:
    • Пакаленне 8
    • Пакаленне 9
    • Пакаленне 11
  • Ваша сістэма павінна працаваць на адным з гэтых працэсараў Intel:
    • Працэсары Intel® Core™ i7 7-га пакалення (кодавая назва Kaby Lake)
    • Працэсары Intel® Core™ i8 7-га пакалення (кодавая назва Coffee Lake)
    • Працэсары Intel® Core™ i10 7-га пакалення (кодавая назва Ice Lake)
  • Усталюйце Intel VTune Profiler з адной з гэтых крыніц:
    • Спампоўка аўтаномнага прадукту
    • Intel® oneAPI Base Toolkit
    • Intel® System Bring-up Toolkit
  • Спампуйце Intel® oneAPI HPC Toolkit, які змяшчае кампілятар Intel® oneAPI DPC++/C++ (icx/icpx), неабходны для праfile Прыкладання OpenMP.
  • Наладзьце зменныя асяроддзя. Выканайце скрыпт vars.bat, размешчаны ў каталог \env.
  • Наладзьце сістэму для аналізу GPU.

УВАГА
Каб усталяваць Intel VTune Profiler у асяроддзі Microsoft* Visual Studio, глядзіце VTune Profiler Кіраўніцтва карыстальніка.

Стварыце і скампілюйце дадатак OpenMP Offload

  1. Спампуйце iso3dfd_omp_offload OpenMP Offload sampле.
  2. Адкрыты да сampкаталог le.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. Скампілюйце прыкладанне OpenMP Offload.

зборка mkdir
зборка cd
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-мэты:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

Запусціце аналіз графічнага працэсара ў дадатку OpenMP Offload
Цяпер вы гатовыя запусціць аналіз разгрузкі GPU для скампіляванага вамі прыкладання OpenMP.

  1. Адкрыйце VTune Profiler і націсніце «Новы праект», каб стварыць праект.
  2. На старонцы прывітання націсніце «Наладзіць аналіз», каб наладзіць аналіз.
  3. Выберыце гэтыя параметры для аналізу.
    • На панэлі WHERE выберыце «Лакальны хост».
    • На панэлі WHAT выберыце Launch Application і ўкажыце двайковы файл iso3dfd_omp_offload у якасці прыкладання для праfile.
    • На панэлі "ЯК" выберыце тып аналізу разгрузкі GPU з групы "Паскаральнікі" ў дрэве аналізу.
      intel-Get-Started-with-VTune-Profileр-05
  4. Націсніце кнопку Пуск, каб запусціць аналіз.

VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Offload viewкропка.

  • У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў ЦП і ГП. Выкарыстоўвайце гэтыя даныя, каб вызначыць, ці з'яўляецца ваша заяўка:
    • Прывязаны да GPU
    • Прывязаны да працэсара
    • Неэфектыўнае выкарыстанне вылічальных рэсурсаў вашай сістэмы
  • Выкарыстоўвайце інфармацыю ў акне платформы, каб убачыць асноўныя паказчыкі ЦП і ГП.
  • Даследуйце канкрэтныя вылічальныя задачы ў акне Графіка.

Для больш глыбокага аналізу глядзіце адпаведны рэцэпт у VTune Profiler Кулінарная кніга па аналізе прадукцыйнасці. Вы таксама можаце працягнуць прафіляванне з дапамогай аналізу GPU Compute/Media Hotspots.

Example: Profile Прыкладанне SYCL* у Windows*
профіfile якample matrix_multiply SYCL прыкладанне з Intel® VTune™ Profileр. Азнаёмцеся з прадуктам і зразумейце статыстыку, сабраную для прыкладанняў, звязаных з GPU.

Перадумовы

  • Пераканайцеся, што ў вашай сістэме ўсталявана Microsoft* Visual Studio (версія 2017 або навейшая).
  • Усталюйце Intel VTune Profiler з Intel® oneAPI Base Toolkit або Intel® System Bring-up Toolkit. Гэтыя наборы інструментаў утрымліваюць кампілятар Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl), неабходны для працэсу прафілявання.
  • Наладзьце зменныя асяроддзя. Выканайце скрыпт vars.bat, размешчаны ў каталог \env.
  • Пераканайцеся, што кампілятар Intel oneAPI DPC++ (усталяваны разам з наборам інструментаў Intel oneAPI Base) інтэграваны ў Microsoft Visual Studio.
  • Скампілюйце код з дапамогай параметраў -gline-tables-only і -fdebug-info-for-profiling для кампілятара Intel oneAPI DPC++.
  • Наладзьце сістэму для аналізу GPU.

Для атрымання інфармацыі аб усталяванні Intel VTune Profiler у асяроддзі Microsoft* Visual Studio, гл. VTune Profiler Кіраўніцтва карыстальніка.

Стварыце праграму Matrix
Спампуйце код matrix_multiply_vtune sampпакет le для набораў інструментаў Intel oneAPI. Гэта змяшчае sample, які вы можаце выкарыстоўваць для стварэння і праfile дадатак SYCL.

  1. Адкрыйце Microsoft* Visual Studio.
  2. Націсніце File > Адкрыць > Праект/Рашэнне. Знайдзіце тэчку matrix_multiply_vtune і абярыце matrix_multiply.sln.
  3. Стварыце гэтую канфігурацыю (Праект > Зборка).
  4. Запусціце праграму (Debug > Start Without Debugging).
  5. Каб выбраць DPC++ або разьбовую версію sample, выкарыстоўваць азначэнні прэпрацэсара.
    1. Перайдзіце ў раздзел Уласцівасці праекта > DPC++ > Прэпрацэсар > Вызначэнне прэпрацэсара.
    2. Вызначце icpx -fsycl або USE_THR.

Запусціце аналіз GPU
Запусціце аналіз GPU на Matrix sampле.

  1. На панэлі інструментаў Visual Studio націсніце кнопку «Наладзіць аналіз».
    Адкрыецца акно Configure Analysis. Па змаўчанні ён успадкоўвае налады вашага праекта VS і вызначае matrix_multiply.exe як дадатак для праfile.
  2. У акне Configure Analysis націсніцеintel-Get-Started-with-VTune-Profileр-06 Кнопка "Агляд" на панэлі "ЯК".
  3. Выберыце тып аналізу GPU Compute/Media Hotspots з групы Accelerators у дрэве аналізу.
    intel-Get-Started-with-VTune-Profileр-06
  4. Націсніце кнопку Пуск, каб запусціць аналіз з прадусталяванымі опцыямі.

Запусціце аналіз GPU з каманднага радка:

  1. Адкрыйце сampкаталог файлаў:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. У гэтым каталогу адкрыйце праект Visual Studio* file пад назвай matrix_multiply.sln
  3. Multiply.cpp file змяшчае некалькі варыянтаў матрычнага множання. Выберыце версію, адрэдагаваўшы адпаведны радок #define MULTIPLY у multiply.hpp
  4. Стварыце ўвесь праект з канфігурацыяй Release.
    Гэта стварае выкананы файл пад назвай matrix_multiply.exe.
  5. Падрыхтуйце сістэму да запуску аналізу GPU. Гл. Налада сістэмы для аналізу GPU.
  6. Усталюйце VTune Profiler зменныя асяроддзя, запускаючы пакет file: экспарт \env\vars.bat
  7. Выканайце каманду аналізу:
    vtune.exe -collect gpu-offload — matrix_multiply.exe

VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Compute/Media Hotspots viewкропка. У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў працэсара і графічнага працэсара, каб зразумець, ці прывязана ваша прыкладанне да графічнага працэсара. Пераключыцеся ў акно Графіка, каб убачыць асноўныя паказчыкі працэсара і графічнага працэсара, якія прадстаўляюць выкананне кода з цягам часу.

Пачніце з Intel® VTune™ Profiler для АС Linux*

Перш чым пачаць

  1. Усталюйце Intel® VTune™ Profiler у вашай сістэме Linux*.
  2. Стварыце сваё прыкладанне з інфармацыяй аб сімвалах і ў рэжыме выпуску з уключанымі ўсімі аптымізацыямі. Для атрымання падрабязнай інфармацыі аб наладах кампілятара глядзіце VTune Profiler онлайн кіраўніцтва карыстальніка.
    Вы таксама можаце выкарыстоўваць матрыцу sampДадатак le даступна ў \sampле\матрыца. Вы можаце ўбачыць сample вынікі ў \sampле (матрыца).
  3. Наладзьце зменныя асяроддзя: крыніца /setvars.sh
    Па змаўчанні, гэта:
    • $HOME/intel/oneapi/ пры ўсталёўцы з правамі карыстальніка;
    • /opt/intel/oneapi/ пры ўсталёўцы з правамі root.

Крок 1: Запусціце VTune Profiler
Запусціце VTune Profiler адным з гэтых спосабаў:

Крыніца / Запусціце VTune Profiler
Аўтаномны/IDE (графічны інтэрфейс)

  1. Выканайце каманду vtunegui. Каб запусціць VTune Profiler у IDE Intel System Studio абярыце Інструменты > VTune Profiler > Запусціце VTune Profileр. Гэта задае ўсе адпаведныя зменныя асяроддзя і запускае аўтаномны інтэрфейс прадукту.
  2. Калі адкрыецца графічны інтэрфейс, націсніце НОВЫ ПРАЕКТ на экране прывітання.
  3. У дыялогавым акне «Стварыць праект» укажыце імя і месцазнаходжанне праекта.
  4. Націсніце Стварыць праект.

Аўтаномны (Камандны радок)

  • Выканайце каманду vtune.

Крок 2: Налада і запуск аналізу
Пасля стварэння новага праекта адкрыецца акно Configure Analysis з наступнымі значэннямі па змаўчанні:

intel-Get-Started-with-VTune-Profileр-07

  1. У раздзеле "Запуск прыкладання" перайдзіце да месцазнаходжання вашага прыкладання.
  2. Націсніце «Пуск», каб запусціць здымак прадукцыйнасці вашага прыкладання. Гэты аналіз прадстаўляе агульны надview праблем, якія ўплываюць на прадукцыйнасць вашага прыкладання ў мэтавай сістэме.

крок 3: View і Аналіз дадзеных прадукцыйнасці
Пасля завяршэння збору даных VTune Profiler адлюстроўвае вынікі аналізу ў акне зводкі. Вось вы бачыце, што спектакль скончыўсяview Вашай заявы.
Надview звычайна ўключае некалькі паказчыкаў разам з іх апісаннямі.

intel-Get-Started-with-VTune-Profileр-08

  • A Разгарніце кожную метрыку, каб атрымаць падрабязную інфармацыю пра спрыяльныя фактары.
  • B Пазначаная метрыка паказвае значэнне за межамі прымальнага/нармальнага працоўнага дыяпазону. Скарыстайцеся падказкамі, каб зразумець, як палепшыць пазначаны паказчык.
  • C Глядзіце рэкамендацыі па іншых аналізах, якія вам варта правесці наступным. Дрэва аналізу вылучае гэтыя рэкамендацыі.

Наступныя крокі
Здымак прадукцыйнасці з'яўляецца добрай адпраўной кропкай для атрымання агульнай ацэнкі прадукцыйнасці прыкладання з VTune Profileр. Далей праверце, ці патрабуе налада ваш алгарытм.

  1. Выконвайце падручнік, каб прааналізаваць агульныя вузкія месцы ў прадукцыйнасці.
  2. Пасля таго, як ваш алгарытм будзе добра наладжаны, зноў запусціце здымак прадукцыйнасці, каб адкалібраваць вынікі і вызначыць магчымыя паляпшэнні прадукцыйнасці ў іншых галінах.

Глядзіце таксама
Даследаванне мікраархітэктуры

VTune Profiler Дапаможны тур

Example: Profile Прыкладанне OpenMP на Linux*
Выкарыстоўвайце Intel VTune Profiler на машыне Linux у Profile якample iso3dfd_omp_offload Прыкладанне OpenMP выгружана на графічны працэсар Intel. Даведайцеся, як запусціць аналіз GPU і праверыць вынікі.

Перадумовы

  • Пераканайцеся, што ваша сістэма працуе пад кіраваннем ядра АС Linux* 4.14 або больш новай версіі.
  • Выкарыстоўвайце адну з наступных версій Intel Processor Graphics:
    • Пакаленне 8
    • Пакаленне 9
    • Пакаленне 11
  • Ваша сістэма павінна працаваць на адным з гэтых працэсараў Intel:
    • Працэсары Intel® Core™ i7 7-га пакалення (кодавая назва Kaby Lake)
    • Працэсары Intel® Core™ i8 7-га пакалення (кодавая назва Coffee Lake)
    • Працэсары Intel® Core™ i10 7-га пакалення (кодавая назва Ice Lake)
  • Для графічнага інтэрфейсу Linux выкарыстоўвайце:
    • GTK+ версія 2.10 або навейшая (рэкамендуюцца версіі 2.18 і навейшыя)
    • Pango версія 1.14 або навей
    • X.Org версіі 1.0 або навей (рэкамендуюцца версіі 1.7 і навей)
  • Усталюйце Intel VTune Profiler з адной з гэтых крыніц:
    • Спампоўка аўтаномнага прадукту
    • Intel® oneAPI Base Toolkit
    • Intel® System Bring-up Toolkit
  • Спампуйце Intel® oneAPI HPC Toolkit, які змяшчае кампілятар Intel® oneAPI DPC++/C++ (icx/icpx), неабходны для праfile Прыкладання OpenMP.
  • Наладзьце зменныя асяроддзя. Выканайце скрыпт vars.sh.
  • Наладзьце сістэму для аналізу GPU.

Стварыце і скампілюйце дадатак OpenMP Offload

  1. Спампуйце iso3dfd_omp_offload OpenMP Offload sampле.
  2. Адкрыты да сampкаталог le.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. Скампілюйце прыкладанне OpenMP Offload.

зборка mkdir;
cmake -DVERIFY_RESULTS=0 ..
зрабіць -j

Гэта стварае выкананы файл src/iso3dfd.

Каб выдаліць праграму, увядзіце:
зрабіць чыстым

Гэта выдаляе выкананы файл і аб'ект files, якія вы стварылі з дапамогай каманды make.

Запусціце аналіз графічнага працэсара ў дадатку OpenMP Offload
Цяпер вы гатовыя запусціць аналіз разгрузкі GPU для скампіляванага вамі прыкладання OpenMP.

  1. Адкрыйце VTune Profiler і націсніце «Новы праект», каб стварыць праект.
  2. На старонцы прывітання націсніце «Наладзіць аналіз», каб наладзіць аналіз.
  3. Выберыце гэтыя параметры для аналізу.
    • На панэлі WHERE выберыце «Лакальны хост».
    • На панэлі WHAT выберыце Launch Application і ўкажыце двайковы файл iso3dfd_omp_offload у якасці прыкладання для праfile.
    • На панэлі "ЯК" выберыце тып аналізу разгрузкі GPU з групы "Паскаральнікі" ў дрэве аналізу.
      intel-Get-Started-with-VTune-Profileр-09
  4. Націсніце кнопку Пуск, каб запусціць аналіз.

VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Offload viewкропка.

  • У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў ЦП і ГП. Выкарыстоўвайце гэтыя даныя, каб вызначыць, ці з'яўляецца ваша заяўка:
    • Прывязаны да GPU
    • Прывязаны да працэсара
    • Неэфектыўнае выкарыстанне вылічальных рэсурсаў вашай сістэмы
  • Выкарыстоўвайце інфармацыю ў акне платформы, каб убачыць асноўныя паказчыкі ЦП і ГП.
  • Даследуйце канкрэтныя вылічальныя задачы ў акне Графіка.

Для больш глыбокага аналізу глядзіце адпаведны рэцэпт у VTune Profiler Кулінарная кніга па аналізе прадукцыйнасці. Вы таксама можаце працягнуць прафіляванне з дапамогай аналізу GPU Compute/Media Hotspots.

Example: Profile Прыкладанне SYCL* на Linux*
Выкарыстоўвайце VTune Profileг з асampДадатак le matrix_multiply SYCL для хуткага азнаямлення з прадуктам і статыстыкай, сабранай для прыкладанняў, звязаных з GPU.

Перадумовы

  • Усталюйце VTune Profiler і кампілятар Intel® oneAPI DPC++/C++ з Intel® oneAPI Base Toolkit або Intel® System Bring-up Toolkit.
  • Наладзьце зменныя асяроддзя, выканаўшы скрыпт vars.sh.
  • Наладзьце сістэму для аналізу GPU.

Стварыце прыкладанне Matrix
Спампуйце код matrix_multiply_vtune sampпакет le для набораў інструментаў Intel oneAPI. Гэта змяшчае sample, які вы можаце выкарыстоўваць для стварэння і праfile дадатак SYCL.

Для профіfile прыкладанне SYCL, не забудзьцеся скампіляваць код з дапамогай параметраў -gline-tables-only і -fdebug-info-for-profiling Кампілятар Intel oneAPI DPC++.

Каб скласці гэты sampу дадатку, зрабіце наступнае:

  1. Перайсці да сampкаталог le.
    cd <sample_dir/VtuneProfiler/matrix_multiply>
  2. Multiply.cpp file у тэчцы src змяшчаецца некалькі варыянтаў матрычнага множання. Выберыце версію, адрэдагаваўшы адпаведны радок #define MULTIPLY у multiply.h.
  3. Стварыце праграму з дапамогай існуючага Makefile:
    cmake .
    зрабіць
    Гэта павінна стварыць выканальны файл matrix.icpx -fsycl.
    Каб выдаліць праграму, увядзіце:
    зрабіць чыстым
    Гэта выдаляе выкананы файл і аб'ект files, якія былі створаны камандай make.

Запусціце аналіз GPU
Запусціце аналіз GPU на Matrix sampле.

  1. Запусціце VTune Profiler з дапамогай каманды vtune-gui.
  2. Націсніце «Новы праект» на старонцы прывітання.
  3. Укажыце імя і месца для вашага sample project і націсніце «Стварыць праект».
  4. На панэлі ШТО перайдзіце да matrix.icpx-fsycl file.
  5. На панэлі ЯК націсніце intel-Get-Started-with-VTune-Profileр-06 Кнопка "Агляд" і выберыце аналіз GPU Compute/Media Hotspots з групы "Паскаральнікі" ў дрэве аналізу.
    intel-Get-Started-with-VTune-Profileр-10
  6. Націсніце кнопку Пуск унізе, каб запусціць аналіз з загадзя выбранымі параметрамі.

Запусціце аналіз GPU з каманднага радка:

  1. Падрыхтуйце сістэму да запуску аналізу GPU. Гл. Налада сістэмы для аналізу GPU.
  2. Наладзьце зменныя асяроддзя для праграмных сродкаў Intel:
    крыніца $ONEAPI_ROOT/setvars.sh
  3. Запусціце аналіз GPU Compute/Media Hotspots:
    vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    Каб убачыць зводную справаздачу, увядзіце:
    vtune -report summary -r ./result_gpu-hotspots

VTune Profiler збірае даныя і адлюстроўвае вынікі аналізу ў GPU Compute/Media Hotspots viewкропка. У акне зводкі паглядзіце статыстыку выкарыстання рэсурсаў працэсара і графічнага працэсара, каб зразумець, ці прывязана ваша прыкладанне да графічнага працэсара. Пераключыцеся ў акно Графіка, каб убачыць асноўныя паказчыкі працэсара і графічнага працэсара, якія прадстаўляюць выкананне кода з цягам часу.

Пачніце з Intel® VTune™ Profiler для macOS*

Выкарыстоўвайце VTune Profiler у сістэме macOS для выканання аддаленага мэтавага аналізу ў сістэме без macOS (толькі для Linux* або Android*).

Вы не можаце выкарыстоўваць VTune Profiler у асяроддзі macOS для гэтых мэтаў:

  • профіfile сістэма macOS, у якой ён усталяваны.
  • Збірайце даныя ў аддаленай сістэме macOS.

Каб прааналізаваць прадукцыйнасць выдаленай мэты Linux* або Android* з хоста macOS, выканайце адзін з наступных крокаў:

  • Запусціце VTune Profiler аналіз у сістэме macOS з аддаленай сістэмай, указанай у якасці мэты. Калі пачынаецца аналіз, VTune Profiler падключаецца да аддаленай сістэмы для збору даных, а затым вяртае вынікі на хост macOS для viewінж.
  • Запусціце аналіз у мэтавай сістэме лакальна і скапіруйце вынікі ў сістэму macOS для viewу VTune Profiler.

Крокі ў гэтым дакуменце прадугледжваюць аддаленую мэтавую сістэму Linux і збор даных аб прадукцыйнасці з дапамогай SSH-доступу з VTune Profiler на хост-сістэме macOS.

Перш чым пачаць

  1. Усталюйце Intel® VTune™ Profiler у вашай сістэме macOS*.
  2. Стварыце сваё прыкладанне Linux з інфармацыяй аб сімвалах і ў рэжыме выпуску з уключанымі ўсімі аптымізацыямі. Для атрымання падрабязнай інфармацыі глядзіце налады кампілятара ў VTune Profileг дапамагчы.
  3. Наладзьце доступ SSH ад хост-сістэмы macOS да мэтавай сістэмы Linux для працы ў рэжыме без пароля.

Крок 1: Запусціце VTune Profiler

  1. Запусціце VTune Profiler з дапамогай каманды vtune-gui.
    Па змаўчанні, гэта /opt/intel/oneapi/.
  2. Калі адкрыецца графічны інтэрфейс, націсніце НОВЫ ПРАЕКТ на экране прывітання.
  3. У дыялогавым акне «Стварыць праект» укажыце імя і месцазнаходжанне праекта.
  4. Націсніце Стварыць праект.

Крок 2: Налада і запуск аналізу
Пасля стварэння новага праекта адкрыецца акно Configure Analysis з тыпам аналізу Performance Snapshot.
Гэты аналіз уяўляе сабой надview праблем, якія ўплываюць на прадукцыйнасць вашага прыкладання ў мэтавай сістэме.

intel-Get-Started-with-VTune-Profileр-11

  1. На панэлі WHERE выберыце Remote Linux (SSH) і ўкажыце мэтавую сістэму Linux, выкарыстоўваючы імя карыстальніка@ імя хаста[:порт].
    VTune Profiler падключаецца да сістэмы Linux і ўсталёўвае мэтавы пакет.
  2. На панэлі WHAT увядзіце шлях да вашага прыкладання ў мэтавай сістэме Linux.
  3. Націсніце кнопку "Пуск", каб запусціць здымак прадукцыйнасці праграмы.

крок 3: View і Аналіз дадзеных прадукцыйнасці
Пасля завяршэння збору даных VTune Profiler адлюстроўвае вынікі аналізу ў сістэме macOS. Пачніце аналіз у акне зводкі. Вось вы бачыце, што спектакль скончыўсяview Вашай заявы.

Надview звычайна ўключае некалькі паказчыкаў разам з іх апісаннямі.

intel-Get-Started-with-VTune-Profileр-12

  • A Разгарніце кожную метрыку, каб атрымаць падрабязную інфармацыю пра спрыяльныя фактары.
  • B Пазначаная метрыка паказвае значэнне за межамі прымальнага/нармальнага працоўнага дыяпазону. Скарыстайцеся падказкамі, каб зразумець, як палепшыць пазначаны паказчык.
  • C Глядзіце рэкамендацыі па іншых аналізах, якія вам варта правесці наступным. Дрэва аналізу вылучае гэтыя рэкамендацыі.

Наступныя крокі
Здымак прадукцыйнасці з'яўляецца добрай адпраўной кропкай для атрымання агульнай ацэнкі прадукцыйнасці прыкладання з VTune Profiler.
Далей праверце, ці патрабуе налада ваш алгарытм.

  1. Запусціце аналіз гарачых кропак у вашым дадатку.
  2. Выконвайце падручнік Hotspots. Вывучыце метады, каб атрымаць максімальную карысць ад аналізу Hotspots.
  3. Пасля таго, як ваш алгарытм будзе добра наладжаны, зноў запусціце здымак прадукцыйнасці, каб адкалібраваць вынікі і вызначыць магчымыя паляпшэнні прадукцыйнасці ў іншых галінах.

Глядзіце таксама
Даследаванне мікраархітэктуры

VTune Profiler Дапаможны тур

Даведайцеся больш
Дакумент / Апісанне

  • Кіраўніцтва карыстальніка
    Кіраўніцтва карыстальніка з'яўляецца асноўнай дакументацыяй для VTune Profiler.
    УВАГА
    Вы таксама можаце загрузіць афлайн-версію VTune Profiler дакументацыя.
  • Навучанне онлайн
    Інтэрнэт-навучальны сайт - выдатны рэсурс для вывучэння асноў VTune Profiler з кіраўніцтвамі па пачатку працы, відэа, падручнікамі, webінары, тэхнічныя артыкулы.
  • Кулінарная кніга
    Кулінарная кніга аналізу прадукцыйнасці, якая змяшчае рэцэпты для выяўлення і вырашэння папулярных праблем з прадукцыйнасцю з выкарыстаннем тыпаў аналізу ў VTune Profiler.
  • Кіраўніцтва па ўстаноўцы для Windows | Linux | хасты macOS
    Кіраўніцтва па ўстаноўцы змяшчае асноўныя інструкцыі па ўстаноўцы VTune Profiler і інструкцыі па канфігурацыі пасля ўстаноўкі для розных драйвераў і калектараў.
  • Падручнікі
    VTune Profiler падручнікі пракансультуюць новага карыстальніка па асноўных функцыях з дапамогай кароткага sampпрыкладанне.
  • Заўвагі да выпуску
    Знайдзіце інфармацыю аб апошняй версіі VTune Profiler, уключаючы поўнае апісанне новых функцый, сістэмных патрабаванняў і тэхнічных праблем, якія былі вырашаны.
    Для аўтаномных версій і версій інструментарыя VTune Profiler, зразумець бягучыя сістэмныя патрабаванні.

Заўвагі і адмова ад адказнасці
Тэхналогіі Intel могуць запатрабаваць актываванага абсталявання, праграмнага забеспячэння або актывацыі службы.
Ні адзін прадукт ці кампанент не можа быць абсалютна бяспечным.
Вашы выдаткі і вынікі могуць адрознівацца.
© Карпарацыя Intel. Intel, лагатып Intel і іншыя знакі Intel з'яўляюцца гандлёвымі маркамі карпарацыі Intel або яе даччыных кампаній. Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Intel, лагатып Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune і Xeon з'яўляюцца гандлёвымі маркамі карпарацыі Intel у ЗША і/ці іншых краінах.
*Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Microsoft, Windows і лагатып Windows з'яўляюцца гандлёвымі маркамі або зарэгістраванымі гандлёвымі маркамі карпарацыі Microsoft у Злучаных Штатах і/ці іншых краінах.
Java з'яўляецца зарэгістраванай гандлёвай маркай Oracle і/або яе філіялаў.
OpenCL і лагатып OpenCL з'яўляюцца гандлёвымі маркамі Apple Inc., якія выкарыстоўваюцца з дазволу Khronos.

Тэхналогіі Intel могуць запатрабаваць актываванага абсталявання, праграмнага забеспячэння або актывацыі службы.
Ні адзін прадукт ці кампанент не можа быць абсалютна бяспечным.
Вашы выдаткі і вынікі могуць адрознівацца.
© Карпарацыя Intel. Intel, лагатып Intel і іншыя знакі Intel з'яўляюцца гандлёвымі маркамі карпарацыі Intel або яе даччыных кампаній. Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Intel, лагатып Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune і Xeon з'яўляюцца гандлёвымі маркамі карпарацыі Intel у ЗША і/ці іншых краінах.
*Іншыя назвы і брэнды могуць быць заяўлены як уласнасць іншых.
Microsoft, Windows і лагатып Windows з'яўляюцца гандлёвымі маркамі або зарэгістраванымі гандлёвымі маркамі карпарацыі Microsoft у Злучаных Штатах і/ці іншых краінах.
Java з'яўляецца зарэгістраванай гандлёвай маркай Oracle і/або яе філіялаў.
OpenCL і лагатып OpenCL з'яўляюцца гандлёвымі маркамі Apple Inc., якія выкарыстоўваюцца з дазволу Khronos.

Дакументы / Рэсурсы

Intel Пачатак працы з VTune Profiler [pdfКіраўніцтва карыстальніка
Пачніце з VTune Profiler, Пачніце, з VTune Profiler, VTune Profiler

Спасылкі

Пакінуць каментар

Ваш электронны адрас не будзе апублікаваны. Абавязковыя для запаўнення палі пазначаны *