intel-Get-Started-with-VTune-Profiler-логотип

intel Початок роботи з VTune Profiler

Почніть роботу з Intel® VTune™ Profiler

Використовуйте Intel VTune Profiler для аналізу локальних і віддалених цільових систем із хостів Windows*, macOS* і Linux*. Покращте продуктивність програми та системи за допомогою цих операцій:

  • Проаналізуйте вибір алгоритму.
  • Знайдіть вузькі місця послідовного та паралельного коду.
  • Зрозумійте, де і як ваша програма може отримати вигоду від доступних апаратних ресурсів.
  • Прискорити виконання вашої програми.
    Завантажте Intel VTune Profiler у вашій системі одним із таких способів:
  • Завантажте автономну версію.
  • Отримайте Intel VTune Profiler як частину базового набору інструментів Intel® oneAPI.
    Перегляньте VTune Profiler навчальна сторінка для відео, webinars та інші матеріали, які допоможуть вам почати роботу.

ПРИМІТКА
Документація для версій Intel® VTune™ Profiler до випуску 2021 року доступні лише для завантаження. Перелік доступних для завантаження документації за версіями продукту див. на цих сторінках:

  • Завантажити документацію для Intel Parallel Studio XE
  • Завантажте документацію для Intel System Studio

Зрозумійте робочий процес
Використовуйте Intel VTune Profiler до profile додаток і аналізувати результати для покращення продуктивності.

Загальний робочий процес містить такі кроки:

intel-Get-Started-with-VTune-Profiler-01

Щоб розпочати, виберіть свою хост-систему
Дізнайтеся більше про системні робочі процеси для Windows*, Linux* або macOS*.

intel-Get-Started-with-VTune-Profiler-02

Почніть роботу з Intel® VTune™ Profiler для ОС Windows*

Перш ніж почати

  1. Встановіть Intel® VTune™ Profiler у вашій системі Windows*.
  2. Створіть свою програму з інформацією про символи та в режимі випуску з усіма оптимізаціями. Щоб отримати докладну інформацію про налаштування компілятора, перегляньте VTune Profiler онлайновий посібник користувача.
    Ви також можете використовувати матрицю sampпрограма доступна в \VTune\Samples\matrix. Ви можете побачити відповідні sample призводить до \VTune\Projects\sample (матриця).
  3. Налаштуйте змінні середовища: запустіть \setvars.bat сценарій.
    За замовчуванням, для компонентів oneAPI — програма Files (x86)\Intel\oneAPI.
    ПРИМІТКА Під час використання Intel® VTune™ Pro вам не потрібно запускати setvars.batfiler у Microsoft* Visual Studio*.

Крок 1. Запустіть Intel® VTune™ Profiler
Запустіть Intel VTune Profiler одним із цих способів і створіть проект. Проект — це контейнер для програми, яку потрібно проаналізувати, типу аналізу та результатів збору даних.

Джерело / Запустіть VTune Profiler

Автономний (GUI)

  1. Виконайте команду vtune-gui або запустіть Intel® VTune™ Profiler з меню «Пуск».
  2. Коли відкриється графічний інтерфейс користувача, натисніть на екрані привітання.
  3. У діалоговому вікні «Створити проект» укажіть ім’я та розташування проекту.
  4. Натисніть Створити проект.

Автономний (командний рядок)
Виконайте команду vtune.

Microsoft* Visual Studio* IDE
Відкрийте своє рішення у Visual Studio. VTune ProfileПанель інструментів r автоматично вмикається, а ваш проект Visual Studio встановлюється як ціль аналізу.

ПРИМІТКА
Під час роботи Intel® VTune™ Pro вам не потрібно створювати проектfiler з командного рядка або в Microsoft* Visual Studio.

Крок 2: Налаштуйте та запустіть аналіз
Після створення нового проекту відкриється вікно Configure Analysis із такими значеннями за замовчуванням:

intel-Get-Started-with-VTune-Profiler-03

  1. У розділі «Запуск програми» знайдіть розташування виконуваного файлу програми file.
  2. Натисніть «Пуск», щоб запустити «Знімок продуктивності» програми. Цей аналіз представляє загальне надview проблем, що впливають на продуктивність вашої програми в цільовій системі.

Крок 3: View і Аналіз даних продуктивності
Після завершення збору даних VTune Profiler відображає результати аналізу у вікні підсумку. Ось ви бачите завершення виставиview вашої заявки.
Надview зазвичай включає кілька показників разом із їхніми описами.

intel-Get-Started-with-VTune-Profiler-04

  • A Розгорніть кожен показник, щоб отримати детальну інформацію про сприяючі фактори.
  • B Позначена метрика вказує на значення поза прийнятним/нормальним робочим діапазоном. Скористайтеся підказками, щоб зрозуміти, як покращити позначений показник.
  • C Перегляньте вказівки щодо інших аналізів, які слід виконати наступним. Дерево аналізу висвітлює ці рекомендації.

Наступні кроки
Знімок продуктивності є хорошою відправною точкою для отримання загальної оцінки продуктивності програми за допомогою VTune Profiler. Далі перевірте, чи вимагає налаштування ваш алгоритм.

  1. Дотримуйтеся посібника, щоб проаналізувати типові вузькі місця продуктивності.
  2. Після того, як ваш алгоритм буде добре налаштований, знову запустіть «Знімок продуктивності», щоб відкалібрувати результати та визначити потенційні покращення продуктивності в інших областях.

Дивіться також
Дослідження мікроархітектури

VTune Profiler Довідковий тур

Exampле: Profile Програма OpenMP* для Windows*
Використовуйте Intel VTune Profiler на комп’ютері з ОС Windows для професійногоfile якample iso3dfd_omp_offload Програма OpenMP, завантажена на графічний процесор Intel. Дізнайтеся, як запустити аналіз GPU та перевірити результати.

передумови

  • Переконайтеся, що ваша система працює під керуванням Microsoft* Windows 10 або новішої версії.
  • Використовуйте одну з цих версій Intel Processor Graphics:
    • Gen 8
    • Gen 9
    • Gen 11
  • Ваша система має працювати на одному з цих процесорів Intel:
    • Процесори Intel® Core™ i7 7-го покоління (кодова назва Kaby Lake)
    • Процесори Intel® Core™ i8 7-го покоління (кодова назва Coffee Lake)
    • Процесори Intel® Core™ i10 7-го покоління (кодова назва Ice Lake)
  • Встановіть Intel VTune Profiler з одного з цих джерел:
    • Завантаження автономного продукту
    • Базовий інструментарій Intel® oneAPI
    • Intel® System Bring-up Toolkit
  • Завантажте Intel® oneAPI HPC Toolkit, який містить компілятор Intel® oneAPI DPC++/C++ (icx/icpx), необхідний дляfile Програми OpenMP.
  • Налаштуйте змінні середовища. Виконайте сценарій vars.bat, розташований у \env каталог.
  • Налаштуйте свою систему для аналізу GPU.

ПРИМІТКА
Щоб встановити Intel VTune Profiler у середовищі Microsoft* Visual Studio див. VTune Profiler Посібник користувача.

Створіть і скомпілюйте OpenMP Offload Application

  1. Завантажте iso3dfd_omp_offload OpenMP Offload sample.
  2. Відкрито до сampкаталог le.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. Скомпілюйте програму OpenMP Offload.

збірка mkdir
cd збірка
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

Запустіть аналіз графічного процесора в додатку OpenMP Offload
Тепер ви готові запустити аналіз розвантажень графічного процесора у програмі OpenMP, яку ви зібрали.

  1. Відкрийте VTune Profiler і натисніть «Новий проект», щоб створити проект.
  2. На сторінці привітання натисніть «Налаштувати аналіз», щоб налаштувати аналіз.
  3. Виберіть ці налаштування для аналізу.
    • На панелі WHERE виберіть Local Host.
    • На панелі «ЩО» виберіть «Запустити програму» та вкажіть двійковий файл iso3dfd_omp_offload як програму для проfile.
    • На панелі «ЯК» виберіть тип аналізу розвантаження GPU з групи «Прискорювачі» в дереві аналізу.
      intel-Get-Started-with-VTune-Profiler-05
  4. Натисніть кнопку Пуск, щоб запустити аналіз.

VTune Profiler збирає дані та відображає результати аналізу в GPU Offload viewточка.

  • У вікні «Підсумок» перегляньте статистику використання ресурсів ЦП і ГП. Використовуйте ці дані, щоб визначити, чи є ваша програма:
    • прив’язаний до GPU
    • ЦП прив’язаний
    • Неефективне використання обчислювальних ресурсів вашої системи
  • Використовуйте інформацію у вікні платформи, щоб переглянути основні показники CPU та GPU.
  • Досліджуйте конкретні обчислювальні завдання у графічному вікні.

Для глибшого аналізу перегляньте відповідний рецепт у VTune Profiler Посібник з аналізу продуктивності. Ви також можете продовжити профілювання за допомогою аналізу GPU Compute/Media Hotspots.

Example: Profile Програма SYCL* у Windows*
Profile якample matrix_multiply SYCL додаток з Intel® VTune™ Profiler. Ознайомтеся з продуктом і зрозумійте статистику, зібрану для додатків, пов’язаних із GPU.

передумови

  • Переконайтеся, що у вашій системі встановлено Microsoft* Visual Studio (версія 2017 або новіша).
  • Встановіть Intel VTune Profiler із базового набору інструментів Intel® oneAPI або набору інструментів Intel® System Bring-up. Ці набори інструментів містять компілятор Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl), необхідний для процесу профілювання.
  • Налаштуйте змінні середовища. Виконайте сценарій vars.bat, розташований у \env каталог.
  • Переконайтеся, що компілятор Intel oneAPI DPC++ (інстальований за допомогою набору інструментів Intel oneAPI Base) інтегровано в Microsoft Visual Studio.
  • Скомпілюйте код за допомогою параметрів -gline-tables-only і -fdebug-info-for-profiling для компілятора Intel oneAPI DPC++.
  • Налаштуйте свою систему для аналізу GPU.

Для отримання інформації щодо встановлення Intel VTune Profiler у середовищі Microsoft* Visual Studio див. VTune Profiler Посібник користувача.

Створіть додаток Matrix
Завантажте код matrix_multiply_vtune sampпакет файлів для наборів інструментів Intel oneAPI. Це містить sampфайл, який можна використовувати для створення та проfile додаток SYCL.

  1. Відкрийте Microsoft* Visual Studio.
  2. Натисніть File > Відкрити > Проект/Рішення. Знайдіть папку matrix_multiply_vtune і виберіть matrix_multiply.sln.
  3. Створіть цю конфігурацію (Проект > Збірка).
  4. Запустіть програму (Debug > Start Without Debugging).
  5. Щоб вибрати DPC++ або потокову версію sample, використовуйте визначення препроцесора.
    1. Перейдіть до Властивості проекту > DPC++ > Препроцесор > Визначення препроцесора.
    2. Визначте icpx -fsycl або USE_THR.

Запустіть аналіз GPU
Виконайте аналіз GPU на Matrix sample.

  1. На панелі інструментів Visual Studio натисніть кнопку «Налаштувати аналіз».
    Відкриється вікно Configure Analysis. За замовчуванням він успадковує ваші налаштування проекту VS і вказує matrix_multiply.exe як програму для проfile.
  2. У вікні «Налаштувати аналіз» клацніть значокintel-Get-Started-with-VTune-Profiler-06 Кнопка «Огляд» на панелі «ЯК».
  3. Виберіть тип аналізу GPU Compute/Media Hotspots у групі Accelerators у дереві аналізу.
    intel-Get-Started-with-VTune-Profiler-06
  4. Натисніть кнопку «Пуск», щоб запустити аналіз із попередньо визначеними параметрами.

Запустіть аналіз GPU з командного рядка:

  1. Відкрийте sampкаталог файлів:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. У цьому каталозі відкрийте проект Visual Studio* file під назвою matrix_multiply.sln
  3. Multiply.cpp file містить кілька варіантів множення матриць. Виберіть версію, відредагувавши відповідний рядок #define MULTIPLY у multiply.hpp
  4. Створіть весь проект із конфігурацією Release.
    Це генерує виконуваний файл під назвою matrix_multiply.exe.
  5. Підготуйте систему до виконання аналізу GPU. Див. Налаштування системи для аналізу GPU.
  6. Встановіть VTune Profiler змінних середовища, запустивши пакет file: експорт \env\vars.bat
  7. Виконайте команду аналізу:
    vtune.exe -collect gpu-offload — matrix_multiply.exe

VTune Profiler збирає дані та відображає результати аналізу в GPU Compute/Media Hotspots viewточка. У вікні «Підсумок» перегляньте статистику використання ресурсів центрального та графічного процесорів, щоб зрозуміти, чи ваша програма пов’язана з графічним процесором. Перейдіть у вікно «Графіка», щоб побачити основні показники ЦП і ГП, що представляють виконання коду з часом.

Почніть роботу з Intel® VTune™ Profiler для ОС Linux*

Перш ніж почати

  1. Встановіть Intel® VTune™ Profiler у вашій системі Linux*.
  2. Створіть свою програму з інформацією про символи та в режимі випуску з усіма оптимізаціями. Щоб отримати докладну інформацію про налаштування компілятора, перегляньте VTune Profiler онлайновий посібник користувача.
    Ви також можете використовувати матрицю sampпрограма доступна в \sample\matrix. Ви можете побачити sample призводить до \sample (матриця).
  3. Налаштуйте змінні середовища: джерело /setvars.sh
    За замовчуванням, це:
    • $HOME/intel/oneapi/ під час встановлення з правами користувача;
    • /opt/intel/oneapi/ під час встановлення з правами root.

Крок 1. Запустіть VTune Profiler
Запустіть VTune Profiler одним із таких способів:

Джерело / Запустіть VTune Profiler
Автономний/IDE (GUI)

  1. Виконайте команду vtunegui. Щоб запустити VTune Profiler у IDE Intel System Studio виберіть Інструменти > VTune Profiler > Запустіть VTune Profiler. Це встановлює всі відповідні змінні середовища та запускає автономний інтерфейс продукту.
  2. Коли відкриється GUI, натисніть НОВИЙ ПРОЕКТ на екрані привітання.
  3. У діалоговому вікні «Створити проект» укажіть ім’я та розташування проекту.
  4. Натисніть Створити проект.

Автономний (командний рядок)

  • Виконайте команду vtune.

Крок 2: Налаштуйте та запустіть аналіз
Після створення нового проекту відкриється вікно Configure Analysis із такими значеннями за замовчуванням:

intel-Get-Started-with-VTune-Profiler-07

  1. У розділі «Запустити програму» перейдіть до розташування вашої програми.
  2. Натисніть «Пуск», щоб запустити знімок продуктивності вашої програми. Цей аналіз представляє загальне надview проблем, що впливають на продуктивність вашої програми в цільовій системі.

Крок 3: View і Аналіз даних продуктивності
Після завершення збору даних VTune Profiler відображає результати аналізу у вікні підсумку. Ось ви бачите завершення виставиview вашої заявки.
Надview зазвичай включає кілька показників разом із їхніми описами.

intel-Get-Started-with-VTune-Profiler-08

  • A Розгорніть кожен показник, щоб отримати детальну інформацію про сприяючі фактори.
  • B Позначена метрика вказує на значення поза прийнятним/нормальним робочим діапазоном. Скористайтеся підказками, щоб зрозуміти, як покращити позначений показник.
  • C Перегляньте вказівки щодо інших аналізів, які слід виконати наступним. Дерево аналізу висвітлює ці рекомендації.

Наступні кроки
Знімок продуктивності є хорошою відправною точкою для отримання загальної оцінки продуктивності програми за допомогою VTune Profiler. Далі перевірте, чи вимагає налаштування ваш алгоритм.

  1. Дотримуйтеся посібника, щоб проаналізувати типові вузькі місця продуктивності.
  2. Після того, як ваш алгоритм буде добре налаштований, знову запустіть «Знімок продуктивності», щоб відкалібрувати результати та визначити потенційні покращення продуктивності в інших областях.

Дивіться також
Дослідження мікроархітектури

VTune Profiler Довідковий тур

Example: Profile Програма OpenMP на Linux*
Використовуйте Intel VTune Profiler на комп’ютері Linux до profile якample iso3dfd_omp_offload Програма OpenMP, завантажена на графічний процесор Intel. Дізнайтеся, як запустити аналіз GPU та перевірити результати.

передумови

  • Переконайтеся, що ваша система працює під керуванням ядра ОС Linux* 4.14 або новішої версії.
  • Використовуйте одну з цих версій Intel Processor Graphics:
    • Gen 8
    • Gen 9
    • Gen 11
  • Ваша система має працювати на одному з цих процесорів Intel:
    • Процесори Intel® Core™ i7 7-го покоління (кодова назва Kaby Lake)
    • Процесори Intel® Core™ i8 7-го покоління (кодова назва Coffee Lake)
    • Процесори Intel® Core™ i10 7-го покоління (кодова назва Ice Lake)
  • Для графічного інтерфейсу Linux використовуйте:
    • GTK+ версії 2.10 або новішої (рекомендуються версії 2.18 і новіші)
    • Pango версії 1.14 або новішої
    • X.Org версії 1.0 або новішої (рекомендуються версії 1.7 і новіші)
  • Встановіть Intel VTune Profiler з одного з цих джерел:
    • Завантаження автономного продукту
    • Базовий інструментарій Intel® oneAPI
    • Intel® System Bring-up Toolkit
  • Завантажте Intel® oneAPI HPC Toolkit, який містить компілятор Intel® oneAPI DPC++/C++ (icx/icpx), необхідний дляfile Програми OpenMP.
  • Налаштуйте змінні середовища. Виконайте сценарій vars.sh.
  • Налаштуйте свою систему для аналізу GPU.

Створіть і скомпілюйте OpenMP Offload Application

  1. Завантажте iso3dfd_omp_offload OpenMP Offload sample.
  2. Відкрито до сampкаталог le.
    cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. Скомпілюйте програму OpenMP Offload.

збірка mkdir;
cmake -DVERIFY_RESULTS=0 ..
зробити -j

Це генерує виконуваний файл src/iso3dfd.

Щоб видалити програму, введіть:
зробити чистим

Це видаляє виконуваний файл і об’єкт files, які ви створили за допомогою команди make.

Запустіть аналіз графічного процесора в додатку OpenMP Offload
Тепер ви готові запустити аналіз розвантажень графічного процесора у програмі OpenMP, яку ви зібрали.

  1. Відкрийте VTune Profiler і натисніть «Новий проект», щоб створити проект.
  2. На сторінці привітання натисніть «Налаштувати аналіз», щоб налаштувати аналіз.
  3. Виберіть ці налаштування для аналізу.
    • На панелі WHERE виберіть Local Host.
    • На панелі «ЩО» виберіть «Запустити програму» та вкажіть двійковий файл iso3dfd_omp_offload як програму для проfile.
    • На панелі «ЯК» виберіть тип аналізу розвантаження GPU з групи «Прискорювачі» в дереві аналізу.
      intel-Get-Started-with-VTune-Profiler-09
  4. Натисніть кнопку Пуск, щоб запустити аналіз.

VTune Profiler збирає дані та відображає результати аналізу в GPU Offload viewточка.

  • У вікні «Підсумок» перегляньте статистику використання ресурсів ЦП і ГП. Використовуйте ці дані, щоб визначити, чи є ваша програма:
    • прив’язаний до GPU
    • ЦП прив’язаний
    • Неефективне використання обчислювальних ресурсів вашої системи
  • Використовуйте інформацію у вікні платформи, щоб переглянути основні показники CPU та GPU.
  • Досліджуйте конкретні обчислювальні завдання у графічному вікні.

Для глибшого аналізу перегляньте відповідний рецепт у VTune Profiler Посібник з аналізу продуктивності. Ви також можете продовжити профілювання за допомогою аналізу GPU Compute/Media Hotspots.

Example: Profile Програма SYCL* на Linux*
Використовуйте VTune Profiler з asample matrix_multiply додаток SYCL, щоб швидко ознайомитися з продуктом і статистикою, зібраною для програм, пов’язаних із GPU.

передумови

  • Встановіть VTune Profiler і компілятор Intel® oneAPI DPC++/C++ із базового набору інструментів Intel® oneAPI або набору інструментів Intel® System Bring-up.
  • Налаштуйте змінні середовища, виконавши сценарій vars.sh.
  • Налаштуйте свою систему для аналізу GPU.

Створіть додаток Matrix
Завантажте код matrix_multiply_vtune sampпакет файлів для наборів інструментів Intel oneAPI. Це містить sampфайл, який можна використовувати для створення та проfile додаток SYCL.

Для проfile програму SYCL, обов’язково скомпілюйте код за допомогою параметрів -gline-tables-only і -fdebug-info-for-profiling компілятора Intel oneAPI DPC++.

Щоб скласти цей sampфайл програми, виконайте такі дії:

  1. Перейти до сampкаталог le.
    cd <sample_dir/VtuneProfiler/matrix_multiply>
  2. Multiply.cpp file в папці src міститься кілька варіантів множення матриць. Виберіть версію, відредагувавши відповідний рядок #define MULTIPLY у multiply.h.
  3. Створіть програму за допомогою наявного Makefile:
    cmake .
    зробити
    Це має створити виконуваний файл matrix.icpx -fsycl.
    Щоб видалити програму, введіть:
    зробити чистим
    Це видаляє виконуваний файл і об’єкт fileякі були створені командою make.

Запустіть аналіз GPU
Виконайте аналіз GPU на Matrix sample.

  1. Запустіть VTune Profiler за допомогою команди vtune-gui.
  2. Натисніть Новий проект на сторінці привітання.
  3. Укажіть ім’я та місцезнаходження для вашого sampфайл проекту та натисніть «Створити проект».
  4. На панелі WHAT перейдіть до matrix.icpx-fsycl file.
  5. На панелі ЯК натисніть значок intel-Get-Started-with-VTune-Profiler-06 Кнопка «Огляд» і виберіть аналіз GPU Compute/Media Hotspots із групи «Прискорювачі» в дереві аналізу.
    intel-Get-Started-with-VTune-Profiler-10
  6. Натисніть кнопку «Пуск» внизу, щоб запустити аналіз із попередньо вибраними параметрами.

Запустіть аналіз GPU з командного рядка:

  1. Підготуйте систему до виконання аналізу GPU. Див. Налаштування системи для аналізу GPU.
  2. Налаштуйте змінні середовища для програмних засобів Intel:
    джерело $ONEAPI_ROOT/setvars.sh
  3. Запустіть аналіз GPU Compute/Media Hotspots:
    vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    Щоб переглянути підсумковий звіт, введіть:
    vtune -report summary -r ./result_gpu-hotspots

VTune Profiler збирає дані та відображає результати аналізу в GPU Compute/Media Hotspots viewточка. У вікні «Підсумок» перегляньте статистику використання ресурсів центрального та графічного процесорів, щоб зрозуміти, чи ваша програма пов’язана з графічним процесором. Перейдіть у вікно «Графіка», щоб побачити основні показники ЦП і ГП, що представляють виконання коду з часом.

Почніть роботу з Intel® VTune™ Profiler для macOS*

Використовуйте VTune Profiler у системі macOS для виконання віддаленого цільового аналізу в системі, що не підтримує macOS (тільки для Linux* або Android*).

Ви не можете використовувати VTune Profiler у середовищі macOS для цих цілей:

  • Profile систему macOS, у якій він встановлений.
  • Збирайте дані на віддаленій системі macOS.

Щоб проаналізувати продуктивність віддаленого об’єкта Linux* або Android* на хості macOS, виконайте одну з таких дій:

  • Запустіть VTune Profiler аналіз у системі macOS із віддаленою системою, указаною як цільова. Коли почнеться аналіз, VTune Profiler підключається до віддаленої системи для збору даних, а потім повертає результати на хост macOS viewінж.
  • Запустіть локальний аналіз цільової системи та скопіюйте результати в систему macOS для viewу VTune Profiler.

Кроки в цьому документі передбачають віддалену цільову систему Linux і збір даних про продуктивність за допомогою SSH-доступу з VTune Profiler на хост-системі macOS.

Перш ніж почати

  1. Встановіть Intel® VTune™ Profiler у вашій системі macOS*.
  2. Створіть свою програму Linux із інформацією про символи та в режимі випуску з усіма оптимізаціями. Для отримання детальної інформації перегляньте параметри компілятора у VTune Profiler допомога.
  3. Налаштуйте доступ SSH від головної системи macOS до цільової системи Linux для роботи в режимі без пароля.

Крок 1. Запустіть VTune Profiler

  1. Запустіть VTune Profiler за допомогою команди vtune-gui.
    За замовчуванням, це /opt/intel/oneapi/.
  2. Коли відкриється GUI, натисніть НОВИЙ ПРОЕКТ на екрані привітання.
  3. У діалоговому вікні «Створити проект» укажіть ім’я та розташування проекту.
  4. Натисніть Створити проект.

Крок 2: Налаштуйте та запустіть аналіз
Після створення нового проекту відкриється вікно Configure Analysis із типом аналізу Performance Snapshot.
Цей аналіз являє собою надview проблем, які впливають на продуктивність вашої програми в цільовій системі.

intel-Get-Started-with-VTune-Profiler-11

  1. На панелі WHERE виберіть Remote Linux (SSH) і вкажіть цільову систему Linux за допомогою username@ hostname[:port].
    VTune Profiler підключається до системи Linux і встановлює цільовий пакет.
  2. На панелі ЩО вкажіть шлях до вашої програми в цільовій системі Linux.
  3. Натисніть кнопку «Пуск», щоб запустити «Знімок продуктивності» програми.

Крок 3: View і Аналіз даних продуктивності
Після завершення збору даних VTune Profiler відображає результати аналізу в системі macOS. Розпочніть аналіз у вікні «Підсумок». Ось ви бачите завершення виставиview вашої заявки.

Надview зазвичай включає кілька показників разом із їхніми описами.

intel-Get-Started-with-VTune-Profiler-12

  • A Розгорніть кожен показник, щоб отримати детальну інформацію про сприяючі фактори.
  • B Позначена метрика вказує на значення поза прийнятним/нормальним робочим діапазоном. Скористайтеся підказками, щоб зрозуміти, як покращити позначений показник.
  • C Перегляньте вказівки щодо інших аналізів, які слід виконати наступним. Дерево аналізу висвітлює ці рекомендації.

Наступні кроки
Знімок продуктивності є хорошою відправною точкою для отримання загальної оцінки продуктивності програми за допомогою VTune Profiler.
Далі перевірте, чи вимагає налаштування ваш алгоритм.

  1. Запустіть аналіз гарячих точок у своїй програмі.
  2. Дотримуйтесь посібника Hotspots. Дізнайтеся про методи, щоб отримати максимальну віддачу від аналізу Hotspots.
  3. Після того, як ваш алгоритм буде добре налаштований, знову запустіть «Знімок продуктивності», щоб відкалібрувати результати та визначити потенційні покращення продуктивності в інших областях.

Дивіться також
Дослідження мікроархітектури

VTune Profiler Довідковий тур

Дізнайтеся більше
Документ / Опис

  • Посібник користувача
    Посібник користувача є основною документацією для VTune Profiler.
    ПРИМІТКА
    Ви також можете завантажити офлайн-версію VTune Profiler документація.
  • Онлайн навчання
    Навчальний онлайн-сайт — чудовий ресурс для вивчення основ VTune Profiler із посібниками з початку роботи, відео, підручниками, webінари, технічні статті.
  • Кулінарна книга
    Кулінарна книга з аналізу продуктивності, яка містить рецепти для виявлення та вирішення популярних проблем продуктивності за допомогою типів аналізу у VTune Profiler.
  • Посібник зі встановлення для Windows | Linux | хости macOS
    Посібник із встановлення містить основні інструкції зі встановлення VTune Profiler та інструкції з конфігурації після встановлення для різних драйверів і збирачів.
  • Підручники
    VTune ProfileПідручники r допоможуть новому користувачеві ознайомитися з основними функціями за допомогою коротких sampдодаток.
  • Примітки до випуску
    Знайдіть інформацію про останню версію VTune Profiler, включаючи вичерпний опис нових функцій, системних вимог і технічних проблем, які було вирішено.
    Для автономної версії та версії інструментарію VTune Profiler, зрозуміти поточні системні вимоги.

Повідомлення та застереження
Технології Intel можуть вимагати активації апаратного, програмного забезпечення або послуги.
Жоден продукт чи компонент не може бути абсолютно безпечним.
Ваші витрати та результати можуть відрізнятися.
© Корпорація Intel. Intel, логотип Intel та інші знаки Intel є товарними знаками корпорації Intel або її дочірніх компаній. Інші назви та бренди можуть бути визнані власністю інших.
Intel, логотип Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune і Xeon є товарними знаками корпорації Intel у США та/або інших країнах.
*Інші назви та бренди можуть бути власністю інших осіб.
Microsoft, Windows і логотип Windows є товарними знаками або зареєстрованими товарними знаками Microsoft Corporation у США та/або інших країнах.
Java є зареєстрованою торговою маркою Oracle та / або її афілійованих осіб.
OpenCL і логотип OpenCL є товарними знаками Apple Inc., які використовуються з дозволу Khronos.

Технології Intel можуть вимагати активації апаратного, програмного забезпечення або послуги.
Жоден продукт чи компонент не може бути абсолютно безпечним.
Ваші витрати та результати можуть відрізнятися.
© Корпорація Intel. Intel, логотип Intel та інші знаки Intel є товарними знаками корпорації Intel або її дочірніх компаній. Інші назви та бренди можуть бути визнані власністю інших.
Intel, логотип Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune і Xeon є товарними знаками корпорації Intel у США та/або інших країнах.
*Інші назви та бренди можуть бути власністю інших осіб.
Microsoft, Windows і логотип Windows є товарними знаками або зареєстрованими товарними знаками Microsoft Corporation у США та/або інших країнах.
Java є зареєстрованою торговою маркою Oracle та / або її афілійованих осіб.
OpenCL і логотип OpenCL є товарними знаками Apple Inc., які використовуються з дозволу Khronos.

Документи / Ресурси

intel Початок роботи з VTune Profiler [pdfПосібник користувача
Почніть роботу з VTune Profiler, Початок роботи, з VTune Profiler, VTune Profiler

Список літератури

Залиште коментар

Ваша електронна адреса не буде опублікована. Обов'язкові поля позначені *