intel התחל עם VTune Profiler
התחל עם Intel® VTune™ Profiler
השתמש ב-Intel VTune Profiler לנתח מערכות יעד מקומיות ומרוחקות ממארחי Windows*, macOS* ו-Linux*. שפר את ביצועי היישום והמערכת באמצעות פעולות אלה:
- ניתוח בחירות אלגוריתמים.
- מצא צווארי בקבוק בקוד סדרתי ומקביל.
- הבן היכן וכיצד היישום שלך יכול להפיק תועלת ממשאבי חומרה זמינים.
- האיץ את ביצוע היישום שלך.
הורד את Intel VTune Profiler במערכת שלך באחת מהדרכים הבאות: - הורד את הגרסה העצמאית.
- קבל את Intel VTune Profiler כחלק מ-Intel® oneAPI Base Toolkit.
ראה את ה-VTune Profileדף הדרכה לסרטונים, webמידע נוסף וחומר נוסף שיעזור לך להתחיל.
פֶּתֶק
תיעוד עבור גרסאות של Intel® VTune™ Profiler לפני מהדורת 2021 זמינים להורדה בלבד. לרשימה של הורדות תיעוד זמינות לפי גרסת מוצר, ראה דפים אלה:
- הורד תיעוד עבור Intel Parallel Studio XE
- הורד תיעוד עבור Intel System Studio
הבן את זרימת העבודה
השתמש ב-Intel VTune Profiler למקצועןfile יישום וניתוח תוצאות לשיפורי ביצועים.
זרימת העבודה הכללית מכילה את השלבים הבאים:
בחר את המערכת המארח שלך כדי להתחיל
למידע נוסף על זרימות עבודה ספציפיות למערכת עבור Windows*, Linux* או macOS*.
התחל עם Intel® VTune™ Profiler עבור מערכת ההפעלה Windows*
לפני שאתה מתחיל
- התקן את Intel® VTune™ Profiler במערכת Windows* שלך.
- בנה את האפליקציה שלך עם מידע על סמלים ובמצב שחרור עם כל האופטימיזציות מופעלות. למידע מפורט על הגדרות מהדר, עיין ב-VTune Profiler מדריך למשתמש מקוון.
אתה יכול גם להשתמש במטריצה sampהאפליקציה זמינה ב \VTune\Samples\מטריקס. אתה יכול לראות ס' מקבילampהתוצאות \VTune\Projects\sample (מטריקס). - הגדר את משתני הסביבה: הפעל את סקריפט \setvars.bat.
כברירת מחדל, ה עבור רכיבי oneAPI הוא Program Files (x86)\Intel\oneAPI.
פֶּתֶק אינך צריך להפעיל setvars.bat בעת שימוש ב-Intel® VTune™ Profiler בתוך Microsoft* Visual Studio*.
שלב 1: הפעל את Intel® VTune™ Profiler
הפעל את Intel VTune Profileעיין באחת מהדרכים הללו והקים פרויקט. פרויקט הוא מיכל עבור האפליקציה שברצונך לנתח, סוג הניתוח ותוצאות איסוף הנתונים.
מקור / הפעל את VTune Profiler
עצמאי (GUI)
- הפעל את פקודת vtune-gui או הפעל את Intel® VTune™ Profiler מתפריט התחל.
- כאשר ה-GUI נפתח, לחץ על מסך הפתיחה.
- בתיבת הדו-שיח יצירת פרויקט, ציין את שם הפרויקט והמיקום.
- לחץ על צור פרויקט.
עצמאי (שורת פקודה)
הפעל את פקודת vtune.
Microsoft* Visual Studio* IDE
פתח את הפתרון שלך ב-Visual Studio. ה-VTune Profileסרגל הכלים r מופעל אוטומטית ופרויקט Visual Studio שלך מוגדר כיעד ניתוח.
פֶּתֶק
אינך צריך ליצור פרויקט בעת הפעלת Intel® VTune™ Profiler משורת הפקודה או בתוך Microsoft* Visual Studio.
שלב 2: הגדר והפעל ניתוח
לאחר יצירת פרויקט חדש, חלון הגדר ניתוח נפתח עם ערכי ברירת המחדל הבאים:
- במקטע הפעל יישום, דפדף אל המיקום של קובץ ההפעלה של היישום שלך file.
- לחץ על התחל כדי להפעיל ביצועים Snapshot ביישום שלך. ניתוח זה מציג סיכום כלליview של בעיות המשפיעות על ביצועי היישום שלך במערכת היעד.
שלב 3: View וניתוח נתוני ביצועים
לאחר סיום איסוף הנתונים, VTune Profiler מציג תוצאות ניתוח בחלון הסיכום. הנה, אתה רואה הופעה הסתיימהview של בקשתך.
הסוףview בדרך כלל כולל מספר מדדים יחד עם התיאורים שלהם.
- A הרחב כל מדד לקבלת מידע מפורט על גורמים תורמים.
- B מדד מסומן מציין ערך מחוץ לטווח הפעולה המקובל/נורמלי. השתמש בטיפים לכלים כדי להבין כיצד לשפר מדד מסומן.
- C ראה הנחיות לגבי ניתוחים אחרים שכדאי לך לשקול להפעיל בהמשך. עץ הניתוח מדגיש המלצות אלו.
השלבים הבאים
Snapshot של ביצועים היא נקודת התחלה טובה לקבל הערכה כוללת של ביצועי האפליקציה עם VTune Profileר. לאחר מכן, בדוק אם האלגוריתם שלך דורש כוונון.
- עקוב אחר הדרכה כדי לנתח צווארי בקבוק נפוצים בביצועים.
- לאחר שהאלגוריתם שלך מכוון היטב, הפעל שוב תצלום ביצועים כדי לכייל תוצאות ולזהות שיפורים פוטנציאליים בביצועים בתחומים אחרים.
ראה גם
חקר מיקרו-ארכיטקטורה
VTune Profiler סיור עזרה
Exampעל: מִקצוֹעָןfile יישום OpenMP* ב-Windows*
השתמש ב-Intel VTune Profiler במחשב Windows to profile כְּמוֹample iso3dfd_omp_offload אפליקציית OpenMP הורחקה ל-Intel GPU. למד כיצד להפעיל ניתוח GPU ולבחון תוצאות.
דרישות מוקדמות
- ודא שהמערכת שלך מפעילה את Microsoft* Windows 10 או גרסה חדשה יותר.
- השתמש באחת מהגרסאות הבאות של Intel Processor Graphics:
- דור 8
- דור 9
- דור 11
- המערכת שלך אמורה לפעול על אחד ממעבדי אינטל הבאים:
- דור 7 מעבדי Intel® Core™ i7 (שם קוד Kaby Lake)
- דור 8 מעבדי Intel® Core™ i7 (שם קוד Coffee Lake)
- דור 10 של מעבדי Intel® Core™ i7 (שם קוד Ice Lake)
- התקן את Intel VTune Profiler מאחד המקורות הבאים:
- הורדת מוצר עצמאי
- אינטל® oneAPI Base Toolkit
- ערכת הכלים של Intel® System Bring-up
- הורד את Intel® oneAPI HPC Toolkit המכילה את Intel® oneAPI DPC++/C++ מהדר (icx/icpx) שאתה צריך למקצועןfile יישומי OpenMP.
- הגדר משתני סביבה. בצע את הסקריפט vars.bat שנמצא ב- ספריית \env.
- הגדר את המערכת שלך לניתוח GPU.
פֶּתֶק
להתקנת Intel VTune Profileבסביבת Microsoft* Visual Studio, עיין ב-VTune Profiler מדריך למשתמש.
בנה והידור של אפליקציית OpenMP Offload
- הורד את s iso3dfd_omp_offload OpenMP Offloadample.
- פתוח ל-sampהמדריך.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - הידור את אפליקציית OpenMP Offload.
mkdir לבנות
בניית תקליטור
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
הפעל ניתוח GPU ביישום OpenMP Offload
כעת אתה מוכן להפעיל את ניתוח ה-GPU Offload ביישום OpenMP שהידור.
- פתח את VTune Profiler ולחץ על פרויקט חדש כדי ליצור פרויקט.
- בדף הפתיחה, לחץ על הגדר ניתוח כדי להגדיר את הניתוח שלך.
- בחר בהגדרות אלה עבור הניתוח שלך.
- בחלונית WHERE, בחר מארח מקומי.
- בחלונית WHAT, בחר הפעל יישום וציין את הקובץ הבינארי iso3dfd_omp_offload כיישום ל-profile.
- בחלונית HOW, בחר את סוג הניתוח של GPU Offload מקבוצת Accelerators בעץ הניתוח.
- לחץ על כפתור התחל כדי להפעיל את הניתוח.
VTune Profiler אוסף נתונים ומציג תוצאות ניתוח ב-GPU Offload viewנְקוּדָה.
- בחלון הסיכום, ראה נתונים סטטיסטיים על שימוש במשאבי מעבד ו-GPU. השתמש בנתונים אלה כדי לקבוע אם היישום שלך הוא:
- קשור ל-GPU
- קשור למעבד
- ניצול משאבי המחשוב של המערכת שלך בצורה לא יעילה
- השתמש במידע בחלון הפלטפורמה כדי לראות מדדי CPU ו-GPU בסיסיים.
- חקור משימות מחשוב ספציפיות בחלון הגרפיקה.
לניתוח מעמיק יותר, ראה מתכון קשור ב-VTune Profiler ספר בישול לניתוח ביצועים. אתה יכול גם להמשיך את הפרופיל שלך עם ניתוח GPU Compute/Media Hotspots.
Example: פרוfile יישום SYCL* ב-Windows*
מִקצוֹעָןfile כְּמוֹample matrix_multiply יישום SYCL עם Intel® VTune™ Profileר. הכר את המוצר והבין את הנתונים הסטטיסטיים שנאספו עבור יישומים הקשורים ל-GPU.
דרישות מוקדמות
- ודא שיש לך Microsoft* Visual Studio (v2017 ואילך) מותקן במערכת שלך.
- התקן את Intel VTune Profiler מ-Intel® oneAPI Base Toolkit או מ-Intel® System Bring-up Toolkit. ערכות כלים אלה מכילות את המהדר Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) הנדרש לתהליך יצירת הפרופילים.
- הגדר משתני סביבה. בצע את הסקריפט vars.bat שנמצא ב- ספריית \env.
- ודא שמהדר Intel oneAPI DPC++ (מותקן עם ערכת הכלים Intel oneAPI Base) משולב ב-Microsoft Visual Studio.
- הרכיב את הקוד באמצעות אפשרויות -gline-tables-only ו-fdebug-info-for-profiling עבור מהדר Intel oneAPI DPC++.
- הגדר את המערכת שלך לניתוח GPU.
למידע על התקנת Intel VTune Profileבסביבת Microsoft* Visual Studio, ראה VTune Profiler מדריך למשתמש.
בנה את אפליקציית Matrix
הורד את קוד matrix_multiply_vtune sampחבילה עבור ערכות כלים של Intel oneAPI. זה מכיל את ה-sample שבו אתה יכול להשתמש כדי לבנות ולפרוfile יישום SYCL.
- פתח את Microsoft* Visual Studio.
- נְקִישָׁה File > פתח > פרויקט/פתרון. מצא את התיקיה matrix_multiply_vtune ובחר matrix_multiply.sln.
- בנו את התצורה הזו (פרויקט > בנייה).
- הפעל את התוכנית (Debug > Start Without Debugging).
- כדי לבחור גרסה DPC++ או מושחלת של ה-sample, השתמש בהגדרות קדם-מעבד.
- עבור אל מאפייני פרויקט > DPC++ > Preprocessor > Preprocessor Definition.
- הגדר את icpx -fsycl או USE_THR.
הפעל ניתוח GPU
הפעל ניתוח GPU על ה-Matrix sample.
- מסרגל הכלים של Visual Studio, לחץ על כפתור הגדר ניתוח.
החלון הגדרת ניתוח נפתח. כברירת מחדל, הוא יורש את הגדרות פרויקט VS שלך ומציין את matrix_multiply.exe כיישום ל-profile. - בחלון הגדרת ניתוח, לחץ על
לחצן עיון בחלונית HOW.
- בחר את סוג הניתוח GPU Compute/Media Hotspots מקבוצת ה-Accelerators בעץ הניתוח.
- לחץ על כפתור התחל כדי להפעיל את הניתוח עם האפשרויות המוגדרות מראש.
הפעל ניתוח GPU משורת הפקודה:
- פתח את ה-sampהספרייה:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - בספרייה זו, פתח פרויקט Visual Studio* file בשם matrix_multiply.sln
- הערך multiply.cpp file מכיל מספר גרסאות של כפל מטריצה. בחר גרסה על ידי עריכת שורת #define MULTIPLY המתאימה ב- multiply.hpp
- בנה את כל הפרויקט עם תצורת שחרור.
זה יוצר קובץ הפעלה בשם matrix_multiply.exe. - הכן את המערכת להפעלת ניתוח GPU. ראה הגדרת מערכת לניתוח GPU.
- הגדר את VTune Profiler משתני סביבה על ידי הפעלת האצווה file: ייצוא \env\vars.bat
- הפעל את פקודת הניתוח:
vtune.exe -collect gpu-offload — matrix_multiply.exe
VTune Profiler אוסף נתונים ומציג תוצאות ניתוח ב-GPU Compute/Media Hotspots viewנְקוּדָה. בחלון הסיכום, ראה נתונים סטטיסטיים על שימוש במשאבי מעבד ו-GPU כדי להבין אם היישום שלך קשור ל-GPU. עבור לחלון הגרפיקה כדי לראות מדדי CPU ו-GPU בסיסיים המייצגים ביצוע קוד לאורך זמן.
התחל עם Intel® VTune™ Profiler עבור לינוקס* OS
לפני שאתה מתחיל
- התקן את Intel® VTune™ Profiler במערכת Linux* שלך.
- בנה את האפליקציה שלך עם מידע על סמלים ובמצב שחרור עם כל האופטימיזציות מופעלות. למידע מפורט על הגדרות מהדר, עיין ב-VTune Profiler מדריך למשתמש מקוון.
אתה יכול גם להשתמש במטריצה sampהאפליקציה זמינה ב \sampלה\מטריקס. אתה יכול לראות את סampהתוצאות \sample (מטריקס). - הגדר את משתני הסביבה: מקור /setvars.sh
כברירת מחדל, ה הוא:- $HOME/intel/oneapi/ כאשר מותקן עם הרשאות משתמש;
- /opt/intel/oneapi/ כאשר מותקן עם הרשאות שורש.
שלב 1: הפעל את VTune Profiler
הפעל את VTune Profiler דרך אחת מהדרכים הבאות:
מקור / הפעל את VTune Profiler
עצמאי/IDE (GUI)
- הפעל את הפקודה vtunegui. כדי להפעיל את VTune Profiler מתוך Intel System Studio IDE, בחר כלים > VTune Profiler > הפעל את VTune Profileר. זה מגדיר את כל משתני הסביבה המתאימים ומשיק ממשק עצמאי של המוצר.
- כאשר ה-GUI נפתח, לחץ על NEW PROJECT במסך הפתיחה.
- בתיבת הדו-שיח יצירת פרויקט, ציין את שם הפרויקט והמיקום.
- לחץ על צור פרויקט.
עצמאי (שורת פקודה)
- הפעל את פקודת vtune.
שלב 2: הגדר והפעל ניתוח
לאחר יצירת פרויקט חדש, חלון הגדר ניתוח נפתח עם ערכי ברירת המחדל הבאים:
- במקטע הפעל יישום, דפדף אל מיקום היישום שלך.
- לחץ על התחל כדי להפעיל תמונת מצב של ביצועים באפליקציה שלך. ניתוח זה מציג סיכום כלליview של בעיות המשפיעות על ביצועי היישום שלך במערכת היעד.
שלב 3: View וניתוח נתוני ביצועים
לאחר סיום איסוף הנתונים, VTune Profiler מציג תוצאות ניתוח בחלון הסיכום. הנה, אתה רואה הופעה הסתיימהview של בקשתך.
הסוףview בדרך כלל כולל מספר מדדים יחד עם התיאורים שלהם.
- A הרחב כל מדד לקבלת מידע מפורט על גורמים תורמים.
- B מדד מסומן מציין ערך מחוץ לטווח הפעולה המקובל/נורמלי. השתמש בטיפים לכלים כדי להבין כיצד לשפר מדד מסומן.
- C ראה הנחיות לגבי ניתוחים אחרים שכדאי לך לשקול להפעיל בהמשך. עץ הניתוח מדגיש המלצות אלו.
השלבים הבאים
Snapshot של ביצועים היא נקודת התחלה טובה לקבל הערכה כוללת של ביצועי האפליקציה עם VTune Profileר. לאחר מכן, בדוק אם האלגוריתם שלך דורש כוונון.
- עקוב אחר הדרכה כדי לנתח צווארי בקבוק נפוצים בביצועים.
- לאחר שהאלגוריתם שלך מכוון היטב, הפעל שוב תצלום ביצועים כדי לכייל תוצאות ולזהות שיפורים פוטנציאליים בביצועים בתחומים אחרים.
ראה גם
חקר מיקרו-ארכיטקטורה
VTune Profiler סיור עזרה
Example: פרוfile יישום OpenMP ב-Linux*
השתמש ב-Intel VTune Profiler במחשב לינוקס ל-profile כְּמוֹample iso3dfd_omp_offload אפליקציית OpenMP הורחקה ל-Intel GPU. למד כיצד להפעיל ניתוח GPU ולבחון תוצאות.
דרישות מוקדמות
- ודא שהמערכת שלך מפעילה Linux* OS Kernel 4.14 או גרסה חדשה יותר.
- השתמש באחת מהגרסאות הבאות של Intel Processor Graphics:
- דור 8
- דור 9
- דור 11
- המערכת שלך אמורה לפעול על אחד ממעבדי אינטל הבאים:
- דור 7 מעבדי Intel® Core™ i7 (שם קוד Kaby Lake)
- דור 8 מעבדי Intel® Core™ i7 (שם קוד Coffee Lake)
- דור 10 של מעבדי Intel® Core™ i7 (שם קוד Ice Lake)
- עבור ממשק המשתמש של לינוקס, השתמש ב:
- GTK+ גרסה 2.10 ומעלה (מומלצות גרסאות 2.18 ואילך)
- Pango גרסה 1.14 ומעלה
- X.Org גרסה 1.0 ומעלה (מומלצות גרסאות 1.7 ואילך)
- התקן את Intel VTune Profiler מאחד המקורות הבאים:
- הורדת מוצר עצמאי
- אינטל® oneAPI Base Toolkit
- ערכת הכלים של Intel® System Bring-up
- הורד את Intel® oneAPI HPC Toolkit המכילה את Intel® oneAPI DPC++/C++ מהדר (icx/icpx) שאתה צריך למקצועןfile יישומי OpenMP.
- הגדר משתני סביבה. בצע את הסקריפט vars.sh.
- הגדר את המערכת שלך לניתוח GPU.
בנה והידור של אפליקציית OpenMP Offload
- הורד את s iso3dfd_omp_offload OpenMP Offloadample.
- פתוח ל-sampהמדריך.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - הידור את אפליקציית OpenMP Offload.
mkdir build;
cmake -DVERIFY_RESULTS=0 ..
לעשות -j
זה יוצר קובץ הפעלה src/iso3dfd.
כדי למחוק את התוכנית, הקלד:
לעשות נקי
זה מסיר את קובץ ההפעלה והאובייקט files שיצרת עם הפקודה make.
הפעל ניתוח GPU ביישום OpenMP Offload
כעת אתה מוכן להפעיל את ניתוח ה-GPU Offload ביישום OpenMP שהידור.
- פתח את VTune Profiler ולחץ על פרויקט חדש כדי ליצור פרויקט.
- בדף הפתיחה, לחץ על הגדר ניתוח כדי להגדיר את הניתוח שלך.
- בחר בהגדרות אלה עבור הניתוח שלך.
- בחלונית WHERE, בחר מארח מקומי.
- בחלונית WHAT, בחר הפעל יישום וציין את הקובץ הבינארי iso3dfd_omp_offload כיישום ל-profile.
- בחלונית HOW, בחר את סוג הניתוח של GPU Offload מקבוצת Accelerators בעץ הניתוח.
- לחץ על כפתור התחל כדי להפעיל את הניתוח.
VTune Profiler אוסף נתונים ומציג תוצאות ניתוח ב-GPU Offload viewנְקוּדָה.
- בחלון הסיכום, ראה נתונים סטטיסטיים על שימוש במשאבי מעבד ו-GPU. השתמש בנתונים אלה כדי לקבוע אם היישום שלך הוא:
- קשור ל-GPU
- קשור למעבד
- ניצול משאבי המחשוב של המערכת שלך בצורה לא יעילה
- השתמש במידע בחלון הפלטפורמה כדי לראות מדדי CPU ו-GPU בסיסיים.
- חקור משימות מחשוב ספציפיות בחלון הגרפיקה.
לניתוח מעמיק יותר, ראה מתכון קשור ב-VTune Profiler ספר בישול לניתוח ביצועים. אתה יכול גם להמשיך את הפרופיל שלך עם ניתוח GPU Compute/Media Hotspots.
Example: פרוfile יישום SYCL* בלינוקס*
השתמש ב-VTune Profiler עם asample matrix_multiply יישום SYCL כדי להכיר במהירות את המוצר והסטטיסטיקה שנאספו עבור יישומים הקשורים ל-GPU.
דרישות מוקדמות
- התקן את VTune Profiler ו-Intel® oneAPI DPC++/C++ מהדר מ-Intel® oneAPI Base Toolkit או Intel® System Bring-up Toolkit.
- הגדר משתני סביבה על ידי הפעלת הסקריפט vars.sh.
- הגדר את המערכת שלך לניתוח GPU.
בנה את אפליקציית המטריקס
הורד את קוד matrix_multiply_vtune sampחבילה עבור ערכות כלים של Intel oneAPI. זה מכיל את ה-sample שבו אתה יכול להשתמש כדי לבנות ולפרוfile יישום SYCL.
למקצועןfile יישום SYCL, הקפד להרכיב את הקוד באמצעות האפשרויות -gline-tables-only ו-fdebug-info-for-profiling Intel oneAPI DPC++ Compiler.
כדי להרכיב את ס' זהampביישום, בצע את הפעולות הבאות:
- לך ל-sampהמדריך.
cd <sample_dir/VtuneProfiler/matrix_multiply> - הערך multiply.cpp file בתיקיית src מכילה מספר גרסאות של כפל מטריצה. בחר גרסה על ידי עריכת שורת #define MULTIPLY המתאימה ב- multiply.h.
- בנה את האפליקציה באמצעות ה-Make הקייםfile:
cmeke .
לַעֲשׂוֹת
זה אמור ליצור קובץ הפעלה matrix.icpx -fsycl.
כדי למחוק את התוכנית, הקלד:
לעשות נקי
זה מסיר את קובץ ההפעלה והאובייקט files שנוצרו על ידי הפקודה make.
הפעל ניתוח GPU
הפעל ניתוח GPU על ה-Matrix sample.
- הפעל את VTune Profiler עם הפקודה vtune-gui.
- לחץ על פרויקט חדש מדף הפתיחה.
- ציין שם ומיקום עבור ה-s שלךampהפרויקט ולחץ על צור פרויקט.
- בחלונית WHAT, דפדף אל ה-matrix.icpx-fsycl file.
- בחלונית HOW, לחץ על
כפתור עיון ובחר ניתוח GPU Compute/Media Hotspots מקבוצת Accelerators בעץ הניתוח.
- לחץ על כפתור התחל בתחתית כדי להפעיל את הניתוח עם האפשרויות שנבחרו מראש.
הפעל ניתוח GPU משורת הפקודה:
- הכן את המערכת להפעלת ניתוח GPU. ראה הגדרת מערכת לניתוח GPU.
- הגדר משתני סביבה עבור כלי תוכנה של אינטל:
מקור $ONEAPI_ROOT/setvars.sh - הפעל את ניתוח GPU Compute/Media Hotspots:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
כדי לראות את דוח הסיכום, הקלד:
vtune -report summary -r ./result_gpu-hotspots
VTune Profiler אוסף נתונים ומציג תוצאות ניתוח ב-GPU Compute/Media Hotspots viewנְקוּדָה. בחלון הסיכום, ראה נתונים סטטיסטיים על שימוש במשאבי מעבד ו-GPU כדי להבין אם היישום שלך קשור ל-GPU. עבור לחלון הגרפיקה כדי לראות מדדי CPU ו-GPU בסיסיים המייצגים ביצוע קוד לאורך זמן.
התחל עם Intel® VTune™ Profiler עבור macOS*
השתמש ב-VTune Profiler במערכת macOS לביצוע ניתוח יעדים מרחוק במערכת שאינה macOS (Linux* או Android* בלבד) .
אתה לא יכול להשתמש ב-VTune Profiler בסביבת macOS למטרות אלה:
- מִקצוֹעָןfile מערכת macOS שבה הוא מותקן.
- אסוף נתונים במערכת macOS מרוחקת.
כדי לנתח את הביצועים של יעד לינוקס* או אנדרואיד* מרוחק מהמארח של macOS, בצע אחד מהשלבים הבאים:
- הפעל VTune Profileניתוח r במערכת macOS עם מערכת מרוחקת שצוינה כיעד. כאשר הניתוח מתחיל, VTune Profiler מתחבר למערכת המרוחקת כדי לאסוף נתונים, ואז מחזיר את התוצאות למארח macOS עבור viewing.
- הפעל ניתוח על מערכת היעד באופן מקומי והעתק את התוצאות למערכת macOS עבור viewing ב-VTune Profiler.
השלבים במסמך זה מניחים מערכת יעד מרוחקת של לינוקס ואוספים נתוני ביצועים באמצעות גישת SSH מ-VTune Profiler במערכת מארח macOS.
לפני שאתה מתחיל
- התקן את Intel® VTune™ Profiler במערכת macOS* שלך.
- בנה את יישום הלינוקס שלך עם מידע על סמלים ובמצב שחרור עם כל האופטימיזציות מופעלות. למידע מפורט, עיין בהגדרות המהדר ב-VTune Profileעזרה.
- הגדר גישת SSH ממערכת ה-macOS המארחת למערכת Linux היעד כדי לעבוד במצב ללא סיסמה.
שלב 1: הפעל את VTune Profiler
- הפעל את VTune Profiler עם הפקודה vtune-gui.
כברירת מחדל, ה הוא /opt/intel/oneapi/. - כאשר ה-GUI נפתח, לחץ על NEW PROJECT במסך הפתיחה.
- בתיבת הדו-שיח יצירת פרויקט, ציין את שם הפרויקט והמיקום.
- לחץ על צור פרויקט.
שלב 2: הגדר והפעל ניתוח
לאחר יצירת פרויקט חדש, החלון הגדרת ניתוח נפתח עם סוג ניתוח תמונת מצב של ביצועים.
ניתוח זה מציג סיוםview של בעיות המשפיעות על ביצועי האפליקציה שלך במערכת היעד.
- בחלונית WHERE, בחר Remote Linux (SSH) וציין את מערכת היעד של Linux באמצעות username@hostname[:port].
VTune Profiler מתחבר למערכת לינוקס ומתקין את חבילת היעד. - בחלונית WHAT, ספק את הנתיב ליישום שלך במערכת Linux היעד.
- לחץ על כפתור התחל כדי להפעיל ביצועים Snapshot באפליקציה.
שלב 3: View וניתוח נתוני ביצועים
לאחר סיום איסוף הנתונים, VTune Profiler מציג תוצאות ניתוח במערכת macOS. התחל את הניתוח שלך בחלון הסיכום. הנה, אתה רואה הופעה הסתיימהview של בקשתך.
הסוףview בדרך כלל כולל מספר מדדים יחד עם התיאורים שלהם.
- A הרחב כל מדד לקבלת מידע מפורט על גורמים תורמים.
- B מדד מסומן מציין ערך מחוץ לטווח הפעולה המקובל/נורמלי. השתמש בטיפים לכלים כדי להבין כיצד לשפר מדד מסומן.
- C ראה הנחיות לגבי ניתוחים אחרים שכדאי לך לשקול להפעיל בהמשך. עץ הניתוח מדגיש המלצות אלו.
השלבים הבאים
Snapshot של ביצועים היא נקודת התחלה טובה לקבל הערכה כוללת של ביצועי האפליקציה עם VTune Profiler.
לאחר מכן, בדוק אם האלגוריתם שלך דורש כוונון.
- הפעל ניתוח נקודות חמות באפליקציה שלך.
- עקוב אחר הדרכה של נקודות חמות. למד טכניקות כדי להפיק את המרב מניתוח הנקודות החמות שלך.
- לאחר שהאלגוריתם שלך מכוון היטב, הפעל שוב תצלום ביצועים כדי לכייל תוצאות ולזהות שיפורים פוטנציאליים בביצועים בתחומים אחרים.
ראה גם
חקר מיקרו-ארכיטקטורה
VTune Profiler סיור עזרה
למידע נוסף
מסמך / תיאור
- מדריך למשתמש
המדריך למשתמש הוא התיעוד העיקרי עבור VTune Profiler.
פֶּתֶק
אתה יכול גם להוריד גרסה לא מקוונת של VTune Profiler תיעוד. - הדרכה מקוונת
אתר ההדרכה המקוון הוא משאב מצוין ללמוד את היסודות של VTune Profileעם מדריכי תחילת העבודה, סרטונים, מדריכים, webאינארים ומאמרים טכניים. - ספר בישול
ספר בישול לניתוח ביצועים המכיל מתכונים לזיהוי ופתרון בעיות ביצועים פופולריות באמצעות סוגי ניתוח ב-VTune Profiler. - מדריך התקנה עבור Windows | לינוקס | מארחי macOS
מדריך ההתקנה מכיל הוראות התקנה בסיסיות עבור VTune Profiler והוראות תצורה לאחר ההתקנה עבור מנהלי ההתקן והאספנים השונים. - הדרכות
VTune Profileמדריכי r מדריכים משתמש חדש דרך תכונות בסיסיות עם s קצרampהיישום. - הערות פרסום
מצא מידע על הגרסה העדכנית ביותר של VTune Profiler, כולל תיאור מקיף של תכונות חדשות, דרישות מערכת ובעיות טכניות שנפתרו.
עבור הגירסאות העצמאיות וערכת הכלים של VTune Profiler, הבן את דרישות המערכת הנוכחיות.
הודעות וכתבי ויתור
טכנולוגיות אינטל עשויות לדרוש הפעלת חומרה, תוכנה או שירות מופעלות.
שום מוצר או רכיב לא יכולים להיות מאובטחים לחלוטין.
העלויות והתוצאות שלך עשויות להשתנות.
© Intel Corporation. Intel, הלוגו של Intel וסימני Intel אחרים הם סימנים מסחריים של Intel Corporation או של חברות הבת שלה. ניתן לתבוע שמות ומותגים אחרים כרכושם של אחרים.
Intel, הלוגו של Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune ו-Xeon הם סימנים מסחריים של Intel Corporation בארה"ב ו/או במדינות אחרות.
*שמות ומותגים אחרים עשויים להיטען כרכושם של אחרים.
Microsoft, Windows והלוגו של Windows הם סימנים מסחריים, או סימנים מסחריים רשומים של Microsoft Corporation בארצות הברית ו/או במדינות אחרות.
Java הוא סימן מסחרי רשום של Oracle ו/או החברות הקשורות לה.
OpenCL והלוגו של OpenCL הם סימנים מסחריים של Apple Inc. בשימוש בהרשאה של Khronos.
טכנולוגיות אינטל עשויות לדרוש הפעלת חומרה, תוכנה או שירות מופעלות.
שום מוצר או רכיב לא יכולים להיות מאובטחים לחלוטין.
העלויות והתוצאות שלך עשויות להשתנות.
© Intel Corporation. Intel, הלוגו של Intel וסימני Intel אחרים הם סימנים מסחריים של Intel Corporation או של חברות הבת שלה. ניתן לתבוע שמות ומותגים אחרים כרכושם של אחרים.
Intel, הלוגו של Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune ו-Xeon הם סימנים מסחריים של Intel Corporation בארה"ב ו/או במדינות אחרות.
*שמות ומותגים אחרים עשויים להיטען כרכושם של אחרים.
Microsoft, Windows והלוגו של Windows הם סימנים מסחריים, או סימנים מסחריים רשומים של Microsoft Corporation בארצות הברית ו/או במדינות אחרות.
Java הוא סימן מסחרי רשום של Oracle ו/או החברות הקשורות לה.
OpenCL והלוגו של OpenCL הם סימנים מסחריים של Apple Inc. בשימוש בהרשאה של Khronos.
מסמכים / משאבים
![]() |
intel התחל עם VTune Profiler [pdfמדריך למשתמש התחל עם VTune Profiler, התחל, עם VTune Profiler, VTune Profiler |